潮人地東莞seo博客小編下面跟大家分享關于seo技術:搜索引擎的基本原理,搜索引擎優化的seo原理等問題,希望seo專員在做seo優化的過程中有所幫助,內容僅供參考。
前面2期介紹SEO的時候就講到了關于SEO的基本定義,這里再次簡單回顧下吧!
SEOseo關鍵詞排名優化經驗(搜索引擎優化)
SEO(搜索引擎優化)通常定義為:在了解搜索引擎的工作原理基礎上,對網站進行內外調整優化,提高網站關鍵詞排名,獲得更多流量,達成網站的營銷目的。通過這一定義,我們可以看到,做SEO首先需要知道我們搜索引擎的工作原理是怎樣的,只有搞清楚它的原理,我們才可以本著這一原理進行做后期優化工作。這就是今天這一期重點和大家分享的話題:搜索引擎的工作原理!
seo博客相關推薦閱讀:seo優化方法之:網站seo診斷具體操作步驟

由于搜索引擎這一塊的專業知識涉及很廣,可以單獨作為一門學科來系統化學習的,所以建議新手剛開始學SEO的時候可以先多學習下搜索引擎這一塊知識哦,也可以自己買本搜索引擎原理的書咸寧短視頻seo排名前十籍看看也行,只有理解了搜索引擎的工作原理后,我們對后期優化工作才有了明確的方向!
搜索引擎的工作原理
首先搜索引擎的工作原理大體上分為三個階段:
爬行與抓取:搜索引擎蜘蛛(Spider)通過跟蹤鏈接發現和訪問頁面,然后讀取HTML代碼,存入數據庫中;
預處理:搜索引擎蜘蛛抓取來的頁面數據進行文字提取,中文分詞,索引(正向索引),倒排索引等,以備后面排名和展現;
排名:通過一定的搜索相關性計算,按照一定格式生成搜索結果頁面。
搜索引擎的工作原理
針對這三個階段詳細說下搜索引擎的工作原理:
爬行與抓取
1、跟蹤鏈接:一般是深度優先和廣度優先兩種跟蹤方式,如圖所示:
深度優先跟蹤鏈接
廣度優先跟蹤鏈接
理論上,無論是哪種跟蹤方式,只要給蜘蛛足夠多時間,都能爬完整個互聯網上的鏈接,但實際上,蜘蛛的寬帶資源和時間都是非常有限的,不可能爬完所有的鏈接,最多只能爬行和收錄一小部分,所以我們做seo工作就需要主動吸引蜘蛛來爬行和收錄我們的頁面。
2、吸引蜘蛛:哪些頁面可以吸引到蜘蛛呢?符合以下幾點就足以。
第一,網站和頁面權重。權重越高,蜘蛛就越喜歡,尤其是老網站,質量高的網站;
第二,頁面更新頻率。蜘蛛喜歡新鮮事物,所以網站這一塊也需要經常多跟新;
第三,導入鏈接。無論是外鏈還是內鏈,只要多給蜘蛛爬行頁面的路徑,頁面收錄率和排名會更高;
第四,與首頁點擊距離。一般網站首頁權重最高,所以頁面里首頁的點擊距離越近,爬行和收錄機會更高;
第五,URL結構。首先符合靜態化最好,其次URL越短,層次越少,蜘蛛爬行的機會就更大些,頁面收錄機會也就更大。
預處理
這里所說的預處理包括:提取文字,中文分詞,去停止詞,消除噪聲,去重,正向索引,倒排索引,鏈接關系計算,特殊文件處理以及質量判斷等等,seo排名依舊紋絲不動由于內容過多,這里不多做詳細說明,主要講下正向索引和倒排索引這兩塊核心內容,有些書籍把預處理這一階段定義為索引,其實也是說明了正向索引和倒排索引的重點,首先看下面示意圖:
正向索引結構
倒排索引結構
上圖中文件就是指頁面了,關鍵詞就是與用戶所搜索的詞相匹配的關鍵詞,這里的關鍵詞是搜索引擎內部存儲的關鍵詞,也是基于過去用戶所搜索過的詞,進行一次收集和整理所得出來的。通過對比兩種索引結構就可以看出,倒排索引更能符合搜索引擎的工作要求,當用戶搜索某一關鍵詞時候,搜索引擎系統內部便能一次性直接導出與關鍵詞相匹配的頁面,然后再通過鏈接相關性計算,特殊文件處理,頁面質量判斷得出哪些頁面可以用作搜索結果頁面中,最后以排名的方式顯示出來。
排名
進行預處理過后,尤其是倒排索引處理之后,然后對用戶搜索詞處理以及相應的文件匹配,得出初始文件的子集,這里的初始文件子集并不能直接用于排名,還要進行相關性計算,排名過濾和調整,最終顯示出頁面的排名結果。這里的相關性計算,主要是根據關鍵詞常用程度、詞頻和密度、關鍵詞位置及形式、關鍵詞距離、鏈接分析及頁面權重等來得出頁面的內容是否和用戶搜索的詞高度相關。
好了,關于搜索引擎的工作原理大致上就說這么多了,其實還有很多詳細地方沒有具體說到,由于涉及過廣,大家可以多了解下搜索引擎這一塊的內容,可以借助相關書籍來系統學習這一塊的內容哦!本期的SEO分享就到這里了,大家有任何問題和想法都可以在評論下方留言咨詢哦!
以上是潮人地東莞seo博客跟大家分享關于seo技術:搜索引擎的基本原理,搜索引擎優化的seo原理等問題,希望能對大家有所幫助,若有不足之處,請諒解,我們大家可以一起討論關于網站seo優化排名的技巧,一起學習,以上內容僅供參考。