歡迎您來到潮人地東莞seo博客,本站專業免費分享多元化的seo網站優化技術干貨以及解答seo各種常見問題的博客網站

熱門關鍵詞: seo優化 seo推廣 seo技術 seo博客 seo網站推廣怎么做 seo怎么做 新手做seo怎么做
當前位置:seo博客首頁 > seo網站優化 >

網站優化seo:SEO搜索引擎的工作原理,搜索引擎工作原理的四個步驟是怎樣

發布時間:2023-08-07 18:08:01 文章出處:潮人地東莞seo博客 作者:東莞seo博客 閱讀數量:

潮人地東莞seo博客小編下面跟大家分享關于網站優化seo:SEO搜索引擎的工作原理,搜索引擎工作原理的四個步驟是怎樣等問題,希望seo專員在做seo優化的過程中有所幫助,內容僅供參考。

?

2.3搜索引擎的工作原理

搜索引擎優化的主要任務之一是提高網站的搜索引擎友好性。因此,搜索引擎優化的每個環節都將與搜索引擎工作流有著必然的聯系。事實上,搜索引擎優化的研究是對搜索引擎工作流的逆向推理。因此,學習搜索引擎優化應該從了解搜索引擎的工作原理開始。

搜索引擎的主要工作包括:頁面捕獲、頁面分析、頁面排序和關鍵字查詢。

頁面獲?。核侵杆阉饕嫱ㄟ^蜘蛛程序在互聯網上抓取和存儲頁面的過程,為搜索引擎開展各種工作提供數據支持。

seo博客相關推薦閱讀:seo推廣入門:網站SEO關鍵詞優化排名技巧有那幾種?

頁面分析:它主要是指對檢索到的網頁進行信息提取處理,包括網頁主體信息的提取和主體信息的分割,為后續建立關鍵字索引和關鍵字倒排索引提供基礎數據。

頁面排序:搜索引擎結合頁面的內部和外部因素來計算頁面與某個關鍵字之間的相關性程度,從而獲得與該關鍵字相關的頁面排名列表。

關鍵字查詢:搜索引擎從用戶接收查詢請求,剪切并匹配查詢信息,然后將相應的頁面排序列表返回給用戶。

網站優化seo:SEO搜索引擎的工作原理,搜索引擎工作原理的四個步驟是怎樣

接下來,本章將介紹搜索引擎的每個主要工作的過程、原理和功能,以及在優化網站時如何處理它。

2.3.1搜索引擎捕獲策略

事實上,搜索引擎對網頁的檢索是互聯網上的數據收集;1這是搜索引擎最基本的工作。搜索引擎的數據收集能力直接決定了搜索引擎能夠提供的信息量和互聯網的覆蓋范圍,從而影響搜索引擎查詢結果的質量。因此,搜索引擎總是試圖提高其數據收集能力。

搜索引擎使用數據收集程序來捕獲互聯網上的數據。我們稱這個數據收集程序為蜘蛛程序或機器人程序。

本節將首先介紹搜索引擎捕獲頁面的過程和方法,然后介紹搜索引擎對捕獲頁面的存儲和維護方法。

1;頁面獲取過程

在互聯網中,URL是每個頁面的入口地址,搜索引擎蜘蛛程序通過URL捕獲頁面。搜索引擎蜘蛛程序從原始URL列表開始,通過URL抓取并存儲原始頁面;同時,從原始頁面中提取URL資源并將其添加到URL列表中。通過這種方式,您可以從Internet獲得足夠的頁面,如圖2-1所示。

圖2-1搜索引擎捕獲頁面的簡單過程

URL是頁面的入口,而域名是網站的入口。搜索引擎蜘蛛程序通過域名進入網站,從而開始爬行網站頁面。換句話說,搜索引擎在互聯網上抓取頁面的首要任務是創建足夠大的原始域名列表,然后通過域名進入相應的網站,抓取該網站中的頁面。

對于網站,如果你想被包括在搜索引擎中,第一個條件是加入搜索引擎的域名列表。以下是加入搜索引擎域名列表的兩種常見方法。

首先,使用搜索引擎提供的網站登錄門戶向搜索引擎提交網站的域名。例如,Google的網站登錄地址是;http://;www.google。com/addurl/;2搜索引擎只會定期更新提交的域名列表。因此,這種方法相對被動,從域名提交到網站收錄需要很長時間。以下是中國主流搜索引擎的網站提交門戶。

在實踐中,我們只需要提交網站的主頁地址或域名,搜索引擎就會按照主頁中的鏈接抓取其他頁面。

百度:http:// ;www.baidu。com/搜索/url_;提交htm 

360: http://info.so.360.cn/site_  ; 提交html中

搜狗:http://nbsp;www.sogou網站。com/反饋/;url反饋。php

谷歌:http://nbsp;www.google。com/addurl/;(您需要注冊才能使網站管理員工具提交)。

如果將整個網站視為一棵樹,則主頁是根,每個頁面都是葉。寬度優先;這是一種水平頁面獲取方法,它從樹的較淺層開始,在獲取同一層上的所有頁面后移動到下一層。因此,在優化網站時,我們應該在淺頁面上顯示網站中相對重要的信息(例如,在主頁上推薦一些熱門產品或內容)。因此,通過廣度優先抓取,搜索引擎可以首先抓取網站中相對重要的頁面。

讓我們來看一下廣度優先捕獲過程。首先,搜索引擎從網站的主頁開始,抓取主頁上所有鏈接指向的頁面,形成頁面集合(a),并解析集合中所有頁面的鏈接(a);然后按照這些鏈接抓取下一層頁面,形成頁面集合(B)。通過這種方式,從淺頁面遞歸解析鏈接以對深頁面進行爬網,直到滿足特定的設置條件,爬網過程才會停止,如圖2-2所示。

圖2-2寬度首次捕獲過程

深度優先

與廣度優先相反,深度優先;這是一種垂直頁面獲取方法。首先,它跟蹤淺頁面中的鏈接以逐步爬行深頁面,然后返回淺頁面以繼續爬行到深頁面,直到爬行到最深頁面。通過使用深度優先抓取,搜索引擎可以抓取網站中更多晦澀難懂的頁面,從而滿足更多用戶的需求。

讓我們來看一下深度優先捕獲過程。首先,搜索引擎會抓取網站的主頁并提取主頁中的鏈接;然后沿著其中一個鏈接抓取頁面1-1,并提取鏈接;接下來,按照第1-1頁至第2-1頁中的鏈接a-1,并提取鏈接;然后按照第2-1頁中的鏈接B-1繼續抓取更深的頁面。這是遞歸執行的,直到網站的最深頁面被爬網或滿足設置的條件,它將返回主頁并繼續爬網,如圖2-3所示。

圖2-3深度優先捕獲過程

大型站點的優先級

因為大型網站比小型網站更可能提供更多、更有價值的內容,如果搜索引擎優先捕獲大型網站中的頁面,它們可以在更短的時間內為用戶提供更有價值的信息。首選大型站點;,顧名思義,抓取互聯網上大型網站的頁面是一項優先任務。它是搜索引擎中的一種信息檢索策略。

如何識別所謂的大型網站?首先,人工梳理前期大站的種子資源,通過大站尋找其他大站;二是系統分析索引網站,以識別那些內容豐富、規模大、信息更新頻繁的網站。

大站識別完成后,搜索引擎將優先考慮URL資源列表中的大站頁面。這也是為什么大型網站往往比小型網站更及時地捕獲內容的原因之一。

高優先級

簡而言之,權重是對搜索引擎對網頁重要性的評估。所謂的重要性歸根結底是網站或網頁的信息價值。

高優先級;這是一種網頁獲取策略,優先考慮URL資源列表中的高權重頁面。網頁的權重(例如Google PageRank值)通常由許多因素決定,例如網頁上外部鏈接的數量和質量。如果下載了URL,請重新計算所有下載的URL資源的權重值。這是非常低效的,顯然是不現實的。因此,搜索引擎傾向于在下載幾個URL資源之后計算下載的URL的權重(即不完整的權重計算),以確定與這些URL資源相對應的頁面的權重值,從而優先考慮權重值較高的頁面。

由于權重計算基于部分數據,因此可能與實際權重不同(即失真)。因此,這種高權重優先獲取策略也可以優先考慮輔助頁面。

搶奪

暗網絡(也稱為深度網絡、不可見網絡、隱藏網絡)是指存儲在網絡數據庫中,無法通過超鏈接訪問,但需要通過動態網頁技術或手動啟動的查詢訪問的資源集合。它不屬于標準搜索引擎可以索引的信息。

1.&

描述為了提高頁面抓取的效率和質量,搜索引擎將結合多種策略來抓取頁面。例如,首先使用廣度優先方法將捕獲范圍擴展到盡可能寬的范圍,以獲得盡可能多的重要頁面;然后使用深度優先方法捕獲更多隱藏頁面;最后,通過結合暗網絡捕獲和用戶提交的方法來捕獲丟失的頁面。

4;如何避免重復獲取

在互聯網上,信息復制是不可避免的。然而,搜索引擎如何識別重復信息seo優化排名招商代理?如何判斷哪些頁面是原創的,哪些頁面是復制的?哪些重復信息是有價值的,哪些可以丟棄?本節將提供這些問題的答案。

網站中的重復信息主要包括轉載內容和鏡像內容。搜索引擎必須能夠在分析頁面時識別重復信息。因為大量重復信息不僅占用了服務器硬盤上的巨大空間,還增加了用戶查找信息的時間,降低了用戶體驗。然而,這并不意味著所有重復信息都毫無價值。搜索引擎認為,轉載內容不如原創內容重要,賦予原創內容頁面更多的權重,而鏡像內容幾乎被忽略。

重新打印頁面

重印頁;它是指原始頁面的內容;3、;相同或相似的頁面。然而,搜索引擎如何識別重印頁面?首先,它將網頁內容劃分為N個 區域并進行比較(如果有)i> 如果區域(M是搜索引擎指定的閾值)相同或相似,則這些頁面被視為重新打印的頁面。

如圖2-8所示,第1頁和第2頁是不同網站上的兩個頁面。其中,框中的A和B是兩個不同頁面上的正文內容。為了識別這兩個頁面是否是彼此的轉載,搜索引擎首先將兩個頁面的正文內容分成四個區域進行比較。假設四個區域中的三個相同或相似,則這兩頁被認為是彼此重印的。

圖2-8頁面文本內容對比

在確定了頁面的相互重印關系之后,搜索引擎然后基于頁面的最后修改時間(搜索引擎在抓取頁面時存儲的附加信息,參見稍后的“頁面存儲”內容)、頁面權重等因素來判斷原始頁面和重印頁面。

鏡像頁面

具有相同內容的頁面是相互的;鏡像頁;。為了確定頁面是否為鏡像頁面,搜索引擎首先將這些頁面劃分為N個 要比較的地區,如果這N 如果這些區域的內容相同,則這些頁面被視為彼此的鏡像頁面。然后,將多個因素(例如頁面權重值、頁面最后修改時間等)集成在一起,以識別哪個是源頁面,哪個是鏡像頁面。

如圖2-9所示,第1頁和第2頁是不同網站sem付費排名和seo各自優勢上的兩個頁面。將兩頁分成三個區域(A-1、A-2、A-3和B-1、B-2、B-3)進行比較。如果三個區域的內容相同,則這兩個頁面被視為鏡像頁面。

圖2-9頁面比較

鏡像網站

狹義;鏡像站點;它指的是內容相同的網站。形成鏡像網站主要有兩種情況:第一種是多個域名或IP指向同一服務器的同一物理目錄;另一種是將整個網站內容復制到使用不同域名或IP地址的服務器。

為了確定網站是否是彼此的鏡像網站,搜索引擎首先確定這些網站的主頁和直接鏈接到主頁的頁面是否是彼此鏡像的頁面。如果是,它們就是鏡像網站。然后,綜合多個因素(如網站權重值、建立時間等)來確定哪個是源網站,哪個是鏡像網站。通過這種方式,網頁將來將在源網站中被抓取,這就是為什么搜索引擎只抓取很少的網頁,甚至不抓取鏡像網站的原因。

3搜索引擎通過算法消除頁面中的輔助信息(如導航欄、圖片等)后獲得頁面的正文內容。

5;網頁更新策略

因為搜索引擎不可能一次抓取網站中的所有頁面

事實上,搜索引擎對網站中頁面的維護也是以多種方式進行的,這相當于間接為每個頁面選擇了最合適的維護方法。這樣,我們不僅可以減輕搜索引擎的負擔,還可以為用戶提供及時的信息。

例如,一個網站中有許多不同的頁面,包括主頁、論壇頁面、內容頁面等。對于經常更新的頁面(如主頁),可以使用增量獲取來監視它們,以便及時更新網站中相對重要的頁面;對于實時性能非常高的論壇頁面,我們可以使用分類和定位的爬行方法;為了防止丟失網站中的某些頁面,還需要定期獲取。

歷史更新頻率策略

歷史更新頻率策略;基于這樣一個想法:一個網頁在過去經常更新,那么它在未來可能會經常更新。例如,對于網站的主頁,可以通過其監控來分析其內容更新規則,搜索引擎可以相應地調整其捕獲頻率和時間點,以便及時獲取頁面中的最新內容。

用戶體驗策略

所謂用戶體驗策略,是指為提高搜索引擎的用戶體驗而制定的有針對性的網站更新策略。衡量搜索引擎用戶體驗的指標很多,頁面更新的及時性是重要因素之一。

對于搜索引擎中的關鍵字搜索結果,用戶通常只單擊前30頁。因此,只要及時更新前30個頁面,就可以節省搜索引擎資源,增加重要頁面的更新頻率,也可以滿足大多數用戶的信息需求。

80/20法則是由著名的意大利經濟學家維爾弗雷德·帕累托發現的,他的核心思想是20%的活動可以生產滿足80%需求的材料。例如,20%的產品或服務創造了80%的利潤,20%的內容滿足了80%的用戶需求。

6;頁面存儲

從以上內容中,我們了解了搜索引擎如何抓取和維護頁面。接下來,我們需要知道搜索引擎在抓取頁面后需要存儲哪些信息,以滿足以下工作的數據需求。

頁面是搜索引擎處理網站信息的基礎,搜索引擎的大部分工作都在頁面上進行。然而,僅僅依靠頁面的內容并不能滿足搜索引擎對數據處理的需求。搜索引擎能否在抓取頁面的過程中獲得越來越多有價值的信息,將直接影響搜索引擎的效率和排序結果的質量。因此,除了存儲原始頁面外,搜索引擎在抓取頁面時還會附加一系列信息(如文件類型、文件大小、上次修改時間、URL、IP地址、捕獲時間等),然后將這些信息用作某項工作的基礎。例如,如果文件太大,它可能會被搜索引擎放棄;上次修改時間表示頁面更新的日期。

2.3.2頁面分析

頁面獲取只是搜索引擎工作的一個基本部分,并不意味著搜索引擎可以在頁面獲取后立即向最終用戶提供查詢服務。因為當用戶使用搜索引擎進行查詢時,他們使用的是一個單詞或短語。到目前為止,搜索引擎只能提供整個原始頁面,無法返回與用戶查詢條件匹配的信息。因此,搜索引擎還需要對原始頁面進行一系列分析和處理,以迎合用戶的信息查詢習慣。

如圖2-10所示,搜索引擎首先對存儲的原始頁面進行索引,然后過濾原始頁面的標簽信息,以提取頁面的主體信息;然后,對文本信息進行分割,建立關鍵詞索引,得到頁面與關鍵詞的對應關系;最后,對所有關鍵字進行重組,以建立關鍵字和頁面之間的對應關系。

圖2-10網頁分析處理流程

1;網頁索引

為了提高頁面檢索的效率,搜索引擎需要對檢索到的原始頁面進行索引。由于URL是頁面的入口地址,索引原始頁面實際上是索引頁面的URL,因此您可以根據URL快速定位相應的頁面。

2;網頁分析

網頁分析是最重要的

例如,信息過濾后的網頁0的內容為“中國廣東省深圳市”;然后,在對內容進行分段后生成關鍵詞“中國”、“廣東省”和“深圳市”,并對關鍵詞進行索引。這樣,搜索引擎可以根據網頁0快速定位關鍵字“中國”、“廣東省”或“深圳市”,如圖2-12所示。

圖2-12頁面與關鍵字的對應關系

然而,用戶通過關鍵字搜索攜帶相應信息的頁面。因此,搜索引擎還需要相應地處理現有信息,建立關鍵字和頁面URL之間的對應表,以便基于關鍵字快速定位多個頁面。這是下面描述的關鍵字重組問題。

關鍵字重組

為了迎合用戶查找信息的習慣,即根據關鍵字搜索與關鍵字相關的昆山seo排名費用頁面。因此,搜索引擎需要建立一個關系表,其中關鍵字是主索引并對應于多個頁面,即;關鍵字反向索引表;。建立關鍵字反向索引表最重要的任務是重新組織所有頁面中的關鍵字列表。

在索引關鍵字之后,網頁和關鍵字之間的一對多對應關系已經生成。接下來,搜索引擎重新組織所有頁面中的關鍵詞;5建立關鍵字索引以形成一組不重復的關鍵字列表,即每個關鍵字在關鍵字列表中都是唯一的。這樣,可以通過特定的關鍵字找到一個或多個網頁,從而實現根據關鍵字返回相應頁面的功能,如圖2-13所示。

圖2-13關鍵字和頁面之間的對應關系

5關鍵詞重組是在所有頁面中形成一個關鍵詞集合。

在分析和處理原始頁面后,搜索引擎可以根據用戶的查詢條件返回相應的頁面列表。然而,簡單地將頁面列表返回給用戶往往不能滿足用戶的需求。因此,搜索引擎將根據頁面和用戶查詢條件之間的相關性重新排列列表,然后將處理后的列表返回給用戶。這就是下面將向您介紹的搜索引擎對頁面排序的問題。

2.3.3頁面排序

在用戶向搜索引擎提交關鍵字查詢信息之后,搜索引擎在搜索結果頁面上返回與關鍵字相關的頁面列表,這些頁面根據與關鍵字的接近程度從上到下排列。決定頁面順序的因素很多。本書將介紹幾個最常見和最重要的因素,包括頁面相關性、鏈接權重和用戶行為。

1;頁面相關性

頁面相關性;是指頁面內容與用戶查詢的關鍵詞之間的相似度,主要由關鍵詞匹配、關鍵詞密度、關鍵詞分布、關鍵詞權重標簽等決定。

關鍵匹配度

關鍵字匹配;它是指頁面P中的內容與用戶查詢的關鍵字K之間的匹配程度,主要由以下兩個因素決定。

頁面P中是否存在與查詢條件關鍵字K匹配的內容,即頁面內容是否包含關鍵字K。

關鍵字K在頁面P中出現多少次,即頁面P中存在多少個關鍵字K。

為了計算關鍵字匹配度,搜索引擎為每個頁面分配一個關鍵字匹配值,該值由關鍵字在頁面中出現的次數決定。如果某個關鍵字在頁面上出現一次,并且關鍵字匹配值為10,那么如果該關鍵字在頁面中出現10次,則關鍵字匹配值=10*10。

如果這一假設成立,則關鍵字在頁面上出現的次數越多(即,詞頻越高),頁面就越相關,搜索結果將很容易被網站所有者操縱。例如,如果網站想要提高頁面的相關性,只需在頁面中添加足夠的關鍵字即可。

因此,關鍵詞詞頻決定頁面相關性是極不合理的,這也需要結合關鍵詞密度、關鍵詞分布、關鍵詞權重標簽等方面加以限制。

關鍵詞密度

為了有效防止網站所有者惡意操縱搜索結果,搜索引擎應該;關鍵詞頻率;以及;網頁總詞匯;用于測量單詞頻率的比例(即關鍵字密度值)

W (相關性)= W (匹配)+ ; W (密度)+nbsp; W (頭寸)+nbsp; W (標簽)

其中,W(相關性);是頁面相關性,W(匹配)是關鍵字匹配值,WW(位置);是關鍵字分布值,(標記)是標記權重值。

例如,頁面的內容如下:<;html>;&書信電報;正文>;&書信電報;b>;搜索引擎優化</b>;&書信電報;h1>;搜索引擎</h1>;……<;/正文>;<;/html>對于關鍵字“搜索引擎優化”,由于它只出現一次,因此關鍵字匹配值<i>W</i> (匹配)=;10; 如果關鍵字密度為50%,則關鍵字密度值<i>W</i> (密度)=;20; 如果關鍵字出現在頁面頂部,則關鍵字分布值W (位置)=;50; 重量標簽<;b>;如果關鍵字“搜索引擎優化”突出顯示一次,則標記權重值W (標簽)=10,即W (相關性)=;10+20+50+10。

搜索引擎利用四個主要因素的交互作用,即關鍵詞匹配、關鍵詞密度、關鍵詞分布和權重標簽,以改進頁面相關性的計算。然而,本節介紹了網站中的一些可控因素。為了提高排序中的信息質量,搜索引擎還引入了一些外部不可控因素來綜合評估頁面相關性,例如外部鏈接和用戶行為。

2;鏈接權重

鏈接主要分為內部鏈接和外部鏈接。當計劃或編輯頁面內容時,網頁創建者或編輯器會將它們添加到頁面中。加入的原因可能是鏈接指向的頁面非常重要或大多數用戶都需要。因此,一個頁面獲得的鏈接越多,在某種程度上反映了頁面越重要,鏈接權重值就越高。

如果整個互聯網被視為一個有向圖,超鏈接是有向邊,網頁是節點,那么大多數網頁都會有“入口”和“出口”。根據入口的數量和所提供入口的頁面權重值來計算頁面鏈接的權重是一個非常好的主意。

假設圖2-14是頁面之間的關系圖,其中V1、V2和V3是網頁;箭頭方向表示頁面貢獻鏈接或從其他頁面獲得的鏈接。以網頁V2為例。V2分別提供到V1和V3的鏈接,并獲得到V1的鏈接。

圖2-14頁面關系圖

內部鏈接

內部鏈接是指網站內部頁面之間的鏈接關系,它反映了網站內部頁面的識別程度。理論上,一個頁面獲得的鏈接質量和數量越高,其重要性就越大。

外部鏈接

外部鏈接是指站點外部頁面之間的鏈接關系。由于外部鏈接的不可控制性,外部鏈接在整個鏈接關系中占權重的比例更大,是決定整個頁面權重的最重要因素。

默認權重分配

網站頁面的數量不斷變化,但由于時間的原因,即使內容質量很高,新添加的頁面獲得的鏈接數量也有限,因此鏈接權重值通常很低。在這種情況下,搜索引擎需要根據相應的方案補償這些新頁面的鏈接權重值,以便新頁面能夠獲得更合理的鏈接權重。

在鏈接權重補償方面,搜索引擎將捕獲頁面的日期作為參考因素。它認為,一個頁面在單位時間內獲得的鏈接越多,質量越高,頁面的質量就越高。

例如,頁面A獲得30個鏈接,頁面B獲得30個(假設這些鏈接的質量相等)。然而,A頁用了100天,而B頁只用了1天。這反映出B頁在某種程度上比A頁更重要。因此,需要對頁面B進行補償,以使頁面B的鏈接權重值高于頁面A的鏈接權重。

3;用戶行為

搜索引擎完成頁面的基本權重計算后,可以向用戶顯示初步排序結果。然而,排序結果可能不能滿足大多數用戶,因此應結合其他因素來改進排序結果。例如,計算每個搜索結果的點擊次數以進行推測

圖2-15查詢處理流程

1.首先對用戶提供的查詢條件進行分段,刪除查詢條件中無意義的詞或詞,如“de”和“de”。

2.然后以分詞結果為條件在關鍵字反向索引列表中進行匹配。

3.如果有匹配結果,則匹配關鍵字的所有頁面的URL將形成一個列表。

4.最后,將匹配頁面從高到低權重值排序并返回給用戶。

其中,步驟3和4已在用戶查詢之前完成。

例如,當用戶查詢“手機圖片”時,搜索引擎會對單詞進行分段,得到“手機+圖片”的查詢條件;然后在關鍵字反向索引列表中匹配“電話+圖片”;結果獲得A、B和C;然后計算三頁的權重值。如果三個頁面的權重值關系是B>;C>;A、 搜索結果列表中三個頁面的順序是B、C和A。

2;用戶行為

用戶在搜索引擎中的行為主要包括搜索和單擊。搜索是為用戶獲取信息的過程,點擊是用戶獲取所需信息后的表現。

用戶的搜索和單擊行為包含非常豐富和重要的信息。例如,用戶搜索行為包括提交的關鍵字、提交時間、用戶IP地址和其他信息,而點擊行為包括每個結果的點擊時間和其他信息。

搜索引擎可以通過對用戶行為的分析,進一步探索用戶的需求,提高搜索結果的準確性。例如,搜索引擎還可以從用戶的搜索行為中找到新詞;根據用戶對搜索結果的點擊行為,可以分析用戶對每個搜索結果的偏好。

搜索

搜索它是用戶獲取信息的方式,也是搜索引擎最基本的功能。搜索引擎可以知道在用戶的搜索行為中搜索關鍵字的次數。通過對關鍵字搜索次數的分析,可以找到新單詞,以進一步了解用戶的搜索習慣。

隨著語言的不斷發展,隨著時間的推移,會產生越來越多的新詞。特別是在互聯網環境下,一個熱點事件也可能成為一個新詞,比如“燕趙門”。

對于搜索引擎來說,新詞主要指那些在當前搜索引擎詞典系統中不存在但被頻繁搜索的關鍵詞。如果搜索引擎詞典系統中不存在關鍵字,則在分詞過程中不會生成關鍵字,因此用戶在查詢關鍵字時無法返回相關信息,無法滿足用戶的需求。因此,搜索引擎學習新詞的能力在一定程度上反映了搜索引擎理解語言的能力,是衡量搜索引擎質量的重要指標之一。

將用戶搜索習慣與頁面內容相結合以發現新關鍵詞是搜索引擎學習新單詞的主要方式之一,如圖2-16所示。

圖2-16新詞匯識別過程

分析用戶查詢日志并過濾掉日志中經常查詢的單詞。

如果字典系統中不存在查詢相對頻繁的關鍵字,請將該關鍵字與某些頁面的內容進行匹配;如果命中,則表示該關鍵字存在,并將其添加到字典系統中;否則,將匹配下一個查詢頻繁詞。

點擊

單擊;這是用戶在找到所需信息后的表現,反映了用戶對信息的關注。因此,用戶點擊鏈接也是衡量頁面相關性的一個因素,也是衡量頁面關聯性的重要補充。

在同一關鍵字的搜索結果列表中,不同的用戶會有不同的選擇。然而,如果某個結果的點擊量明顯高于其他結果,則表明大多數用戶在某種程度上需要該頁面(尤其是當鏈接位于后面時)。

眾所周知,搜索結果中的鏈接越高,被點擊的概率就越高。根據這種邏輯,在第二、第三或第四頁上被點擊的機會會越來越小,但這并不意味著這些頁面并不比首頁更重要,但用戶沒有機會在當前的排序結果中找到它們。因此,搜索引擎將補償在不同位置單擊的鏈接的權重值。假設每次點擊頂部結果將獲得1分的補償

以上是潮人地東莞seo博客跟大家分享關于網站優化seo:SEO搜索引擎的工作原理,搜索引擎工作原理的四個步驟是怎樣等問題,希望能對大家有所幫助,若有不足之處,請諒解,我們大家可以一起討論關于網站seo優化排名的技巧,一起學習,以上內容僅供參考。

閱讀全文
本文標題"網站優化seo:SEO搜索引擎的工作原理,搜索引擎工作原理的四個步驟是怎樣":http://www.420113.com/wzyh_23570.html
本文版權歸潮人地seo博客所有,歡迎轉載,但未經作者同意必須在文章頁面給出原文連接,否則保留追究法律責任的權利。
標簽:
標簽列表
合作伙伴
主站蜘蛛池模板: 亚洲日韩中文字幕无码一区| 麻豆国产精品无码视频| 亚洲国产成人精品无码区花野真一 | 免费无码专区毛片高潮喷水| 内射无码午夜多人| 国产成人无码精品一区二区三区| 亚洲中文字幕久久精品无码A | 自拍中文精品无码| 精品久久久久久久无码| 亚洲国产一二三精品无码| 国产精品无码制服丝袜| AA区一区二区三无码精片| 丰满熟妇乱又伦在线无码视频| 久久亚洲AV成人无码国产最大| 亚洲av日韩av无码| 亚洲日韩精品A∨片无码| 日韩AV无码精品一二三区| 久久久久亚洲av无码专区喷水| 国产亚洲美日韩AV中文字幕无码成人| 亚洲国产精品无码久久久| 亚洲av无码精品网站| 久久老子午夜精品无码怎么打| 精品国产AV无码一区二区三区 | 久久久久av无码免费网| 午夜福利无码不卡在线观看 | 丰满少妇人妻无码专区| 精品无码成人片一区二区98| 久久亚洲AV成人无码电影| 无码欧精品亚洲日韩一区| 久久久久亚洲精品无码系列| 久久亚洲AV无码西西人体| 精品无码成人片一区二区| 一本色道无码道在线| 久久国产三级无码一区二区| 熟妇人妻系列av无码一区二区| 国产无码网页在线观看| 国产AV无码专区亚洲AV漫画| 亚洲精品无码永久在线观看你懂的| 日韩精品无码免费专区午夜不卡| 亚洲人成人无码网www电影首页| 亚洲成AV人片在线播放无码|