潮人地東莞se網(wǎng)絡(luò)推廣與優(yōu)化實(shí)習(xí)目的o博客小編下面跟大家分享關(guān)于「seo企業(yè)網(wǎng)站優(yōu)化」如何避免搜索引擎蜘蛛抓取重復(fù)頁面的方法等問題,希望seo專員在做seo優(yōu)化的過程中有所幫助,內(nèi)容僅供參考。
搜索引擎面對的是互聯(lián)網(wǎng)萬億網(wǎng)頁,如何高效抓取這么多網(wǎng)頁?這便是網(wǎng)絡(luò)爬蟲的工作。我們也叫它網(wǎng)絡(luò)蜘蛛,做為站長,我們每天都在與它親密接觸。 做SEO要充分了解S
搜索引擎面對的是互聯(lián)網(wǎng)萬億網(wǎng)頁,如何高效抓取這么多網(wǎng)頁?這便是網(wǎng)絡(luò)爬蟲的工作。我們也叫它網(wǎng)絡(luò)蜘蛛,做為站長,我們每天都在與它親密接觸。
做SEO要充分了解SEO的抓取情況,同時(shí)要做好哪些頁面應(yīng)該被抓取,和哪些頁面不希望被抓取的篩選。例如,今天需要和大家講的,如何避免搜索引擎蜘蛛抓取重復(fù)頁面。
seo博客相關(guān)推薦閱讀:seo技術(shù):搜索引擎關(guān)鍵字優(yōu)化(關(guān)鍵詞排名提升工具如何用)
針對每一位SEO從業(yè)者而言,爬蟲每天來我們的網(wǎng)站進(jìn)行網(wǎng)頁的抓取,是十分寶貴的資源。但在這中間由于爬蟲無序的抓取,勢必會浪費(fèi)一些爬蟲的抓取資源。這中間我們就需要解決搜索引擎爬蟲對我們的網(wǎng)頁重復(fù)抓取的問題。
在聊這個(gè)問題之前,我們需要理解一個(gè)概念。首先爬蟲本身是無序的抓取,他不知坪山網(wǎng)絡(luò)營銷推廣優(yōu)化道先抓什么再抓什么,只知道看到了什么,且計(jì)算后認(rèn)為有價(jià)值就進(jìn)行抓取。
而對于我們而言,抓取的整個(gè)過程中,我們最要解決是如下幾類
1、新產(chǎn)生的頁面,沒有被抓取過的
2、產(chǎn)生了一段時(shí)間,遲遲不被抓取的
3、產(chǎn)生了一段時(shí)間,卻一直沒收錄的
4、產(chǎn)生很久的頁面,但最近更新了
5、包含內(nèi)容更多的聚合頁面,如首頁、列表頁
6、如上幾類,按照順序我們定義哪一類最需要被爬蟲抓取。
針對大型網(wǎng)站,搜索引擎爬蟲抓取資源過剩,而針對小網(wǎng)站,抓取資源稀缺。所以在這里我們強(qiáng)調(diào)一下,我們不是要解決搜索引起爬蟲重復(fù)抓取的問題,而是要解決搜索引擎爬蟲最快的抓取我們希望抓取的頁面。要把這個(gè)思路糾正!
下面,我們聊一下怎么讓搜索引擎爬蟲最快的抓取我們希望被抓取的頁面。
爬蟲是抓取到一個(gè)網(wǎng)頁,從這個(gè)網(wǎng)頁在找到更多的鏈接,周而復(fù)始的過程,那么這個(gè)時(shí)候我們就要知道要想被爬蟲更大概率抓取,就要給更多的鏈接,讓搜索引擎爬蟲發(fā)現(xiàn)我們希望被抓取的網(wǎng)頁。這里我拿上述的第一種情況舉例說明一下:
新產(chǎn)生的頁面,沒有被抓取過的
這類一般都會是文章頁,針對于這類我們的網(wǎng)站每天都會大量產(chǎn)生,所以我們就要在更多的網(wǎng)頁給予這部分鏈接。例如首頁、頻道頁、欄目/列表頁、專題聚合頁、甚至文章頁本身,都需要具備一個(gè)最新文章板塊,以此等待爬蟲抓取到我們的任何網(wǎng)頁時(shí),都能發(fā)現(xiàn)最新的文章。
同時(shí),試想一下,這么多頁面都有新文章的鏈接,連接傳企業(yè)網(wǎng)絡(luò)推廣排行榜優(yōu)化遞權(quán)重,那這新文章,既被抓取了,權(quán)重也不低。被收錄的速度會明顯提升。
那針對那些長時(shí)間不收錄的,也可以考慮是不是權(quán)重太低了,我多給一些內(nèi)鏈支持,傳遞一些權(quán)重。應(yīng)該會有收錄的可能。當(dāng)然也有可能不收錄,那你就要靠內(nèi)容本身的質(zhì)量了。之前有一篇文章是專門說內(nèi)容質(zhì)量的也歡迎大家閱讀:什么內(nèi)容容易被百度判斷為優(yōu)質(zhì)內(nèi)容?。
所以,我們?yōu)榱私鉀Q搜索引擎爬蟲重復(fù)抓取問題不是我們最終要解決的。因?yàn)楸举|(zhì)上搜索引擎爬蟲是無序的,我們只能通過針對網(wǎng)站的架構(gòu)、推薦算法、運(yùn)營策略等進(jìn)行干預(yù)。使爬蟲給予我們更理想的抓取效果。
以上是潮人地東莞seo博客跟大家分享關(guān)于「seo企業(yè)網(wǎng)站優(yōu)化」如何避免搜索引擎蜘蛛抓取重復(fù)頁面的方法等問題,希望能對大家有所幫助,若有不足之處,請諒解,我們大家可以一起討論關(guān)于網(wǎng)站seo優(yōu)化排名的技巧,一起學(xué)習(xí),以上內(nèi)容僅供參考。