網站如何在Google建立索引
時間:2022-06-27 作者:管理員(yuán) 點擊:435
大(dà)多數知(zhī)名搜索引擎的搜索索引都有數萬億頁,比如谷歌、百度、Bing。因此,讓我(wǒ)(wǒ)們讨論排名算法之前,讓我(wǒ)(wǒ)們先了解Web索引的構建和維護機制。分(fēn)享的這個流程是專門針對Google的,但是其他網絡搜索引擎比如百度、Bing可能就很相似了。還有其他類型的搜索引擎,比如隻從其網站展示結果的亞馬遜、YouTube、維基百科。
步驟1、網址
所有的事情都從已知(zhī)的URL列表開(kāi)始。谷歌通過各種流程發現了這些,但最常見的三種是:
反向鏈接
谷歌已經有e已經有一(yī)個索引包含了數萬億個網頁,如果有人把指向你其中(zhōng)一(yī)個頁面的鏈接從其中(zhōng)添加出去(qù),就可以從中(zhōng)找到。
您可以使用站點資(zī)源管理器,使用Ahrefs網站管理員(yuán)工(gōng)具免費(fèi)查看您網站的反向鏈接。
爲Ahrefs網站管理員(yuán)注冊免費(fèi)工(gōng)具賬号。
在站點資(zī)源管理器中(zhōng)粘貼你的域。
轉到反向鏈接報告。
我(wǒ)(wǒ)們的爬蟲是第二個活躍的爬蟲,僅次于Google,所以你應該在這裏看到一(yī)個相當完整的反向鏈接視圖。
站點地圖。
網站地圖列出了你網站的所有重要頁面。如果你向Google提交網站地圖,它可能會幫助他們更快地找到你的網站。
提交自URL。
Google還允許單個URL通過GoogleSearchConsole提交。
步驟2、爬行的步驟
電(diàn)腦機器人(如Googlebot)訪問并下(xià)載發現的頁面,被稱爲蜘蛛。
請注意,Google并不總是按照他們發現頁面的順序來抓取頁面。
Google排隊的URL根據幾個因素,包括:
PageRankURL。
多長時間更改一(yī)次URL。
不管是不是新的。
這一(yī)點非常重要,因爲這意味着搜索引擎可能會在其他頁面之前抓取你的某些頁面并将其編入索引。如果你的網站很大(dà),搜索引擎完全抓取可能需要一(yī)段時間。
步驟3、處理
加工(gōng)是谷歌從抓取頁面中(zhōng)了解和提取關鍵信息的地方。谷歌之外(wài)的過程中(zhōng)的每一(yī)個細節都沒有人知(zhī)道,但提取鏈接和存儲内容進行索引是我(wǒ)(wǒ)們理解的重要部分(fēn)。
爲了充分(fēn)處理谷歌,谷歌必須渲染頁面,這是谷歌運行頁面代碼的地方,了解它如何找到用戶。
也就是說,有些處理會發生(shēng)在渲染前後——如圖所示。
第4步、索引
索引是一(yī)個被稱爲搜索索引的大(dà)型數據庫,被添加到未來從爬網頁的處理信息中(zhōng)。這本質上是一(yī)個包含數萬億頁面的數字圖書(shū)館,谷歌的搜索結果來自這些頁面。
這一(yī)點很重要。當你在搜索引擎中(zhōng)輸入查詢時,您并不是直接在互聯網上搜索匹配的結果。您正在搜索搜索引擎的網頁索引。如果網頁不在搜索索引中(zhōng),搜索引擎用戶将無法找到它。這就是爲什麽你的網站在Google、百度和Bing等主要搜索引擎中(zhōng)如此重要。