讓每一(yī)個企業都擁有适合自己的互聯網應用方案-安慶中(zhōng)拓科技   網站首頁 > 優化知(zhī)識
 
搜索引擎的頁面收錄原理
來源:aqseo.cn 發布時間:2014-6-5
    搜索引擎工(gōng)作原理一(yī)個SEO從業者應該了解的基礎課程,但是有人卻說搜索引擎工(gōng)作原理對于新手來說是不容易理解的,因爲工(gōng)作原理太抽象,而且搜索引擎的變化無常,無論誰都不能真正認識搜索工(gōng)作原理。那麽一(yī)個頁面是如何被搜索引擎發現并收錄的呢?下(xià)面安慶網站優化的小(xiǎo)編爲您分(fēn)析:
       
    蜘蛛在整個互聯網上爬行遇見你網站的一(yī)個URL,首先把URL提取出來根據網站權重和相關性插入到URL隊列中(zhōng),然後是判斷你網站的這條URL是否能夠解析成功,如果能解析成功,蜘蛛會爬到你網站,這裏需要說一(yī)下(xià),蜘蛛并不是直接去(qù)分(fēn)析你網頁的内容,而是去(qù)尋找你網站robots文件,根據你網站的robots規則判斷是否抓取你這個頁面,如果robots文件不存在,則會返回一(yī)個404錯誤,但是搜索引擎已經會繼續抓取你的網站内容。 
    搜索引擎抓取了網頁内容之後會對網頁進行一(yī)個簡單的判斷是否達到了收錄标準,如果不符合則繼續把URL加入到URL 隊列中(zhōng),如果符合收錄就會下(xià)載網頁内容。  
當搜索引擎拿到下(xià)載網頁内容的時候,會提取出頁面上的URL,繼續插入到URL隊列中(zhōng),然後把頁面上的數據,進行進一(yī)步分(fēn)析,判斷網頁内容是否達到收錄标準,如果達到收錄标準則把頁面存儲到硬盤中(zhōng)。  
    當用戶搜索某個關鍵詞時,搜索引擎爲了減少查詢時間,将一(yī)部分(fēn)相關性比較高的内容放(fàng)到臨時緩存區,大(dà)家都知(zhī)道從計算機的緩存中(zhōng)讀取數據,比在硬盤中(zhōng)讀取數據快很多。所以搜索引擎隻将緩存中(zhōng)的一(yī)部分(fēn)顯示給用戶。被存儲在硬盤中(zhōng)的頁面,搜索引擎會根據網站權重定時對其進判斷是否有更新,是否達到了放(fàng)入緩存區的标準,如果搜索引擎在判斷是否有更新的同時發現網站頁面被删除或網頁達不到被收錄的标準也會被删除。  
    以上就是搜索引擎的頁面收錄原理,希望每一(yī)位seo人員(yuán)都應掌握。