搜索引擎工作原理一個SEO從業(yè)者應該了解的基礎課程,但是有人卻說搜索引擎工作原理對于新手來說是不容易理解的,因為工作原理太抽象,而且搜索引擎的變化無常,無論誰都不能真正認識搜索工作原理。那么一個頁面是如何被搜索引擎發(fā)現并收錄的呢?下面
安慶網站優(yōu)化的小編為您分析:
蜘蛛在整個互聯網上爬行遇見你網站的一個URL,首先把URL提取出來根據網站權重和相關性插入到URL隊列中,然后是判斷你網站的這條URL是否能夠解析成功,如果能解析成功,蜘蛛會爬到你網站,這里需要說一下,蜘蛛并不是直接去分析你網頁的內容,而是去尋找你網站robots文件,根據你網站的robots規(guī)則判斷是否抓取你這個頁面,如果robots文件不存在,則會返回一個404錯誤,但是搜索引擎已經會繼續(xù)抓取你的網站內容。
搜索引擎抓取了網頁內容之后會對網頁進行一個簡單的判斷是否達到了收錄標準,如果不符合則繼續(xù)把URL加入到URL 隊列中,如果符合收錄就會下載網頁內容。
當搜索引擎拿到下載網頁內容的時候,會提取出頁面上的URL,繼續(xù)插入到URL隊列中,然后把頁面上的數據,進行進一步分析,判斷網頁內容是否達到收錄標準,如果達到收錄標準則把頁面存儲到硬盤中。
當用戶搜索某個關鍵詞時,搜索引擎為了減少查詢時間,將一部分相關性比較高的內容放到臨時緩存區(qū),大家都知道從計算機的緩存中讀取數據,比在硬盤中讀取數據快很多。所以搜索引擎只將緩存中的一部分顯示給用戶。被存儲在硬盤中的頁面,搜索引擎會根據網站權重定時對其進判斷是否有更新,是否達到了放入緩存區(qū)的標準,如果搜索引擎在判斷是否有更新的同時發(fā)現網站頁面被刪除或網頁達不到被收錄的標準也會被刪除。
以上就是搜索引擎的頁面收錄原理,希望每一位seo人員都應掌握。