首頁

客服
返回頂部
技術展示 NEWS

百度搜索引擎收錄習慣

62009-2
2009-2-6浏覽:

百度是全球最大(dà)的中(zhōng)文搜索引擎,對中(zhōng)文網頁的搜索技術在某種程度上領先于Google,百度在某些方面與Google有相同或相似之處外(wài)它還有以下(xià)特點:

1、較重視第一(yī)次收錄印象

網站百度的第一(yī)印象比較重要,相對Google而言,百度搜索引擎的人爲參與度較高,也就是說在某些層面上可能由人來決定是否收錄網頁而不是由機器來決定.所以,網站在登錄百度搜索引擎之前最好把内容做得豐富點、原創内容多一(yī)點、網頁關鍵詞與内容的相關度高一(yī)點,這樣才能給百度較好的初次印象.

2、對網頁的更新較敏感

百度對網頁的更新相對Google而言更加敏感,可能這與百度的本土性格有關.百度搜索引擎每周更新,網頁視重要性有不同的更新率,頻(pín)率在幾天至一(yī)月之間.所以在百度的搜索結果中(zhōng)基本上都标明了收錄時間.

3、較重視首頁

百度對首頁的重視程度要比Google高得多,這與上面提到的“較重視第一(yī)次收錄印象”一(yī)脈相承.百度在顯示搜索結果時也常常把網站首頁顯示出來,而不具體(tǐ)到某個内容頁(當其認爲不夠重要時).相對而言,其用戶體(tǐ)驗打了折扣,而增加了其“百度快照”的用戶量.

4、較重視絕對地址的鏈接

百度在收錄網頁時比較重視絕對地址的收錄,百度提供的網頁快照功能也沒有解析相對地址的絕對路徑,不知(zhī)這是百度技術的疏忽還是其偏好的一(yī)大(dà)體(tǐ)現.

5、較重視收錄日期

百度對網頁的收錄日期非常看重,也是其搜索結果排名的參考點,被收錄得越早排名會較高,有時甚至不考慮相關性地把它認爲比較重要的内容放(fàng)在首位,而點擊進入之後才發現是早已過時的信息或者垃圾信息.這是百度需要改進的技術.

百度使用的技術:

百度使用以下(xià)技術:“一(yī)種互聯網上鏡像和準鏡像網站的識别方法”,這個方法解決了搜索引擎對雷同信息的重複獲取,節省網絡資(zī)源和本地資(zī)源,提高系統服務的質量和效率;“一(yī)種基于詞彙的計算機索引和檢索方法”,該方法對一(yī)段連續的文字信息,經過詞彙分(fēn)析處理後,通過添加隐形詞彙的手段,實現對基于詞彙索引和檢索系統的檢索質量提升,使用戶獲得更加準确的檢索結果;“一(yī)種使用快照的方式實現對網上信息進行記錄和分(fēn)析的方法”,該方法是通過對互聯網上一(yī)個特定信息,多次進行快照的方式,将信息當時的狀态進行保留.并通過對一(yī)系列快照信息的分(fēn)析,得到有效數據,方便地得到網上信息的變動情況.