搜索引擎對索引庫的檢索過程可以理解為以下幾點.
1.把用戶提交的搜索詞分成A詞和B詞。
2.同時使用詞A和詞B在索引庫中進行檢索,并提出所有包含A詞或者詞B的文件,組成文件集合L。
3.在文件集合L中把同時包含詞A和詞B的文件優先提出來組成文件集合M排在前面,把只包含詞A或詞B的文件排在后面。
4.繼續對文件集合M進行分析,把完全包含用戶搜索詞的文檔提出來組成文件集合N并排在前面,把內容中沒有完全匹配搜索詞的文件排在后面。
5.再根據搜索詞在網頁中出現的次數,位置,密度和形式等對文件集合N中的文件進行排序。
6.搜索引擎還會分析文件的外鏈數量,質量和錨文本,根據錨文本輔助分析文件和關鍵詞的相關度,外鏈的數量和質量來確定文件的重要程序,以進行排序調整。
同時在關鍵詞匹配中,搜索引擎為了使返回的結果都是是用戶真正需要的,會分析判斷搜索引擎詞分詞的詞語,哪些是用戶主要關心的,哪些是用戶次要關心的。