排名:
排名过程是与用户互动的过程:是指当用户输入关键词以后,排名程序调用索引数据库里面的数据,计算相关性后按照一定格式生成搜索结果页面!
1. 搜索词的处理过程
A:中文分词;前面讲过了
B:去停止词;前面讲过;
C:指令处理:搜索引擎的默认处理方式是在关键词之间使用“与”逻辑,比如用户在搜索“网站建设”时,搜索引擎默认为用户想要查找的既包含“网站”也包含“建设”的页面!
常见的搜索指令有加减号,还有哪些搜索指令?如何使用使用搜索指令,后面会详细拿出一节来详细讲解的!
D:如果用户输入了明显错的字或者英文单词的时候,搜索引擎会提示用户正确的用字或者拼法!例如:搜索“建站技数”
E:整合搜索触发!比如搜索明星,会出现图片,视频等内容!适合做热门话题;
2. 文件匹配如何进行
这一部是在倒排索引中能快速的完成:看图
关键词 | 文件 |
关键词1 | 文件1文件2,文件17,文件110……文件L |
关键词2 | 文件1,文件7,文件30……文件B |
关键词3 | 文件2,文件7,文件30……文件U |
…… | …………………… |
关键词6 | 文件21,文件70,文件300……文件K |
…… | ……………… |
关键词7 | 文件12,文件27,文件3……文件L |
如果用户搜索的一个词,既有关键词2,也有关键词3的话,那么组后就会很精准的找到既包含关键词2,也包含关键词3的文件,然后返回!