首页>>新闻中心>>建设知识

网站排名一些说明

来源: 本站    发布时间: 2015-09-23 15:03    阅读次数:

经过搜索引擎蜘蛛抓取页面,搜索程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了,用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程是与用户直接互动的。

1搜索词处理

搜索引擎就收到用户输入的搜索词后,需要多搜索词做一些处理,才能进入排名过程。搜索词处理包括如下几方面。

(1)中文分词,与页面索引时一样,搜索词也必须进行中文分词,讲查询字符串转换为以词为基础的关键词组合,分词原理也页面分词相同。

(2)去停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限度的提高排名相关性及效率。

(3) 指令处理。查询才完成分词后,搜索引擎的默认处理方式是在关键词之间使用“与”逻辑,也就是说用户搜索“减肥方法”时,程序分词为“减肥”和“方法”两只 包含“减肥”不包含“方法”,或者只包含“方法”不包含“减肥的页面”,被认为是不符合搜索条件的。当然,这只是极为简单的为了说明原理的说法,实际上我 们还是会看到只包含一部分关键词的搜索结果。

另外用户输入的查询词还可能包含一些高级搜索索引指令 如加好,减号等,搜索引擎都需要做出识别和相应处理,有关高级搜索指令,后面还有详细说明。

(4)拼写错误矫正,用户如果输入了明显错误的字或英文单词拼写,搜索引擎会提示用户正确的用字或拼法。

(5)整合搜索触发,某些搜索词汇触发整合搜索,比如明星姓名就经常触发图片和视屏内容,当前热门话题又容易触发资讯内容,哪些词触发哪些整合搜索,也需要在搜索词处理阶段计算。

一起设计吧
BACK