当前位置: 首页> SEO资讯> 各大搜索引擎如何计算网站排名
各大搜索引擎如何计算网站排名
来源:泉州SEO优化 发布日期:2021-04-29 08:00:00

搜索引擎蜘蛛爬行页面后,索引程序计算出反向索引,搜索引擎随时准备处理用户搜索。用户在搜索框中填写关键字后,排名程序调用索引数据库数据,计算并向用户显示排名,排名过程直接与用户交互。

搜索词处理搜索引擎收到用户输入的搜索词后,需要对搜索词进行一些处理才能进入排名过程。搜索词处理包括以下几个方面:

1、中文分词和页面索引,搜索词也必须进行中文分词,将查询字符串转换成基于分词的关键字组合。分词的原理与网页分词的原理相同。

2、与索引一样,搜索引擎需要从搜索词中删除停止词,以_限度地提高排名相关性和效率。

3、命令处理用于计算用户搜索到的关键字,如“站长论坛”,程序分词为“站长”和“论坛”。此外,用户输入的查询词中还可能包含一些搜索指令,如加号、减号等,需要搜索引擎进行识别和处理。

4、拼写错误更正:纠正用户输入的错误单词或英语单词。

5、集成搜索会触发一些搜索词,从而触发集成搜索。比如明星名字经常会引发图片和视频内容,而时下热门话题也容易引发信息内容。在搜索词处理阶段还需要计算哪些词触发了哪些综合搜索。2在对匹配搜索词的文件进行处理后,搜索引擎根据这些词得到关键字集。文件匹配阶段是找出包含所有关键字的文件。

 当初始子集选择找到包含所有关键字的匹配文件后,就不能进行相关计算,因为找到的文件往往有上千万甚至上千万。实时计算这么多文件之间的相关性需要很长时间。所以搜索引擎只需要计算前1000个结果的相关性就可以满足要求。但问题是,在计算相关性之前,搜索引擎如何知道哪一千个文件最相关?因此,在进行最终相关性计算时,初始页面子集的选择必须依赖于其他特征而不是相关性,其中最重要的是页面权重。由于所有匹配的文件都已经具有最基本的相关性,搜索引擎通常会选择具有不相关页面特征的初始子集。初始子集的数目是多少?几万?也许更多,外人不知道。但是,可以肯定的是,当匹配页面数量巨大时,搜索引擎不会计算那么多页面,而是必须选择页面权重较高的子集,然后计算该子集中页面的相关性。

 选择初始子集后,计算子集中页面的关键字相关性。计算相关性是排名过程中最重要的一步。相关计算是搜索引擎算法中最有趣的部分。影响关联性的主要因素包括:关键词使用的程度、关键词的频率和密度、关键词的位置和形式、关键词的关键因素词距、链接分析和页面权重。

通过过滤和调整排名,选择匹配文件的子集并计算相关性,确定总体排名。之后,搜索引擎可能会有一些过滤算法来稍微调整排名,而最重要的过滤就是惩罚。根据正常的权重和相关性计算,一些涉嫌作弊的页面会被排在_位,但搜索引擎的惩罚算法可能会在_步将这些页面向后调整。典型的例子是百度的11位,谷歌的负6,30,950算法。

 排名显示所有排名确定后,排名程序调用原始页面的标题标签、描述标签、快照日期等数据显示在页面上。有时搜索引擎需要动态生成页面摘要,而不是调用页面本身的description标记。

 搜索缓存用户在重复搜索关键字时会搜索很大一部分。根据2/8定律,20%的搜索词占搜索总数的80%。根据长尾理论,最常见的搜索词所占比例不高达80%,但它们通常都有一个比较粗的头部,很少有搜索词占所有搜索时间的很大一部分。尤其是当有热门新闻时,每天都有数百万人搜索完全相同的关键词。搜索引擎将在缓存中存储最常用的搜索词。搜索时直接从缓存中调用用户,无需进行文件匹配和相关性计算,大大提高了排名效率,缩短了搜索响应时间。         查询并单击日志以搜索用户的IP地址、搜索关键字、搜索时间以及他们单击的结果页。搜索引擎记录并形成日志。这些日志文件中的数据对于搜索引擎判断搜索结果质量、调整搜索算法、预测搜索趋势具有重要意义。

在线咨询 电话咨询