大地seo:排序计算

来源: 搜索引擎爱好者 - Xlxh.Com 时间:2007-12-19

搜索引擎排序计算第三课:排序计算


搜索引擎的的排序计算是最主要的阶段,因为百度有很多的产品,所以形成页面的白条鸡作为基础页面,将被所需要的检索所调用,搜索也因此节省了很大的资源。
排序的计算也同样调用了很多的计算模块,对页面进行全方位的立体的计算,包括对本页的计算和相关本站的计算以及外部链接的计算,然后各自模块形成各自的数值。
※※※※※※※※※※
网页的类型判断:
拜读过搜索引擎-原理、技术系统。其中对于网页类型的判断有独到的见地。我依照百度搜索引擎的理解,又改动了一些计算程序,使之更符合百度搜索的检索习惯。
主题类型:
该类型是最常用的格式,凡是有主题的文本都属于此类,我的理解对于主题文本的判断,也就是正文规则和天网的有所不同,主要是天网处理的数量和百度搜索殷勤的海量收录的不同,同时百度搜索引擎的主题命中算法,更符合内容的判断。
对于正文规则,也就是主题文本的判断,为了更加符合百度的主题搜索的要求,和目前检索的规律,我自己认为,title和标题的主题关联度,内容和标题的关联的,最权重容器标签内的文本,为主要判断条件。

对于正文规则计算的深度解析: (包括如何正文规则,以及主题正文计算的具体应用)

(1)title和内容标题的相关度。

(1)--> 相关度--> (2)标题和内容的相关度。

(3)最权重容器标签和内容的相关度。

(2)-->文本的数量于链接之间的比值,以及和图片之间的比值,就可以完全区分类型。

(3)-->切词-->分析计算-->也许还有少量语意匹配计算-->确认主题、提炼出关键字列表(重要索引词表)。

(4)-->容器确认-->标签树的构建-->通过相关计算,推导出最权重的正文所在处。

(5)-->特征标签的计算-->尤其对于位置、字体、大小等的统计所计算出的数值。

(6)-->相关链接的计算-->链接的计算-->切词的计算。

(7)-->基页的计算-->指纹的标识。

以上是对于主题正文计算的一些粗步构思。不够全面,望大家有兴趣的可以跟帖补充。

大地原创-欢迎以链接形式的转载

Tags:大地seo 排序 计算
责任编辑:大地
共7页: 上一页 [1] [2] 3 [4] [5] [6] [7] 下一页
[论坛交流] [复制链接] [打印] [返回首页]
上一篇:seo关键词优化    下一篇:大地seo:搜索引擎优化探讨

在Baidu中搜索"大地seo:排序计算"
在Google中搜索"大地seo:排序计算"
在Yahoo中搜索"大地seo:排序计算"