DreamDev

http://dreamdev.co.bokee.net

企业介绍

欢迎访问DreamDev的企业博客,感受我们的企业文化、品牌理念;与我们互动交流,发表见解;与我们一起分享开放、自由交流的喜悦。 更详细
  • 行业:电脑/数码/软件
  • 地区:武漢
  • 电话:02787434100
  • 传真:02787434100

企业博客信息

创建者

成员列表

暂时没有相关信息!

浅析Google Page Rank

字体大小: - - zmdxyboyandy   发表于 07-10-26 08:25     阅读(2010)   评论(0)     分类:
Google 的page rank通过模拟用户的访问流来计算每个网页的价值。即,认为初始的时候
每个网页都会被用户访问到,之后,用户有一定的可能性从网页上给的链接进入另一个网
页。这样就形成了一个马尔可夫链。假设每个网页的初始价值都是1,通过不断的迭代,即
将自己手里的价值,均匀的分给自己链接去的网页,不断的进行这种操作,最终会近似的
趋于稳定,即自己手中的价值不论怎样的向下传递,和从上游获取。这个值都近似不变。
当所有的节点都稳定下来。就认为迭代收敛。每个节点手里的值就是这个网页的价值。即
pagerank。
在google使用page rank的时候,整个互联网的规模,规范,都很好,所以pagerank能起到
很好的效果。但是今天的互联网,已经很难用pagerank去概括了。原因一方面有大量的商
业链接存在。另一方面,pagerank本身是和查询无关的“一般价值”。而互联网的发展,
决定了一个网页的价值,很大程度上取决于用户的查询内容。

Pagerank是一种与查询无关的一般价值,目前单纯的pr需要各种参数去修正。具体怎样修
正,各家se都是有自己的算法的。
Pr的作用:指引spider的爬行轨迹。当两个网页内容相同的时候,怎样确定哪个应该保留。

返回文章列表标签:   互联网  

分享到:

下一篇:浅析facebook的成功 上一篇:在应用程序级别之外使用注册为 allowDefinition='MachineToApplication' 的节是错误的

发表评论评论 (0)
发表评论

登录名   密码   游客无须输入密码     注册企博网帐号

验证码