详细介绍PageRank算法从原理到实现的全过程
拥抱趋势 专业优化 快速打造能赚钱的网站
马上咨询
2018-10-24 09:45:53阅读:489来源:seo优化公司作者:企业互联
[导语]为您推荐文章《详细介绍PageRank算法从原理到实现的全过程》(本文主要讲述:2、质量如果:指向页面A的入链质量不同,质量高的页面会通过链接向其它页面传递很多其它的权重。85Ⅵ、算法公式:注:Mpi是有出链到pi的所有网页集合,L(pj)是有网页pj的出链总数,N是网页总数,α一般取值为0。此时PR(A)的计算公式为:一般取值α=0。一、PageRank算法概述:PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。可知,网页A也可以出链C,如果A中也......)如果你对文章有兴趣,欢迎关注我们
本文对489人有所帮助,共有1394个文字,预计阅读所需时间4分钟

详细介绍PageRank算法从原理到实现的全过程

  一、 PageRank算法概述:

  PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。

  是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模型。眼下许多重要的链接分析算法都是在PageRank算法基础上衍生出来的。PageRank是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个站点的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等全部其他因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中另站点排名获得提升,从而提高搜索结果的相关性和质量。其级别从0到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。比如:一个PR值为1的站点表明这个站点不太具有流行度,而PR值为7到10则表明这个站点很受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的站点了。Google把自己的站点的PR值定到10,这说明Google这个站点是很受欢迎的,也能够说这个站点很重要。

  二、从入链数量到 PageRank:

  在PageRank提出之前,已经有研究者提出利用网页的入链数量来进行链接分析计算,这样的入链方法如果一个网页的入链越多,则该网页越重要。早期的非常多搜索引擎也採纳了入链数量作为链接分析方法,对于搜索引擎效果提升也有较明显的效果。 PageRank除了考虑到入链数量的影响,还參考了网页质量因素,两者相结合获得了更好的网页重要性评价标准。

  对于某个互联网网页A来说,该网页PageRank的计算基于下面两个基本如果:

  1、数量如果:在Web图模型中,如果一个页面节点接收到的其它网页指向的入链数量越多,那么这个页面越重要。

  2、质量如果:指向页面A的入链质量不同,质量高的页面会通过链接向其它页面传递很多其它的权重。所以越是质量高的页面指向页面A,则页面A越重要。

  利用以上两个如果,PageRank算法刚開始赋予每一个网页同样的重要性得分,通过迭代递归计算来更新每一个页面节点的PageRank得分,直到得分稳定为止。 PageRank计算得出的结果是网页的重要性评价,这和用户输入的查询是没有不论什么关系的,即算法是主题无关的。如果有一个搜索引擎,其相似度计算函数不考虑内容相似因素,全然採用PageRank来进行排序,那么这个搜索引擎的表现是什么样子的呢?这个搜索引擎对于随意不同的查询请求,返回的结果都是同样的,即返回PageRank值** 高的页面。

  三、PageRank算法原理:

  1、基本概念

  先了解几个基本概念,一遍后面内容理解

  Ⅰ、出链

  如果在网页A中附加了网页B的超链接B-Link,用户浏览网页A时可以点击B-Link然后进入网页B。上面这种A附有B-Link这种情况表示A出链B。可知,网页A也可以出链C,如果A中也附件了网页C的超链接C-Link。

  Ⅱ、入链

  上面通过点击网页A中B-Link进入B,表示由A入链B。如果用户自己在浏览器输入栏输入网页B的URL,然后进入B,表示用户通过输入URL入链B

  Ⅲ、无出链

  如果网页A中没有附加其他网页的超链接,则表示A无出链

  Ⅳ、只对自己出链

  如果网页A中没有附件其他网页的超链接,而只有他自己的超链接A-Link,则表示A只对自己出链

  Ⅴ、PR值

  一个网页的PR值,概率上理解就是此网页被访问的概率,PR值越高其排名越高。

  下面给出计算PR值可能遇到的几种不同情况:

  case1:网页都有出入链

  此种情况下的网页A的PR值计算公式为:

  case2:存在没有出链的网页

  网页C是没有出链。因为C没有出链,所以对A,B,D网页没有PR值的贡献。PageRank算法的策略:从数学上考虑,为了满足Markov链,设定C对A,B,C,D都有出链(也对他自己也出链~)。你也可以理解为:没有出链的网页,我们强制让他对所有的网页都有出链,即让他对所有网页都有PR值贡献。

  此种情况PR(A)的计算公式:

  case3:存在只对自己出链的网页

  C是只对自己出链的网页。

  此时访问C时,不会傻乎乎的停留在C页面,一直点击C-Link循环进入C,即C网页只对自己的网页PR值有贡献。正常的做法是,进入C后,存在这种情况:在地址输入栏输入A/B/C/D的URL地址,然后跳转到A/B/C/D进行浏览,这就是PageRank算法解决这种情况的策略:设定存在一定概率为α,用户在地址栏输入A/B/C/D地址,然后从C跳转到A/B/C/D进行浏览。

  此时PR(A)的计算公式为:

  一般取值α=0.85

  Ⅵ、算法公式:

  注:Mpi是有出链到pi的所有网页集合,L(pj)是有网页pj的出链总数,N是网页总数,α一般取值为0.85

  所有网页PR值同时计算需要迭代计算:一直迭代计算,停止直到下面2情况之一发生:每个网页的PR值前后误差dleta_pr小于自定义误差阈值,或者迭代次数超过了自定义的迭代次数阈值

  三、PR值计算方法:

  1、几个基本公式

  2、幂迭代法

  先对P0赋随机初值,然后通过上面公式进行迭代计算,直到满足条件停止迭代计算:一直迭代计算,停止直到下面2情况之一发生:每个网页的PR值前后误差dleta_pr小于自定义误差阈值,或者迭代次数超过了自定义的迭代次数阈值

  3、特征值法

  Markov Chain收敛时,存在:

  4、代数法

  Markov Chain收敛时,存在:

  可以通过上面公式计算出来PR值矩阵。

如何优化:
北京集团网站建设 网站开发合同 企业网站多长时间改版合适 阳江网站开发 设计交易网站 重庆少儿编程网站开发 在线ui设计网站 建德网站改版 网站开发案例分享 网站开发综合实训作业4
总访问数:49145745 文章总数:13698 建站天数:3385
相关阅读
01
内容营销来驱动长尾词seo 你的网络营销做对了吗?
  长尾词转化率早在2010年,亚马逊的大部分图书销量(约57%)来自于长尾词查找。例如,一家总部坐落美国西北部的实体连锁店,在YouTube上发布了大约330个内容丰厚的视频。例如,商家能够鼓舞顾客积极参加用户论坛、用户办理的问答部分,乃至是产品谈论,所有这些都能驱动长尾词查找流量增加。内容营销的根本前提是,当企业供给有协助的内容时,潜在的顾客会有一种互利的感觉,并终究购买该产品。2004年,Wir......[详情查看]
02
优化技术分享 第167页
  如果涉及语言。。2018-05-20企鹅博客阅读(695)赞(0)什么是负面SEO:负面SEO指的是自己关键词排名做不上去时,通过一些方法,通常是不正当的方法,把竞争对手的页面拉下来,有时候效果和自己页面排上去差不多。。国外公司也有不少要做中文网站,不过电子商务类的不多,大品牌、留学/移民之类的比较多......[详情查看]
03
关键词排名下降的原因及分析
  第三:网站自身的原因导致关键词不稳定也是致命的shashou,因为前面我说的那些你做的再好,可能就断送在你网站自身上,网站的自身代码有问题,服务器不稳定这些都是藏在你网站内部的shashou,很多优化新手一般以为这种细节不重要,可事实却不是如此,网站程序改动或改版,网站自身的内链做的不好,不合理,前期我博客写了很多关于排名的原因,都在强调内链,因为这是基础。现在许多企业都注重优化网站seo,更关注......[详情查看]
04
优化seo如何选取网站关键词
  核心词选取1:紧扣网站主题,在关键词分析一文中详细解释了网站主题定位,实际上,关键词与网站主题定位越匹配seo难度越小,不管从竞争度还是难易度来说都是这样。找高权重的博客、论坛、新闻源等网站发布,引导用户搜索或者直接把用户带过来。2:分而化之,在新手如何学习优化seo一文中我说过,太宽泛的信息我们可以细化成一个个的具体的点,逐个学习了解,各个击破。虽然长尾词流量小,但架不住词多,所有的长尾词搜索量......[详情查看]
05
优化推广是否值得小型企业去投资?
  但是因为小型企业的客户资源有限,所以也需要借助优化推广的方式让广大网友了解企业本身。五、 ;帮主小型企业打造口碑和大企业相比,小型企业真的是名不见经传。二、 ;小型企业更要seo大型企业都有一大批固定的客户群体,这些客户群之间会通过口口相传的方式做活广告。但是小型企业为了扩大声势,则需要通过不同的方式和手段提高企业知名度,其中就包括优化推广这种方式。五、 ;帮主小型企业打造......[详情查看]
06
他们能承载什么或这项工作的重要性是非常重
  如果你想做好一个网站,你需要学习关键词优化网站关键字seo。。。。一、从用户的角度来看,网站导航系统......[详情查看]
07
网站服务器的要求对seo来说尤为重要
  有必要跟大家分享下服务器不稳定对网站seo的几个致命影响1、网站经常打不开,高质量的友情链接就会越来越少友情链接交换是建立再双方自愿平等的基础上,如果和你交换友情链接的朋友发现,你的网站老是打不开,他就可能就会把友链撤掉,这样对网站的seo非常不利。为避免后续的朋友为了贪图便宜而选择不稳定的服务器,网站服务器对于网站来说是必不可缺的,服务器的稳定性对网站的持续发展很重要,并时刻影响着网站seo的效......[详情查看]
08
修改网站网站排名会下降吗?
  1、增加关键词增加的关键词会稀释其他所有关键词所得的权重,所以增加关键词会导致网站排名的浮动。但是如果增加的关键词跟现有的关键词是相互促进作用的,影响不会很大。同义词替换就是说两个相同意思的词的替换,比如把映山红替换成之前的杜鹃花。比如:优化是什么和什么是优化两个关键词,因为含义是一样的,所以增加其中一个也不会影响另一个关键词的排名。如果被减去的关键词竞争度非常小,排名影响不大......[详情查看]