企业互联专业网站定制+品牌网站设计+集团网站建设
400 0082 880
浅谈网页反作弊技术思路、方法以及处理方式
拥抱趋势 专业优化 快速打造能赚钱的网站
马上咨询
2018-10-09 09:27:53阅读:500来源:seo优化公司作者:企业互联
[导语]为您推荐文章《浅谈网页反作弊技术思路、方法以及处理方式》(本文主要讲述:一、网页反作弊出现背景出于商业利益的驱使,很多网站站长会针对搜索引擎排名进行分析,并采取一些手段来提升排名。常见的作弊方式包括:关键词重复、无关查询词作弊、图片alt标签文本作弊、网页标题作弊、网页重要标签作弊及网页元信息作弊。0作弊方法。2、不信任传播模型:从大的技术框架来讲,与信任传播模型极其相似。百度称此举是为了尊重搜索的用户,净化互联网生态环境!发布时间:2013年5月17日打击对象:针对......)如果你对文章有兴趣,欢迎关注我们
本文对500人有所帮助,共有1937个文字,预计阅读所需时间5分钟

浅谈网页反作弊技术思路、方法以及处理方式

  一、网页反作弊出现背景

  出于商业利益的驱使,很多网站站长会针对搜索引擎排名进行分析,并采取一些手段来提升排名。这种行为本身无可厚非,很多seo行为都是符合搜索引擎排序规则的,但与此同时也存在很多恶意的seo行为。所以网页反作弊,也是目前所有商业搜索引擎需要解决的重要难点。

  快排科技(vx:SEOkuaipai)孔宇今天来谈一下目前一些常见的互联网网页作弊方法、反作弊的整体思路,以及引申出的淘宝搜索反作弊机制与传统网页搜索反作弊的异同。

  二、网页作弊类型内容作弊:

  从大的分类来说,主要的作弊方法包括:内容作弊、链接作弊、隐藏作弊及近几年兴起的Web2.0作弊方法。笔者认为,内容作弊与现阶段业务息息相关,因此会在本文着重讲下此类型及相关的反作弊思路。

  内容作弊的目的是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的高排名。常见的作弊方式包括:关键词重复、无关查询词作弊、图片alt标签文本作弊、网页标题作弊、网页重要标签作弊及网页元信息作弊。通过这几种常见的作弊手段,作弊者的作弊意图不外乎以下几种:

  1、增加目标作弊词词频来影响排名;

  2、增加主题无关内容或者热门查询吸引流量;

  3、关键位置插入目标作弊词影响排名。

  Google在2011年2月高调宣布针对低质量网页内容调整排序算法,据报道此算法影响了大约11.8%的网页排名,而这项调整措施是专门针对以Demand media(创建于2006年5月,雇员500人,它的业务比较庞杂,包括域名注册、内容广告交易等。它的一个主要业务是,它有包括65个社会化媒体组成的网站群。)网站为代表的内容农场作弊手法的。

  内容农场的运营者廉价雇佣大量自由职业者,支持他们付费写作,但内容普遍质量低下,很多文章都是通过复制黏贴完成。但重点是,他们会研究搜索引擎的热门搜索词等,并有机的将这些词汇添加到写作内容当中去。这样,普通搜索引擎用户在搜索时,会被吸引进内容农场网站,通过大量低质量内容吸引流量,内容农场可以赚取广告费用。

  与传统的作弊方法相比,内容农场不采用机器拼接内容等机械方式,而是通过雇佣人员写作,这种作弊方式搜索引擎往往难以给出是否作弊的明确界定,但又严重影响搜索结果质量,所以是一种很难处理的作弊手法。

  三、网页反作弊技术的整体思路:

  目前搜索引擎作弊手段五花八门且层出不穷,作为应对方的搜索引擎,也相应调整技术思路,所以如果整理一下反作弊思路,则会发现技术方法很多,理清思路着实不易。尽管如此,如果对大多数反作弊思路深入分析,会发现整体思路上还是有规律可循。从基本思路角度看,可以将反作弊手段大致划分为以下3种:信任传播模型、不信任传播模型和异常发现模型。

  1、信任传播模型:在海量的网页数据中,通过一定的技术手段或人工半人工手段,从中筛选出部分完全值得信任的页面(可以理解为我们日常所说的白名单),算法以这些白名单内的页面作为出发点,赋予白名单内页面节点较高的信任度分值,其他页面是否作弊,要根据其与白名单内节点链接关系来确定。白名单内节点通过链接关系将信任度分值向外扩散传播,如果某个节点** 后得到的信任度分值高于一定的值,则认为没有问题,如果低于这个值则会被判为作弊。

  2、不信任传播模型:从大的技术框架来讲,与信任传播模型极其相似。** 大的区别在于:初始页面自己不是值得信任的页面节点,而是确认存在作弊行为的页面集合(即我们日常所说的黑名单)。赋予黑名单内页面节点不信任分值,通过链接将这种不信任关系传播出去,如果** 后页面节点的不信任分值大于设定的那个值,则被判为作弊。

  3、而异常发现模型:简单的譬如分析网页内容来发现词频、链接等的异常,复杂点的像分析网站用户行为异常等。异常发现模型往往和信任传播模型和不信任传播模型进行组合处理。

  事实上,纯粹技术手段目前是无法**解决作弊的问题,因此现在一般都是用户在浏览搜索结果甚至是上网浏览时举报作弊网页,搜索引擎公司内部会有专门的团队来审核与主动发现可疑页面,经过审核确认的网页则可以放入黑名单或者白名单当中。综上所述,必须将人工手段与技术手段相互结合,才能取得较好的反作弊效果。

  四、通用链接反作弊方法:

  1、TrustRank 算法 (属于信任传播模型)

  2、BadRank 算法 (属于不信任传播模型,据传是Google采用的反链接作弊算法。 注意:不要链接给作弊页面)

  3、SpamRank (属于异常发现模型)

  SpamRank 的基本假设是:

  3.1、对于正常页面来说,其支持者页面的 PangRank 值应该满足 Power-Law 分布,即 PR值有大有小。

  3.2、作弊网页不同,一般具有如下3个特点:

  Ⅰ、支持者页面数量非常巨大

  Ⅱ、支持者页面的 PangRank 值得分都较低

  Ⅲ、支持者页面的 PangRank 值都落在一个较小浮动范围内

  五、专用链接反作弊技术:

  1、识别链接农场:

  、网页出链的统计分布规则,作弊网页出链不符合 Power-Law 分布

  Ⅱ、网页入链的统计分布规则,作弊网页入链不符合 Power-Law 分布

  Ⅲ、URL名称统计特征,作弊网页的网址较长,包含更多的点画线和数字等

  Ⅳ、很多作弊网页的URL地址尽管不同,但是对应同一个IP地址

  Ⅴ、网页特征会随时间变化,比如入链的增长率、出链的增长率等

  Ⅵ、链接农场的结构特征,农场内的网页之间链接关系非常密切

  2、识别 Google 轰炸:

  判断锚文字是否和被指向页面有语义关系

  六、识别内容作弊:

  1、重复出现关键词,判断文本内一定大小的窗口中是否连续出现同一个关键词

  2、标题关键词作弊

  3、统计正常页面中句子长度的规律、停用词的分布规律、词性的分布规律等

  七、反隐藏作弊:

  常见的隐藏作弊方式包括页面隐藏和网页重定向。

  1、识别页面隐藏

  对网页做2次抓取,第1次数正常的搜索引擎爬虫抓取,第2次模拟人工访问网页的方式抓取。这种方法成本非常高。

  2、识别网页重定向

  Strider 系统给出了根据网页重定向来识别到底哪些是作弊网页的解决方案。

  八:石榴算法简介:

  2013年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面。百度称此举是为了尊重搜索的用户,净化互联网生态环境!

  发布时间:2013年5月17日

  打击对象:针对大量妨碍用户正常浏览的恶劣广告的页面、低质量内容页面。石榴算法针对的尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表。与之前百度绿萝算法相对应,这正是百度搜索引擎提高用户体验,提高搜索质量的有力手段。2013年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面。百度称此举是为了尊重搜索的用户,净化互联网生态环境!

  整改建议:有弹窗广告?且在主体内容位置显示?赶紧撤掉吧、短期利益是获得了、长期就不讨好了、就如一次借钱忘了还、感觉像是赚到了、实则不然、你的信誉度在他人心中逐渐在减弱……这类型的页面评分也会被降分

  更多算法解读请点击“谷歌、百度搜索引擎近几年算法大盘点(持续更新...)”查看

如何优化:
婚恋网站建设 舟山网站开发服务商 成都做网站建设 购物街网站建设 梅州网站开发加盟代理 盐城建设局网站 网站改版亮点怎么写文章 怀化网站定制怎么收费 php网站开发招聘 cms搭建网站
总访问数:49012756 文章总数:13698 建站天数:3379
相关阅读
01
优化新手如何避免seo误区
  优化新手如何避免seo误区1。4。Seo新手如何避免seo误区SEO新手如何避免seo误区,大多数优化新手在接手工作初期都会遇到这样的问题,导致关键词排名时间延长以及出现各种问题,那么我们在seo网站时候如何去避免走入SEO误区呢。3。首页的TDK千万不要经常改动,对于搜索引擎首页如果被抓取收录,这样搜索引擎蜘蛛会在抓取一次,重新决定排名,同时延缓百度对网站收录......[详情查看]
02
优化网站要如何才能够添加优质的外链呢
  这个主要是黑帽和白帽的问题,一般如果是同一时间大批量对同一页面进行外链的处理,会在短时间内将这一页面这一关键词推到顶点。那么,网站进行seo可以分为内部seo和外部seo,其中外部seo** 为主要的就是外链的发布。做外链一定是要被收录才能效果的。从事优化的人都知道“内链为王外链为皇”内链和外链缺一不可。如果是普通的随意的发布外链,根本就没有收录,就不会有任何效果......[详情查看]
03
有利于网站seo排名的方式
  ** 先我们能够去公布某些高权重值的外部链接这种外部链接针对网站的排行是拥有十分关键的功效的,能够说网站的提高因此和外部链接的品质和总数都拥有必须的关联,因而我们必须要挑选某些较为高品质的服务平台来开展公布,我们的链接。挑选1个较为好的程序流程,针对网站排行来讲,我觉得** 先首先就是说收益,也许网站的程序流程出现了难题,那么即便网站的內容再多,收益都是十分棒的,这时我们要挑选1个独创性较为高的模版,还可......[详情查看]
04
网站seo见效慢怎么办?
  这个行业本身已经变得更具竞争力。一、不断更新的搜索引擎算法系统网站建成后,即使不做竞价推广,也要做seo网站优化,否则网站就不会起到实际作用,产生实际效益。一些新的搜索引擎正逐渐吸引更多的在线用户群,使得更多的在线客户被大量转移。在回归之前你要做的就是坚持下去。三、网站内部的一些原因1、建站成功后,没有及时seo,没有保持稳定优质的内容发布,网站排名没有上升,** 终导致关键词排名失败......[详情查看]
05
seo文章的必要性
  在百度付费账户或者是一些工具我们可以看到客户群体的搜索时间段敲定时间段之后,我们可以在这个时间段前把文章发布出去,我个人喜好发布的时间一般都在上午十一点之后,或者是下午五点之后,因为我觉得这段时间同行差不多都已经下班了,这个时间段发布文章可以避免抄袭的可能,发布文章可以在上午或者是下午各发两篇。不断学习相信在互联网上就很多的哦。不断学习相信在互联网上就很多的哦。文章的** 后也可以插入一张联系客服的图......[详情查看]
06
企业网站优化搜索引擎优化如何做?
  企业网站优化搜索引擎优化到位一切皆有,如何做好企业网站的网站排名是困扰大部分优化从业者的问题。net、。因为会穿插很多的内容模块,这是宣传和内容排版需要的。一个优质的网站就少不了优化seo,只有这样做好的seo工作,网站的网站排名才会出现在前面,才会有大量的搜索流量出现。在这里要提醒一下,注册域名时要看看有没有人用过,不然会被惩罚,可以去反链查询或者是site域名查询,要是遇到一个老域名的话,在s......[详情查看]
07
如今优化网站seo趋势
  以上就是关于“如今优化网站seo趋势”的相关内容。第四:语音搜索功能语音搜索会是将来新潮的一种搜索方式,这样能够更直观的了解用户的意图,当然这也会给优化seo带来极大的挑战。如今优化网站seo趋势互联网的不断发展,使很多不同的企业都加入了互联网运营的行列当中。针对此类问题,下面我们一起来分析一下如今网站seo趋势。比如:用户搜索优化入门教程而搜索出来的内容大部分是优化培训公司的话,这就违背了用户搜......[详情查看]
08
企业建站快速收录及方式
  一,站内文章的更新。一,站内文章的更新。1,文章原创性一定要高,** 好是手动更新,一个字一个字的敲上去,不建议使用伪原创工具,因为搜索引擎现在比较智能,可以根据语句顺序判断你的内容是否使用工具伪原创过,同时优化,也不要存在侥幸心里,伪原创过的文章即使被收录了,搜索引擎也会根据其判断原则判断这篇内容的原创性,并给与一定权重,不是说收录了就代表他认可你的内容是原创的,** 有效的方法还是站在用户的角度上创作......[详情查看]