网站内容相似度高怎么办
一些站长做站群,总是担心页面的相似性,认为如果控制在合理的范围内,就不会受到处罚。事实上,百度仍有自己一套惩罚网站的方法,那么如何处理网站相似度高呢?
一、301
绝大多数具有所谓页面相似性的网站都是由于301差造成的。例如,有www和没有www的域名有100%的相似性;有后缀的页面如.html和.php类似于没有后缀的页面。学位也是100%。这被认为是作弊,基本上不会给你一个好的排名。
这种情况得到了更好的解决。如果发现自己的关键词排名还没有上去,这些网址都会尽快重定向到主网址,以减少被欺骗的风险,同时也减少权重分散。
二、二级域处理
不同地区的二级域名也会遇到类似的情况。一定要让内容不同,否则会有被K的风险。
如果在某些测试中使用的二级域名没有及时阻止蜘蛛,那么这些二级域名将不会在将来使用。删除快照引用文章“完全阻止已包含的不需要的二级域名的有效方法”
三、页面处理没有太大的不同
机器和设备网站上的每个产品可能有不同的图片、参数和尺寸。其他内容和布局相同。这也很麻烦。你可以参考淘宝的方法。这样的产品可以放在一个页面上,用户可以选择购买。。当然,如果没有购买功能,就没有必要区分这么多参数。
一些CMS管理更到位。内容页面模板是随机选择的,再编写几个模板来区分html标签、标题、关键字和描述,这样也可以降低高相似度的风险。
四、内容盗窃和复制的处理
一些知名网站在不保留版权的情况下,盗用了网民的辛劳文章。这是件很烦人的事。联系那些不为你工作的网站管理员。当你心情好的时候,你会删除或者增加你的版权,但是大部分都是杨白劳。
很多时候,你网站上原创文章的排名都不如别人盗用。这是正常现象。尽管百度现在大力推广自己的原创版权保护,但仍处于测试阶段。
五、根据评判标准,应该与线下版权过程类似
① 相关出处
如果你有自己独特的标签,网站链接,网站名称,你可以证明这是你的文章;
② 提交时间
目前,百度链接提交内容的方式比较丰富,但** 直接的是主动推送和自动推送。具体实现方法请参考官方说明,或参考文章《新网站快速增加优化索引量文章链接推送百度》;
③ 蜘蛛爬行时间
蜘蛛有时会努力抓取内容,但会及时发布快照,这也证明了内容比一些抄袭网站要早。
六、增加抄袭和采集成本
对付这种抄袭,一般只能通过JS禁止抄袭、禁用右键、屏蔽对方IP等方式来实现,这些都局限于低级的抄袭,使用收集工具是可以的。只要你能看到源代码,什么都不是问题。
我们只能增加对方的获取成本,比如在图片中添加自己的水印,而简单地用对方覆盖你的水印可能会让网友怀疑内容的真实性。
尝试引用CSS样式。如果对方过去抄袭,那就很难读了。例如,内联样式可以使字体非常小,这使得很难正常读取。具体实现方法或咨询成都优化