如何防止网站被采集

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

如何防止网站被采集一、网站被整站采集了每一个站长的网站都是都是很用心的建设的,甚至内容都是自己一篇一篇的原创的,对待自己的网站就像对待一个还未成熟的婴儿,谁成想还没长大成人被人抱走了。最烦人的莫过于辛辛苦苦建设的网站,一朝之间被人全盘采集,去掉你的链接,改掉你的名称,最最让人恼火的是采集生成的网站还和你的完全同步,你更新他更新。你的网站还没收录就被对方采集过去了,还有比这更加让你恼火和愤怒的吗?我每天关注着我的网站,在批量采集的第二天就被我发现了,统计工具中发现网站被采集通过百度统计我发现流量暴增,而且还是同一个域名来的,点开之后就发现了这样的一个和我的网站网站相同的网站,而且通过统计工具可以发现,对方是通过换IP的形式采集网站的,这种形式连封掉对方的IP都没办法做到。所以通过封掉IP的形式做不到防止对方继续采集我的网站。采集生成的网站和我的网站完全相同。二、查询被采集后的解决办法说实话碰到这样的情况,我有些不知所措,因为我的网站前段时间改版过,至今才收录了一个首页,如果网站被采集了,如果被收录的话,那么接下来对我的网站来说是一个无法承受的打击,遇到这样的情况,我马上向别人请教,而别人的回答是如果被收录了直接向百度等搜索引擎投诉。但是,对于主动出击和等到采集站被收录以后才去投诉,那为什么不能在对方网站被收录之前出击那?1、但是在我查询了很多资料之后才发现,防止采集的办法基本上不能从根本上禁止采集的办法,而大多数的方法就是提高采集者的工作难度。2、采集网站采用采集的办法无非就是节省劳动力,想不劳而获。这种人在什么时候都是不被欢迎的,这里不去对这种人指责了,我们在这说的是如何提高采集者的工作难度,让他采集我们的网站会非常非常麻烦,麻烦到采集一篇文章的工作量和写出一篇文章的难度相当的时候,那么渐渐的他就不会再来采集我们的网站了,3、我们不禁止网站内容被手工复制,但是绝对讨厌被软件采集。网站的内容被手工复制这个我们没有办法绝对禁止的,但是手工复制没有软件采集那么让人讨厌,如果复制的人人品过关可能会留下原文地址,这样反而会给我们的网站留下一个外链,这是我们不会禁止的,当然人品不过关的我们没有办法禁止了。三、我的网站采用的解决办法对于这样的问题我以前没有遇到过,因为以前也没有搭建过自己的网站,现在遇到了,只好摸索着解决这样的问题,我用三种办法对待网站被采集的问题当然,最后成不成功无法预料,但是SEO笔记也是在摸索中前进的,至少这次遇到这样的问题对我来说是一次经验,一次不成功可以继续寻找其他的办法。1、直接发邮件通知采集网站的本人。那么我是如何找过采集网站的本人的那?其实也很简单。通过查询域名的所属,就可以查到域名的所属人的姓名和邮件,通过查询采集站域名信息找到对方的邮箱2、添加织梦网站防采集混淆字符串这个应该是织梦网站独有的,网站后台就可以找到,添加织梦网站防采集混淆字符串防止采集,但是这一种办法不能出现太多,不然就和关键词不好是一样的效果了,我们要绝对不能太多,出现一次两次即可。这种办法呢并不是太好的办法。生成页面以后会出现在页面中,织梦防采集混淆字符串出现的样式。3、使用防采集代码这种方法可以防止低级的采集工具的采集,不能防止高级的采集工具,但是对于采集者来说,高级采集工具通常都是需要花钱的,提高了采集难度。比如我们在文章的开始div中添加这样的代码:id=”{dede:field.id/}”这样就会让这篇文章产生独立的代码,在燕子SEO的微博博客中,因为每篇文章的ID都是独立的,所以每一篇的内容的DIV里的代码也就不一样,这样就会提高采集难度。而且,这种方法会让采集者一次只能采集一篇文章,大大的提升网站采集的难度。当然这样的三种方法也许不一定十分有效,但是我还在研究,对着这种想着不劳而获的人来说,是绝对让人讨厌的。也许等到对方收录了,接着举报也是一条路径,但那是在这个采集站被收录以后的操作了,如果大家有好的方法,欢迎提出来。

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功