我们经常说到黑帽SEO策略,以及内容抓取的例子。其实内容抓取行为就是使用自动化脚本,从其他网站复制所有的内容,最后对其进行克隆重建。最近,我们的客户有许多都遭到了这类攻击。
今天我们来看看这种攻击的升级版,克隆版网站的搜索结果和排名代替了原网站。这些克隆的网站为了做谷歌内容排名,产生了虚假的流量,并在克隆网站上修改了内部反链。最后,克隆网站不会再有链接指向原网站。
搜索引擎是如何根据内容排名的
搜索引擎的宗旨,是想要在搜索结果里下功夫,给用户返回内容相关性和客户体验最好的网页。因此,内容相同和相似的网页,可能占了超过一页的搜索引擎返回内容。当然,也有可能搜索结果里排名高的,并不止一个网站。搜索引擎考虑的因素之一,是网站的有效流量,这能辅助搜索引擎决定该网站所占的排名。除此之外,谷歌会使用重定向跟踪搜索者点击的结果,以及用户是否会继续点击其他搜索结果(没有找到需要的内容,用户应该会继续点击)。
根据2013年Chitika的研究表明:
谷歌列出的第一个搜索结果,平均大约能分到来自搜索引擎的92%的流量。
做SEO的人员自然希望在搜索引擎中得到最好的结果,以保证他们的行动成功,或者获得尽可能多的收入。当然,有时候他们只是为了损害目标站点的SEO效果。
克隆网站的影响
黑客采用内容抓取的战术,通过复制你的内容去迷惑搜索引擎,使其无法确定权威的文章来源。这种攻击是最糟糕的,当你注意到它的时候已经太迟了,此时你的搜索排名会下降,或者你会看到自己原来的排名替换成了其他的克隆网站。
我创建了一个场景来更好地演示这种攻击,假设受害者的网站是“hack”,我的网站是“attacker”。这里我的网站是克隆来的。下面是效果图,攻击前和攻击后的对比:
在图片里我们可以发现,黑客已经将克隆的网站代替了原网站在谷歌搜索的排名位置。
处理这个问题有很重要的一步,我们需要发现自己网站内容是如何被剽窃的。
如果你的网站内容的改变,能引起克隆网站的即时改变,那就意味着黑客使用了自动化脚本。
如果你的网站的内容已经进行了更迭,但是克隆网站上没有改变的话,那黑客可能存储了网站数据。
下面,我将详细讲述为什么这个问题很重要。
网站如何进行抓取
为了演示这种攻击,我们来看看咱们的开发人员(Lee Howarth)的脚本:
在代码方面分析的话,克隆网站会抓取原网站的所有内容,而且能保证用户能正常使用。当然,它也可以做的比这个更简单,只需要内容和要点,就能进行广告推广了。
代码已经准备好,下一步就是借助谷歌,尽可能提高克隆网站的点击量。这样做的话,才能引起搜索引擎的注意。一旦有效点击量足够高的时候,克隆网站就会取代原网站。为了得到足够的点击量,黑客会使用黑链,或者雇佣专业赚点击量的公司进行实施。
一旦他们窃取了你的成果后,他们可以骤然变身为任何形式的恶意网站,做挂马钓鱼等等攻击。
这样算是被黑了么?当然不是,但你的网站收到了影响。
那么如何反抗呢
我们可以从以下几个方面来解决问题。
1.在每个页面都加上rel=canonical:这个标签会告诉搜索引擎爬虫内容所属域名,详细介绍见这里。这个标签是许多SEO插件,以及相关从业者都会默认添加的。
2.联系受害者的网站:正如我上面提到的,黑客会利用别人的网站来攻击你的网站。你完全可以利用whois和社交信息与受害站长取得联系,让他们进行修复和安全防护。当然,这也算是做好事吧。
3.找出克隆网站的whois信息:你可以找出克隆网站的whois信息,揪出黑客并想法子联系其网站服务提供商,让其停止该网站的服务。如果该站点使用了CDN或者WAF,那么请别犹豫,直接联系CDN/WAF供应商,这样他们可以直接将请求转发给原始主机商,或者直接对目标采取行动。
4.设置谷歌提醒:你可以在谷歌上有精确匹配你自己的网站文章标题时,对自己进行提醒。在文章被剽窃后,你就会及时收到提醒。这项功能是免费的,它能在事情变得糟糕之前让你有时间解决它。
5.阻止来自克隆网站的请求:在你获取到克隆网站的IP后,你可以要求自己的主机托管商阻止该IP的请求。当然,还有更好的方法,那就是在.htaccess里面添加几行。假设克隆网站的IP是192.168.190.190,你可以添加下面的.htaccess:
order allow,deny
deny from 192.168.190.190
allow from all
6.将克隆的的内容报告给谷歌:一旦确认了你的网站内容被克隆,你可以去谷歌DMCA页面或者直接访问这里,选择“Web Search”。确认填好一切表格后,将它提交给谷歌官方进申诉,过几天这些克隆网站链接的排名就会被移除,你的流量自然就回来了。
如果黑客使用了自动化脚本内容进行直接克隆,ban掉了克隆网站的IP只能阻止内容的泄露,却不能及时返回你的排名和流量。当然,如果你对这些不太着急,这还是一个很不错的解决方案。
如果你的内容已经被盗,你可以试试上面的办法,让问题尽快解决。
保护你的网站SEO防止被盗
没有100%防止内容抓取的办法,大多数的黑客总能找到办法来绕过你的保护。有许多服务,如Grammarly和Copyscape,你都可以用来发现自己网站的内容是否被剽窃。或者你可以从你网站的某篇文章的某一行,直接加上引号拿去谷歌搜索,应该会有相应的收获。
受到SEO攻击,你并不应该觉得自己的网站很脆弱,但你需要定期地对自己的网站进行检查,并且改善其安全状况。其实还有很多方法能从搜索结果页面(SERP)消除盗链,比如上面提到的一些点。
如果你专注于这行业的竞争,常规内容审查和内外部重复检查,应该成为你SEO策略的一部分。
(编辑:小酷)
扫码添加客服微信
扫码关注公众号
酷网(大连)科技有限公司
致力于为客户品牌提供完善解决方案
统一服务电话:0411-62888851