关于新建站点如何快速的被百度收录,是很多SEOer在网站刚刚上线时最为关注的一个问题。并且收录的快慢也成了领导频繁追问的一件事,那如何通过使用百度链接提交工具快速的收录我们的新站呢?
在介绍链接提交工具之前,最先开始做的就是在百度站长平台对新站点进行验证,只有验证成功后我们才能使用百度站长平台的链接提交工具以及其他的更多工具。验证新站点的基本流程如下:
1、登录百度站长平台(http://zhanzhang.baidu.com/)后,选择左侧“我的网站”栏目目下的“站点管理”选项,然后右侧点击“增加网站”如下图:
2、这时,跳到添加网站的环节中,分为两步,一是输入你新站的域名,再进行对网站的验证工作,如下:
上图中,重点需要说明一下,如红框中的文字,最好是验证我们的主域名(像www.zhaopin.com这种)这样后续再添加二级域名的时候直接选择子链添加即可,不用再对网站进行验证。另外如果主域名是vip站点,该子域名也会继承主域名的vip权限。否则就要单独进行验证,也不会有这种vip权限继承的能力。输入主域名之后我们直接点击下一步,选择我们验证网站的方式(文件验证、HTML标签验证、CNAME验证),并按照说明部署到我们的站点,点击验证按钮。
当网站通过验证之后,我们就可以使用链接提交工具了,目前链接提交工具分为自动提交和手动提交两大块,手动提交顾名思义自己手动复制粘贴去提交,相对简单,我就不做过多说明。而自动提交中又分为:sitemap、主动推送、自动推送三种方式。三者都是将站点自身的URL自动推送至百度,而后等待百度爬虫进行对页面的抓取。最终的目的是一样的。如果对这三种自动推送的安装方式不熟悉的话,可以参考该链接(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2)进行配置安装。本文我重点聊一下三者的注意事项和区别:
Sitemap提交:在配置sitemap文件时,无论是txt格式的文本文档还是还是xml格式的文件。都不建议将其sitemap的文件名命名为sitemap.txt或sitemap.xml这么大众化且谁都能够知道的文件名。如果你这样设置,你的竞争对手或需要你网站内容的人很容易就能拿到你所有的页面url。出于保险起见还是使用一些自己定义的较复杂的文件名。每一个url都必须包含http://,文件中包含的url不得超过5万条,单文件大小不得超过10MB,一个站点最多提交5万个sitemap文件,超出5万个不再处理并会提示“链接数超”。如果是通过子域名的形式验证的站点。那么主域名下的sitemap文件是可以包含该域名下的所有域名的url的。
主动推送:对比sitemap而言在及时抓取上推送更快、发现更快、抓取更及时。如果是时效性文章不排除其收录速度达到一瞬间的效率,这里特别建议一下,最好是主动推送我们网站第一时间产生的新内容给百度其效果更佳;主动推送是有推送数量的限制,尽可能的不要推送重复的内容给百度。这样会大大浪费自己的可推送资源。
自动推送:是我们将一段js代码部署到我们的每一个网页中,当有用户进行访问时,触发了这段代码,这段代码自动将当前页面的url推送给了百度。需要注意的是这段代码无论是在PC站还是在移动站均可使用。是一个非常及时、便捷的轻量级链接推送工具。
在6月22日的时候,智联招聘上线了一个新的站点。该站点实际上是在21日上线的。但由于还要线上调试,在21日是robots封禁了所有爬虫的抓取。却由于网站早在建设时就添加了自动推送的代码,然后造成了21号上线,还没有解禁爬虫,百度爬虫就来抓取了,并且收录了首页。如下图(负责该站点的同事保留了截图):
所以大家也看到了,由于自动推送的安装,网站只要被访问,立刻就推送给了百度,爬虫第一时间抓取,然后快速收录,这效率,还能有谁?
这只是第一天21号,然后在22号我们又将主动推送配置上了。然后其效果在百度站长工具的抓取频次中是可以看到的,如下图:
这是新站上线第二天,主动推送配置后的第二天,我们把事先准备的内容页以及列表页都利用主动推送一次性进行了推送。然后上图就是其明显的效果了。当然后续抓取的下降也是和我们每天发布的文章数量有直接关系。在6月28日又提交了sitemap,当天的抓取如上图结尾处,又涨了上来。下图是爬虫访问sitemap所提取的url数量,其效果不明觉厉!
当然,为什么三者建议一起使用呢?下面说下Sitemap、主动推送、自动推送的区别:
sitemap是一个可以容纳大体量、历史数据的容器。它将我们网站所有的url装在了里面。个人觉得快速的抓取并不完全指望sitemap的提交方式,但对于已经产生的文章、现有的列表页、tag标签页等都是最佳的选择,当我们的页面发生变化时,主动推送并不一定会再次推送,因为毕竟主动推送承担更多的是对新产生页面的及时推送,最重要的是有最大推送数量的限制;再说自动推送。如果你对历史页面进行了修改,没有被访问。那么根本不会触发自动推送js代码,当然也就不会推送给百度。所以,归其根本,sitemap是对已经产生的文章页、现有的列表页、tag标签页最大的助推工具。
主动推送,虽然有推送数量上的限制,但我们推送后的抓取速度已经通过智联招聘的新站例子很好的诠释了。所以主动推送更多的应该承担对新产生的URL的及时推送作用。
自动推送,页面被访问了,就会被推送过去。那么被访问的和没被访问的就是热门页面或冷门页面的概念。冷门没被访问我们有sitemap,以及冷门页面产生时的自动推送。但对于热门页面,用户都喜欢的页面而言。在搜索引擎上也会有很大的需求,这类页面是我们获得流量的重要页面,他们如果没有被收录,除了sitemap、主动推送外,还可以更频繁的利用自动推送进行推送。这样被抓取或者收录的几率又会大多少呢?而且这个相对sitemap和主动推送实现的成本更低些,加段代码就搞定,何乐而不为呢?
所以,综合上述的案例也好,三者的区别也罢。强烈建议你将其三个自动推送工具进行安装,并让三者协同工作,将抓取和收录价值最大化。
(编辑:小酷)
扫码添加客服微信
扫码关注公众号
酷网(大连)科技有限公司
致力于为客户品牌提供完善解决方案
统一服务电话:0411-62888851