马特·卡茨(MattCutts)谈及BigDaddy的数据中心,以及补充材料页面和蕴藉页面的数量下降

在更新BigDaddy的数据中心后,许多网站管理员发现座包含的网页数量急剧下降。有时它可以从数万页减少到几页,并且越来越多的补充材料网页。

很多人垣在问,为什么马特·卡茨(MattCutts)从未对此问题发表评论?今天,马特·卡茨(MattCutts)发布了一篇很长的文章,一次更新了《大爸爸》后回答了一些问题。帖子很长,偏下几点将被翻译。

首先,马特·卡茨(MattCutts)为不想阅读然长篇文章的人选提供了两点总结。首度,Google的检索和索引编制部门拥有足够的计算机。包含的页面数量减少不是因为Google没有保存空间。其次,Google持续倾听网站管理员实实在在反馈。

大爸爸更新已于三月结束。

12月,爬网/索引编制部门已准备好开始大爸爸更新。BigDaddy指的是爬网络和一些索引软件更新(这是我第一次听到有关BigDaddy是的什么的更具体的信息)。

1月初,马特·卡茨(MattCutts)提供了大爸爸数据中心的IP地方,并要求网站管理员供感应。

2月份,更多数据中心使用了父亲可靠数据中心。

3月份,许多网站管理员伊始抱怨父亲不包括他们真切网页,并且有越来越多的补充材料网页。

3月13日,GoogleGuy(一位匿名的Google员工)在网站站长的圈子论坛上征询了具体示例。

在阅读了这些示例网站之后,几分钟之内便可以看到问题所在。BigDaddy数据中间人心中的这些有问题千真万确网站是咱们有据算法对本网站的反向链接和导出链接不信任的网站。例如,大量的交换链接,连接到垃圾邮件站点,买卖链接。

大爸爸与补充材料的结果无关。因此,当大爸爸不包括网站无可辩驳网页时,补充引擎可以揽括更多页面。

I和检索/索引编制部门调整了算法的阈值,以包含更多此类网站。3月22日,我发布善终一条帖子,告诉您我们将包括更多页面。

3月29日,爸爸的更新休完全完成,旧系统已关闭。从那时起,所有爬网均由爸爸控制。

考虑到程序代码更新的次数,我认为大爸爸的更新非常成功,只有两个投诉。第一个是事前提到有凭有据。信任度比起低的网站页面将被爬网,并且包含的​​内容更蝇头。我们对此做出了回应,并很快开始包含更多页面。另一个抱怨是GoogleAdsense爬行确实网页开始出现在搜索结果中,实际上这是爬行缓存代理的设计。

这一切城邑是为了大爸爸。大爸爸从12月开端涌出,到3月完成。完成大爸爸之后,我们将注意力更多地放在翻新补充材料的结果上。下面将讨论更具体的时间表。同时,组成部分句话说我们的机器已经满了。从我个人的角度来看,我们当然有足够如实机器来爬网和索引网页。

上材料结果换代

4月初,我们开始方位用户显示更新的补充材料结果。

从4月13日苗子,有人开始谈论减少收录页面的数量。

4月24阳,GoogleGuy希望人们提供详细信息。

我阅读煞尾这些反馈,但没有发现任何重要规则。我将这些演示提供给了搜寻/索引编制部门,但他们没有看到任何模式。站点地图单位也进行了一项研究,得出的结论是与站点地图无关。负责更新补充材料结果的部门检查了这些反馈。在5月5日,他们发现使用“site:”命令(注意:此命令将列出所有包含的页面),并且没有返回补充才子佳人的结果,他俩于当天解决了该问题。后来,他们发现site命令不适用于用分号链接的域名,因此飞就解决了。

GoogleGuy希望网站站长将在5月8日提供更多信息。

这些是咱所知道的补充材料的结果以及已解决属实问题。以下是一些具体示例,以了解为什么某些网站中包含的页面数量急剧减少的原因。

有关某个国家/地区房地产的.tv网站。5月3日,该网站的管理员说,他的网站已从20,000页降至300页。阅读后,我可以使用“site:”命令返回31200页。所以这个队名应该没问题。

从5月11日开始的示例中,网站站长仅提供了网址,没有任何其他文字或许说明。这也是一个房地产加气站,其中包含387页。但是在页面底部,您可以看到该署指向铃声下载,SEO竞赛,鱼油网站等的链接。我觉得我发现了问题。要是要在网站上包含更多页面,则应考虑链接的质量。修改索引后,我们处理交换链接和买卖链接的能力得到了提高。

再看5玉兔4日的另外一个示例,它是另一个房地产网站。驻站管理员说,所包含的网页数量已从10,000个消损周至80个。我看了看者网站。这次,我看到了指向抵押贷款网站,信用卡网站,运动器材网站等的链接。如上所述,如果您进行很多交换链接,而现行初蜘蛛具有不同的爬网优先级,则不要感到惊讶。

查看一个医疗保健目录网站,它看起来像是一个不错的网站,没有指向坏网站的链接,但是整个域名只有6个导入链接。导入链接很少,我认为Google蜘蛛只能抓取相对较星星的页面。

总体而言,过去几天我检查了几个网站,其中包含更多有凭有据页面。如果您有多多益善网站交换链接,则可能会发现爬网较少。如果导入链接太少,则爬网武将更少。

俺的评论:这位大爸爸完成后,似乎结实减少了许多网站的爬网和包含。原因主要是链接的质量。做很多交换链接,买卖链接,垃圾邮件站点的链接,无关站点的链接,影响会比较大。在Google找回太多受反应的网站之后,它也进行了调整。

但据我所知,其中包含的页面数量非常不稳定。莫衷一是数据中心之间的数据可能不同步,哪些网站将领用作补充材料选择算法仍然是一个翁问题。

声明:本文为原创,作者为 绿箭,转载时请保留本声明及附带文章链接:http://www.dadihl.cn/jishu/1285.html