Google索引诀窍揭秘

标签: google 索引 揭秘 | 发表时间:2012-08-08 16:37 | 作者:joydandan
出处:http://googlechinablog.blogspot.com/
发表者: Kristen DwanVictoria ShanJavier Tordable,网站管理员工具团队
原文: Behold Google index secrets, revealed!
转载自: 谷歌中文站长管理员博客
发布时间:2012年8月8日 下午 03:09:00

自从Googlebot问世以来,世界各地的网站站长们一直在问这样一个问题:Google,我的网页被索引了吗?现在,有了网站管理员工具的新 “索引状态”功能,是时候回答这个问题了。不管是一个还是一百万个,“索引状态”都会清楚地告诉您 Google索引中收录的您的网页数量。

“索引状态”选项位于“运行状况”菜单下。点击后,您会看到如下统计图:


这份统计图显示了目前索引的网页数量。图例表明的是最新统计数目,曲线图则可展示长达一年的数据。

如果您看到索引网页数量持续稳定增长,那么祝贺您!这就足以证明您网站上的新内容已被Google发现、抓取并索引。

不过,也许有人会发现一些问题,有待深入探究。所以我们在该功能上添加了一个“高级”选项。您可以通过点击顶部的按钮访问,进入后会看到如下页面:


“高级”选项中不仅会显示索引网页总数,还会显示抓取页面累计数量、被robots.txt文件拦截而未被抓取的网页数量,以及未被选入搜索结果中的网页数量。

请注意,所有的计数都是总数。举例来说,在6月17日这一天,如果显示的索引网页数量是92,这意味着在当前时间点共有92个网页被索引,而不是说当天只有92个网页被添加到索引中。特别是对有着悠久历史的网站来说,抓取的网页数量可能会远远大于索引的网页数量。 这些数据都可用来识别和解决各种与索引相关的问题。例如,如果您的某些网站不再出现在Google搜索结果中,且您注意到被索引网页的曲线图出现骤降点,这可能表明您在使用meta=”noindex”的时候出现了涉及整个网站的错误,导致Google无法将您的网站内容包含在搜索结果中。

再举一个例子:如果您改变了自己网站的URL结构,并且没有按照我们提供的关于 网站迁移的建议进行操作,那么您可能会看到“未选”(“Not selected”)这一项的计数出现大幅下降。在这种情况下,应该修复重定向或rel=”canonical”标签以获得更好的索引覆盖。

我们希望“索引状态”功能可以提高Google索引选择过程的透明度,帮助您识别并修复网站的索引问题。如果您有任何疑问,请随时登录我们的 帮助论坛进行咨询。

相关 [google 索引 揭秘] 推荐:

Google索引诀窍揭秘

- - Google China Blog
发表者: Kristen Dwan, Victoria Shan, Javier Tordable,网站管理员工具团队. 原文: Behold Google index secrets, revealed. 转载自: 谷歌中文站长管理员博客. 发布时间:2012年8月8日 下午 03:09:00. 自从Googlebot问世以来,世界各地的网站站长们一直在问这样一个问题:Google,我的网页被索引了吗.

揭秘今日Google首页神奇涂鸦

- Droking - cnBeta.COM
打开Google首页,你会发现今天的Google涂鸦(Doodle)很奇怪. 今天的涂鸦是为了纪念美国著名雕塑大师亚历山大・考尔德(1898-1976)诞辰113周年. 实际上,去年的今天,Google就在首页上采用了看似相同的涂鸦. 与去年不同的是,今年的涂鸦是动态的,你可以使用鼠标拖动旋转. 这个涂鸦就像是悬在屋顶的雕塑,用一根细绳挂起.

揭秘山寨城的 “低等” Google 员工

- 圆圈 - 谷奥——探寻谷歌的奥秘
前Google员工Andrew Norman Wilson发了一篇博文,揭秘了山寨城的“低等”Google员工. 他们的工作就是成天为Google Book Search手动扫描图书,Andrew Wilson称他们凌晨4点就要上班,下午2:15才收工离开. 他们同时受雇于Google和Transvideo Studios两家公司,工作地点就在距离Google总部山寨城不远的地方,楼号是诡异的3.14159.

Google式的搜索引擎实现

- - 行业应用 - ITeye博客
Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中.   Nutch 0.8 完全使用Hadoop重写了骨干代码,另有很多地方作了合理化修正,非常值得升级.

Google搜索引擎架构Caffeine

- - 标点符
什么是 Google Caffeine. Google Caffeine 是 Google 搜索引擎的一次架构重构,旨在满足不断增长的互联网内容和用户实时搜索需求. 它替代了 Google 早期的分层索引系统,转而采用更加实时的索引机制,使搜索结果更加快速和新鲜. 发布时间:Google 于 2009 年 8 月发布 Caffeine 项目 Beta 版本,并于 2010 年 6 月正式启用.

Google Plus 第三方搜索引擎:Google Plus Search

- 老男人 - cnBeta.COM
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要搜索 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. 目前有一些非官方的 Google Plus 搜索应用,例如 Google Plus Search.

第三方 Google+ 搜索引擎 Google Plus Search

- Ivy - 谷奥——探寻谷歌的奥秘
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要扫过 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. Google Plus Search  是一个非官方的 Google Plus 搜索应用,支持中文.

重磅|老司机独家揭秘Google的软件工程实践

- - IT瘾-tuicool
新盆友点击上方蓝色“网路冷眼”订阅;老盆友点击右上分享. 导读:老司机  Fergus Henderson 已在 Google 工作了 10 年以上,拥有超过  15 年的商业类软件的行业经验. 本文梳理并总结了 Google 软件开发中的关键工程实践,并揭示了其成功之道,值得业界各路人马参考借鉴.

谷奥: 【置顶】Google+ 社交网络资讯索引贴

- Dolphin - 谷奥聚合——谷奥主站+谷安 aggregator
6月29日:社交,社交,一切皆社交的 Google+ 来了(附 11 段视频介绍). 6月29日:Google+ 就是冲着 Facebook 去的,细看 Google 的社交网络. 6月29日:口水战:Google+ 是否会成功. 6月29日:原来 Google “硬又黑” 的导航条是为强推 Google+ 铺路.

给浏览器添加SSL加密的Google搜索引擎

- Sam - cnBeta.COM
今天 Google 宣布其搜索引擎也开始支持 SSL 加密传输,以更好地保障用户的数据安全,当然一定程度上也缓解了国内使用Google搜索经常被重置的现象. 下面我介绍一下怎样在主流的浏览器上使用 SSL 加密的Google搜索,包括 IE,Firefox,Chrome,Opera,需要注意的是,如果被转入google.com.hk,请选择主页下的 Go to Google.com ,之后可以正常使用.