Google公布调整搜索引擎算法的细节

标签: google | 发表时间:2011-08-27 11:00 | 作者:blackhat tt5ryan
出处:http://solidot.org/
淘宝网女装秋装 写道 "尽管Google拥有很多开放的产品和项目,但搜索引擎算法一直是保密的。换句话说,搜索是Google的一个黑盒子。Google此前表示,如果Google向外界公布搜索引擎算法,那么将会引起搜索结果排序的混乱。但Google周五在官方博客上发布了一则视频,视频给出了Google工程师调整搜索引擎算法的细节。这段视频仅有4分钟,但列举了Google调整搜索算法的步骤。这段视频提到了Google所谓的“全页替换”功能。通过这种功能,如果Google发现用户对关键词存在错误的拼写,那么将会自动提供来自正确拼写的搜索结果,而不是展示错误拼写的搜索结果。为了测试这一功能,Google研究了用户点击原始搜索结果的频率。如果Google发现,某一搜索结果的点击频率只有1/50,那么将会替换整个页面。根据视频中的信息,Google每年调整搜索引擎算法超过500次。"


相关 [google 搜索引擎 算法] 推荐:

Google公布调整搜索引擎算法的细节

- tt5ryan - Solidot
淘宝网女装秋装 写道 "尽管Google拥有很多开放的产品和项目,但搜索引擎算法一直是保密的. 换句话说,搜索是Google的一个黑盒子. Google此前表示,如果Google向外界公布搜索引擎算法,那么将会引起搜索结果排序的混乱. 但Google周五在官方博客上发布了一则视频,视频给出了Google工程师调整搜索引擎算法的细节.

搜索引擎网页去重算法

- - 醉清风
  相关统计数据表明:互联网上近似重复的网页的数量占网页总数量的比例高达29%,完全相同的网页大约占网页总数量的22%.研究表明,在一个大型的信息采集系统中,30%的网页是和另外70%的网页完全重复或近似重复的.     即:互联网的网页中相当高的比例的网页内容是近似相同或完全相同的. 搜索爬虫抓取会产生网页重复的类型:.

Google式的搜索引擎实现

- - 行业应用 - ITeye博客
Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中.   Nutch 0.8 完全使用Hadoop重写了骨干代码,另有很多地方作了合理化修正,非常值得升级.

搜索引擎链接算法之:HITS算法解析

- - CSDN博客推荐文章
本文节选自《 这就是搜索引擎:核心技术详解》第六章.       HITS算法也是链接分析中非常基础且重要的算法,目前已被Teoma搜索引擎(www.teoma.com)作为链接分析算法在实际中使用. 6.4.1 Hub页面与Authority页面.      Hub页面和Authority页面是HITS算法最基本的两个定义.

Google Plus 第三方搜索引擎:Google Plus Search

- 老男人 - cnBeta.COM
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要搜索 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. 目前有一些非官方的 Google Plus 搜索应用,例如 Google Plus Search.

第三方 Google+ 搜索引擎 Google Plus Search

- Ivy - 谷奥——探寻谷歌的奥秘
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要扫过 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. Google Plus Search  是一个非官方的 Google Plus 搜索应用,支持中文.

简易垂直搜索引擎的核心算法总结

- - CSDN博客架构设计推荐文章
倒排索引源于实际应用中需要根据属性值(字段)来查找记录(所在的文件位置). 这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址. 目前主流的索引技术有三种:倒排索引、后缀数组以及签名. 后缀数组虽然快,但是维护困难,代价高昂,不适合作为搜索引擎的索引. 而签名的速度和性能都不如倒排索引.

Goolge十年对搜索引擎算法做出的改善

- - CSDN博客互联网推荐文章
谷歌过去十年,在搜索引擎上做出了巨大的努力,其努力的方向就是不断完善搜索引擎算法,不断打击非真实的数据,从PR、nofollow、企鹅新算法的出现也是必然的. 2000年12月 – Google工具条. Google发布了浏览器工具条,正是这个工具条上绿色小条(PR值),日后让无数的站长为之疯狂,形成了买卖产业链.

给浏览器添加SSL加密的Google搜索引擎

- Sam - cnBeta.COM
今天 Google 宣布其搜索引擎也开始支持 SSL 加密传输,以更好地保障用户的数据安全,当然一定程度上也缓解了国内使用Google搜索经常被重置的现象. 下面我介绍一下怎样在主流的浏览器上使用 SSL 加密的Google搜索,包括 IE,Firefox,Chrome,Opera,需要注意的是,如果被转入google.com.hk,请选择主页下的 Go to Google.com ,之后可以正常使用.

Bing 利用自己的搜索引擎暗讽 Google 邪恶

- HaWk - cnBeta.COM
今天Google软件工程师Andy Arnt爆料称在Bing里输入两个搜索关键字,即可看到暗讽Google的搜索结果OneBox. 两个关键字分别是:more evil than satan himself(比撒旦本人还邪恶,如上图):.