Google公布调整搜索引擎算法的细节

标签: google | 发表时间:2011-08-27 11:00 | 作者:blackhat tt5ryan
出处:http://solidot.org/
淘宝网女装秋装 写道 "尽管Google拥有很多开放的产品和项目,但搜索引擎算法一直是保密的。换句话说,搜索是Google的一个黑盒子。Google此前表示,如果Google向外界公布搜索引擎算法,那么将会引起搜索结果排序的混乱。但Google周五在官方博客上发布了一则视频,视频给出了Google工程师调整搜索引擎算法的细节。这段视频仅有4分钟,但列举了Google调整搜索算法的步骤。这段视频提到了Google所谓的“全页替换”功能。通过这种功能,如果Google发现用户对关键词存在错误的拼写,那么将会自动提供来自正确拼写的搜索结果,而不是展示错误拼写的搜索结果。为了测试这一功能,Google研究了用户点击原始搜索结果的频率。如果Google发现,某一搜索结果的点击频率只有1/50,那么将会替换整个页面。根据视频中的信息,Google每年调整搜索引擎算法超过500次。"


相关 [google 搜索引擎 算法] 推荐:

Google公布调整搜索引擎算法的细节

- tt5ryan - Solidot
淘宝网女装秋装 写道 "尽管Google拥有很多开放的产品和项目,但搜索引擎算法一直是保密的. 换句话说,搜索是Google的一个黑盒子. Google此前表示,如果Google向外界公布搜索引擎算法,那么将会引起搜索结果排序的混乱. 但Google周五在官方博客上发布了一则视频,视频给出了Google工程师调整搜索引擎算法的细节.

Google式的搜索引擎实现

- - 行业应用 - ITeye博客
Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中.   Nutch 0.8 完全使用Hadoop重写了骨干代码,另有很多地方作了合理化修正,非常值得升级.

搜索引擎网页去重算法

- - 醉清风
  相关统计数据表明:互联网上近似重复的网页的数量占网页总数量的比例高达29%,完全相同的网页大约占网页总数量的22%.研究表明,在一个大型的信息采集系统中,30%的网页是和另外70%的网页完全重复或近似重复的.     即:互联网的网页中相当高的比例的网页内容是近似相同或完全相同的. 搜索爬虫抓取会产生网页重复的类型:.

Google Plus 第三方搜索引擎:Google Plus Search

- 老男人 - cnBeta.COM
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要搜索 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. 目前有一些非官方的 Google Plus 搜索应用,例如 Google Plus Search.

第三方 Google+ 搜索引擎 Google Plus Search

- Ivy - 谷奥——探寻谷歌的奥秘
Google Plus 目前仍在 beta  版状态,而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要扫过 Google+ 上的东西,需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com",不是特别方便. Google Plus Search  是一个非官方的 Google Plus 搜索应用,支持中文.

搜索引擎链接算法之:HITS算法解析

- - CSDN博客推荐文章
本文节选自《 这就是搜索引擎:核心技术详解》第六章.       HITS算法也是链接分析中非常基础且重要的算法,目前已被Teoma搜索引擎(www.teoma.com)作为链接分析算法在实际中使用. 6.4.1 Hub页面与Authority页面.      Hub页面和Authority页面是HITS算法最基本的两个定义.

给浏览器添加SSL加密的Google搜索引擎

- Sam - cnBeta.COM
今天 Google 宣布其搜索引擎也开始支持 SSL 加密传输,以更好地保障用户的数据安全,当然一定程度上也缓解了国内使用Google搜索经常被重置的现象. 下面我介绍一下怎样在主流的浏览器上使用 SSL 加密的Google搜索,包括 IE,Firefox,Chrome,Opera,需要注意的是,如果被转入google.com.hk,请选择主页下的 Go to Google.com ,之后可以正常使用.

Bing 利用自己的搜索引擎暗讽 Google 邪恶

- HaWk - cnBeta.COM
今天Google软件工程师Andy Arnt爆料称在Bing里输入两个搜索关键字,即可看到暗讽Google的搜索结果OneBox. 两个关键字分别是:more evil than satan himself(比撒旦本人还邪恶,如上图):.

九月美国搜索引擎市场Google略有上升

- ArmadilloCommander - Solidot
深圳SEO 写道 "comScore周三发布了(中文)全美九月份美国搜索引擎市场份额报告,Google仍占主导,从64.8%增加到65.3%;雅虎从16.3%降至15.5%; 虽然Bing与Facebook有搜索业务的合作关系,但是Facebook并没有给微软的搜索份额带来显著的提高,名列第三,它的份额仍然是14.7%.

微软和Google如何让搜索引擎理解互联网

- - Solidot
搜索引擎爬虫抓取和索引了海量的网页内容,但内容的意义则是一无所知,它们并不能像人类那样区分同一个词的不同含义. 它们抓取的只是网页中的单词,而不是语义. 从一开始,搜索引擎本质上是匹配文本字符串. 让字符串和语义匹配起来是搜索引擎公司努力实现的方向,微软和Google正更新其搜索引擎:微软的Satori和Google的Knowledge Graph能提取出网页中的非结构性数据,创造一个互联网“名词”——人、位置、物及彼此关系——的结构性数据库.