Google式的搜索引擎实现

- - 行业应用 - ITeye博客

Nutch是一个基于Lucene，类似Google的完整网络搜索引擎解决方案，基于Hadoop的分布式处理模型保证了系统的性能，类似Eclipse的插件机制保证了系统的可客户化，而且很容易集成到自己的应用之中. 　　Nutch 0.8 完全使用Hadoop重写了骨干代码，另有很多地方作了合理化修正，非常值得升级.

Google搜索引擎架构Caffeine

- - 标点符

什么是 Google Caffeine. Google Caffeine 是 Google 搜索引擎的一次架构重构，旨在满足不断增长的互联网内容和用户实时搜索需求. 它替代了 Google 早期的分层索引系统，转而采用更加实时的索引机制，使搜索结果更加快速和新鲜. 发布时间：Google 于 2009 年 8 月发布 Caffeine 项目 Beta 版本，并于 2010 年 6 月正式启用.

Google Plus 第三方搜索引擎：Google Plus Search

- 老男人 - cnBeta.COM

Google Plus 目前仍在 beta 版状态，而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要搜索 Google+ 上的东西，需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com"，不是特别方便. 目前有一些非官方的 Google Plus 搜索应用，例如 Google Plus Search.

第三方 Google+ 搜索引擎 Google Plus Search

- Ivy - 谷奥——探寻谷歌的奥秘

Google Plus 目前仍在 beta 版状态，而针对 Google Plus 的官方搜索应用至今没有推出. 用户需要扫过 Google+ 上的东西，需要手动在 Google 搜索框里加上 "关键字 site:plus.google.com"，不是特别方便. Google Plus Search 是一个非官方的 Google Plus 搜索应用，支持中文.

今天 Google 宣布其搜索引擎也开始支持 SSL 加密传输，以更好地保障用户的数据安全，当然一定程度上也缓解了国内使用Google搜索经常被重置的现象. 下面我介绍一下怎样在主流的浏览器上使用 SSL 加密的Google搜索，包括 IE，Firefox，Chrome，Opera，需要注意的是，如果被转入google.com.hk，请选择主页下的 Go to Google.com ，之后可以正常使用.

Google公布调整搜索引擎算法的细节

- tt5ryan - Solidot

淘宝网女装秋装写道 "尽管Google拥有很多开放的产品和项目，但搜索引擎算法一直是保密的. 换句话说，搜索是Google的一个黑盒子. Google此前表示，如果Google向外界公布搜索引擎算法，那么将会引起搜索结果排序的混乱. 但Google周五在官方博客上发布了一则视频，视频给出了Google工程师调整搜索引擎算法的细节.

Bing 利用自己的搜索引擎暗讽 Google 邪恶

- HaWk - cnBeta.COM

今天Google软件工程师Andy Arnt爆料称在Bing里输入两个搜索关键字，即可看到暗讽Google的搜索结果OneBox. 两个关键字分别是：more evil than satan himself（比撒旦本人还邪恶，如上图）：.

九月美国搜索引擎市场Google略有上升

- ArmadilloCommander - Solidot

深圳SEO 写道 "comScore周三发布了(中文)全美九月份美国搜索引擎市场份额报告，Google仍占主导，从64.8%增加到65.3%；雅虎从16.3%降至15.5%；虽然Bing与Facebook有搜索业务的合作关系，但是Facebook并没有给微软的搜索份额带来显著的提高，名列第三，它的份额仍然是14.7%.

微软和Google如何让搜索引擎理解互联网

- - Solidot

搜索引擎爬虫抓取和索引了海量的网页内容，但内容的意义则是一无所知，它们并不能像人类那样区分同一个词的不同含义. 它们抓取的只是网页中的单词，而不是语义. 从一开始，搜索引擎本质上是匹配文本字符串. 让字符串和语义匹配起来是搜索引擎公司努力实现的方向，微软和Google正更新其搜索引擎：微软的Satori和Google的Knowledge Graph能提取出网页中的非结构性数据，创造一个互联网“名词”——人、位置、物及彼此关系——的结构性数据库.

叫板Google，YaCy发布开源搜索引擎

- 洋白菜 - 36氪

一个名叫YaCy的项目要在搜索市场上向Google叫板，放出了一个开源搜索引擎，在互联网和内联网皆可使用. YaCy引擎基于点对点连接，而不是通过中央服务器进行搜索查询. 用户下载该软件后就可以进行搜索，保证内容不被审查、搜索结果不会被中央服务器记录和分析. “我们在网络上的大多数行为都和搜索有关，这是我们和所要信息的关键一环.

Google式的搜索引擎实现

1.Nutch 0.8 的安装与运行

2.Nutch You should know

2.1 一份文档

2.2 三个目录

2.3 爬行过程

2.4 搜索过程

3. 修改源码或编写插件

相关 [google 搜索引擎] 推荐：