我的废话:
某个项目缘故对分布式搜索的方式和技术的话题开始高度关注,看了不少资料,如 Apache Solr 和 Katta 。好东西大家应该分享, 最近看到LinkedIn 推出的新产品 LinkedIn Signal ,该产品在架构设计上和分布式搜索有着紧密的联系,LinkedIn搜索引擎架构师王坚 (John Wang) 在团队的blog上公布了一些产品内幕,这一资料让我得到了很多启发。
如图所示:
* Zoie - Realtime indexing/search system.
* Bobo - Faceted Search Engine
* Sensei - distributed realtime searchable database with dynamic clustering. Leverages Zoie and Bobo.
以上几个东东 是LinkedIn 搜索团队自己开发的,来满足用户线上的搜索需求。
整篇详细内容如下:
http://sna-projects.com/blog/2010/10/linkedin-signal-a-look-under-the-hood
值得借鉴的几点:
* 对于线上搜索的前端展现策略,结构的设计不可忽视
* 如何利用多进程并行计算来提高计算效率,
* 对大索引文件sharding 的存储策略,
* 索引文件分布在不同集群机器的查询策略,
* 数据库/数据源和索引库的实时同步机制。
口水:
看的东西一多就容易忘,所以找个地方先记下来,怕忘。
–end–