HBase在淘宝主搜索的Dump中的性能调优

- - 搜索技术博客－淘宝

目前HBase已经运用于淘宝主搜索的全量和增量的数据存储，有效的减低的数据库的压力，增强了业务扩展的能力. Dump系统的特点是要求在短时间内处理大量数据，对延时要求高. 在实施这个项目过程中，我们积累了一些优化的实践，抛砖引玉，供大家参考. 环境：Hadoop CDH3U4 + HBase 0.92.1.

【CSDN现场报道】中国IT界技术盛会——Hadoop与大数据技术大会（Hadoop&BigData Technology Conference 2012，HBTC 2012）于2012年11月30日-12月1日在北京新云南皇冠假日酒店隆重召开. 本次大会以“大数据共享与开放技术”为主题，聚焦于Hadoop与大数据，力邀数十位国内外Hadoop及大数据技术应用的产学界人士和实践企业，探讨大数据技术生态系统的现状和发展趋势，并围绕Hadoop与大数据热点技术和应用实践进行深入解析.

HBase在淘宝的应用和优化小结

- - NoSQLFan

本文来自于NoSQLFan联合作者@ koven2049，他在淘宝从事Hadoop及HBase相关的应用和优化. 对Hadoop、HBase都有深入的了解，本文就是其在工作中对HBase的应用优化小结，分享给大家. 原文地址： http://walkoven.com/?p=57. 文章PDF下载： http://walkoven.com/hbase:optimization and apply summary in taobao.pdf.

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

- - zzm

网络爬虫架构在Nutch+Hadoop之上，是一个典型的分布式离线批量处理架构，有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项. 由于网络爬虫只负责网络资源的抓取，所以，需要一个分布式搜索引擎，用来对网络爬虫抓取到的网络资源进行实时的索引和搜索. 搜索引擎架构在ElasticSearch之上，是一个典型的分布式在线实时交互查询架构，无单点故障，高伸缩、高可用.

【读图】淘宝搜索排名规则

- - i天下网商

有心人虎用军根据视频《淘宝搜索排名规则——相关性解读及其策略》整理出了详尽的思维导图，虽然不能完全代表淘宝搜索排名规则，但对于初级阶段的卖家来说，是不可多得的一份实战干货. 天下网商视觉团队设计，图说淘宝搜索排名规则. （注：此图仅供卖家学习交流，具体操作请以淘宝官方制定的淘宝搜索排名规则为准. 【网商百宝箱】淘宝搜索新规解读.

淘宝搜索算法现状

- - 互联网分析

淘宝搜索排序的目的是帮助用户快速的找到需要的商品. 从技术上来说，就是在用户输入关键词匹配到的商品中，把最符合用户需求的商品排到第一位，其它的依次排在后续相应的位置. 为了更好的实现这个目标，算法排序系统基本按三个方面来推进：. 当用户输入关键词进行搜索的时候，系统依据算法模型来给匹配到的每个商品进行实时的计算，并按照分数的大小对商品进行排序.

文本搜索：淘宝搜索新玩法

- - 派代网 - 资讯

“对于消费者和商家来说，都是新的开始. 淘宝搜索部门负责人文德如此描述将于1月7日测试上线的文本搜索选购知识的新功能. 这项新功能主要在用户搜索结果中增加产品选购的相关知识，而选购知识的提供者就是卖家. 淘宝搜索历来都是卖家关注的焦点，每一个排名的变化都会影响到卖家的切身利益，也会带来卖家或多或少的批评.

从未降级的搜索技术 – HBase集群升级与优化

- - 搜索技术博客－淘宝

战争从来都是拼后勤拼平台支撑的，天猫双十一这一天对于我们搜索事业部来说，就是一场高强度的数字化战争. 为了这一天，各兄弟业务线的战友们已经摩拳擦掌，纷纷亮出各种新式武器，而我们原有的离线系统平台却渐渐显出疲态，慢慢被来自各业务线的不断提升的压力需求搞得捉襟见肘了. 个性化搜索实时数据处理平台(Pora)在双十一将正式亮相，当时我们预计会有数以十亿计的新增HBase读写请求，如果不进行升级优化，原有的离线集群预计将无法承受这一前所未有的压力；天猫业务线的增量在双十一更是重中之重，届时预计会有数倍甚至十多倍的增长，不断流，不延迟对于原有的离线集群来说也是巨大的考验；主搜、国际站等业务线也都对底层平台提出了越来越高的要求，凌晨全量的时间极其有限，不能出现任何闪失.

淘宝搜索规则十大金牌经验

- - i天下网商

史上最全搜索规则经验分享，包括：常见的违规现象、详情页链接的问题、主图质量的问题、卖家信誉的问题、橱窗推荐位和下架时间的使用、滞销宝贝的处理、宝贝属性的影响、消保的影响等. 处理: 系统识别后对涉嫌虚假销量、信用的宝贝给予三十天的单个宝贝搜索降权，同时根据卖家店铺涉嫌虚假交易情节严重程度给予卖家七至九十天的全店宝贝搜索降权.

HBase在淘宝主搜索的Dump中的性能调优

相关 [hbase 淘宝搜索] 推荐：