有赞搜索系统的技术内幕

- - SegmentFault 最新的文章

上文说到有赞搜索系统的架构演进，为了支撑不断演进的技术架构，除了 Elasticsearch 的维护优化之外，我们也开发了上层的中间件来应对不断提高的稳定性和性能要求. Elasticsearch 的检索执行效率可以表示为：. 其中 num_of_files 表示索引文件段的个数，N 表示需要遍历的数据量，从这里我们可以总结出提升查询性能可以考虑的两点：.

从未降级的搜索技术-Hippo在线服务调度系统

- - 搜索技术博客－淘宝

很久很久以前，有一个PE叫川小生，有一个开发叫子小嘉. 双11前，他们按照业务的要求给天猫准备了14倍余量，给主搜准备了1倍余量. 结果11号上午流量涨势喜人啊，嗖嗖往上涨. 川小生和子小嘉说不对啊，怎么主搜涨这么厉害天猫只涨4倍呢，川小生掐指一算，干，到晚上主搜就挂了啊.

如何为技术博客设计一个推荐系统（中）：基于 Google 搜索的半自动推荐

- - Blog | Phodal - A Growth Engineer

与统计学相比，基于内容来向用户推荐相似的内容，往往更容易获得. 在技术领域，作者通常比大多数读者更专业，他们往往知道什么是读者需要的. 如，你看了一个 React 相关的文章，你可能会需要 Redux 相关的内容. 需要一些前提条件：融合现有系统的数据信息，获取一些用户的信息. 随后，再计算出相关的内容，最后返回给读者.

在搜索我经历过全部的双11，12年和13年这2次大促，GN是开发总指挥，我是在礼台上看各种新武器实弹表演. 过去6年里，我们的引擎体系每年做到100%的性能提升，以淘系搜索为例，从最初3000台机器翻倍到现在区区6000台，但搜索服务却从6千qps增长了40倍到现在的32万qps，同时还填补了算法欲壑（算法数据占用内存从最初的10%到了现在的50%），转化率持续攀升，目前大搜索GMV已经是全网的主体了.

Twitter实时搜索系统EarlyBird

- - CSDN博客互联网推荐文章

twitter对存档的tweet使用lucene做全量索引,新发的推文则是实时索引，实时检索(10秒之内索引). 实时索引和检索系统叫EarlyBird. 感觉写得比较清楚简洁，只要这些信息足够真实可信，完全可以做实现参考. 1)基于lucene + java,michael busch是lucene committer.

4个步骤，小结搜索系统

- - 人人都是产品经理

搜索系统作为用户自行使用的引导工具，重要程度不言而喻；本文主要从4步：需求识别、检索、排序、展现来总结搜索系统的工作机制. 搜索是一个比较有年份的功能，他不是一个简单的搜索框，毕竟搜索造就了一个百度帝国. 搜索系统在产品架构中是帮助用户搜索到他们想要的内容，当用户不知道如何通过其他路径直接获取特定内容的时候才会使用，也就是说搜索是用户自行使用最后的一个引导工具，重要程度不言而喻.

分布式向量搜索系统 Vearch

- - OSCHINA 社区最新软件

Vearch 是一个分布式向量搜索系统，可以用来计算向量相似度，或用于机器学习领域，如：图像识别、视频识别或自然语言处理等各个领域. 本系统基于 Faiss 实现，提供了快速的向量检索功能. 提供类似 Elasticsearch 的 Restful API 可以方便地对数据及表结构进行管理查询等工作.

搜索系统中的纠错问题

- -

纠错是搜索引擎中一个非常有特色的模块，对用户输入的内容进行改写从而让用户得到正确的结果，有的时候也会带有一些惊喜度，所以纠错技术是一个搜索体验的加分项，近期突然对这块有兴趣，所以就了解了一下. （学习周报本周停，学习内容都在这了）. 人非圣贤，孰能无过，别说是搜索的时候，哪怕是我们打字、写作文的时候，都会出现错字，一般的错别字不会对最终目标带来很大影响，且出现频率很低，不拘小节的我们常常会忽略这样的小问题，但是，在搜索场景下，错别字意味着可能就搜不到内容了，对于用户而言，就是需求无法满足，造成了很差的体验，因此在搜索场景中，就很有必要去纠错.

从未降级的搜索技术-天猫SKU搜索

- - 搜索技术博客－淘宝

前些天，五福老大的文章《从未降级的搜索技术》介绍了搜索双11的5件新式武器，其中就包括天猫SKU搜索. 本文就对此做一些更详细的介绍：. SKU，Stock Keeping Unit，库存单元，是商品库存的最小单位. 通俗的讲，一种商品可能有各种规格的货，每一种货就是一个SKU. 比如，iphone6有白色16G、金色16G、白色64G、金色64G、等多种SKU；再比如商家售卖的某款T恤有白色S码、黑色S码、白色M码、黑色S码、等等SKU.

从图谱搜索看搜索技术的发展趋势

- - 微软亚洲研究院

编者按：图谱搜索（Graph Search）是基于社交图谱构建起来的搜索服务，与基于关键词匹配的传统网络搜索引擎相比，图谱搜索能够支持更自然、复杂的查询输入，并针对查询直接给出答案. 在微软亚洲研究院副研究员段楠眼中，这样的高效个性化搜索会越来越多. 文章中，他从基础架构、自然语言接口、相关研究、发展趋势等几个方面，对计算搜索的现在和未来进行了总结和展望.

有赞搜索系统的技术内幕

索引拆分

冷热隔离

HA

小结

相关 [搜索系统技术] 推荐：