Solr平台化搜索实战必知场景

- - 淘宝网综合业务平台团队博客

这个page是个人汇总了maillist、自己在搜索平台化、通用化过程中遇到的种种需求，为了避开必要的“敬业竞争禁止等”，特地从外网搜罗并汇总代表性的需求. 构成基于solr搜索“策略”参考、搜索应用查询的方案参考，但是，性能问题特别是高级用法，在大数据量时，务必压测，做到心里有底. 这里面给出的方法绝大部分基于solr接口、配置.

基于Solr的空间搜索(3)

- - 淘宝网综合业务平台团队博客

接上文，本文将继续介绍基于Solr的地理位置搜索的第二种实现方案. 从基于Solr的地理位置搜索（2）文章中可以看到完全基于GeoHash的查询过滤，将完全遍历整个docment文档，从效率上来看并不太合适，所以结合笛卡尔层后，能有效缩减少过滤范围，从性能上能很大程度的提高. int tier = START_TIER;//开始构建索引的层数.

基于Solr的空间搜索（2）

- - 淘宝网综合业务平台团队博客

本文将继续围绕Solr+Lucene使用Cartesian Tiers 笛卡尔层和GeoHash的构建索引和查询的细节进行介绍. 在Solr中其实支持很多默认距离函数，但是基于坐标构建索引和查询的主要会基于2种方案：. 而这块的源码实现都在lucene-spatial.jar中可以找到. 接下来我将根据这2种方案展开关于构建索引和查询细节进行阐述，都是代码分析，感兴趣的看官可以继续往下看.

基于Solr的空间搜索(1)

- - 淘宝网综合业务平台团队博客

在Solr中基于空间地址查询主要围绕2个概念实现：. Cartesian Tiers 笛卡尔层. Cartesian Tiers是通过将一个平面地图的根据设定的层次数，将每层的分解成若干个网格，如下图所示:. 每层以2的评方递增，所以第一层为4个网格，第二层为16 个，所以整个地图的经纬度将在每层的网格中体现：.

Solr SpellCheck 应用

- - 开源软件 - ITeye博客

通过对各类型的SpellCheck组件学习，完成项目拼写检查功能. 本文使用基于拼写词典的实现方式，solr版本为5.3.0. SpellCheck 简述. 拼写检查是对用户错误输入，响应正确的检查建议. 比如输入：周杰轮，响应：你是不是想找周杰伦. Solr的拼写检查大致可分为两类，基于词典与基于Solr索引.

什么是docValues. docValues是一种记录doc字段值的一种形式，在例如在结果排序和统计Facet查询时，需要通过docid取字段值的场景下是非常高效的. 为什么要使用docValues. 这种形式比老版本中利用fieldCache来实现正排查找更加高效，更加节省内存. 倒排索引将字段内存切分成一个term列表，每个term都对应着一个docid列表，这样一种结构使得查询能够非常快速，因为term对应的docid是现成就有的.

solr的使用

- - Web前端 - ITeye博客

solr的原理不和大家一一讲述，主要讲solr在使用过程中的注意事项. 首先是安装solr，安装步骤省略. （不要说我懒，安装步骤导出都是. 成功之后需要在solr里面建立一个针对你的业务的服务，我想建立一个叫做discuz的服务. 然后你在你的solr目录：solr-5.5.3/server/solr/ 下看见了discuz ，这是你刚刚创建的，针对某一业务的整个搜索配置都是在这个目录下配置的.

Solr调优参考

- - 淘宝网通用产品团队博客

共整理三部分，第一部分Solr常规处理，第二部分针对性性处理，前者比较通用，后者有局限性. 务必根据具体应用特性，具体调节参数，对比性能. 具体应用需要全面去把控，各个因素一起起作用. 第一部分. E文连接 http://wiki.apache.org/solr/SolrPerformanceFactors.

Solr之缓存篇

- - 淘宝网综合业务平台团队博客

Solr在Lucene之上开发了很多Cache功能，从目前提供的Cache类型有：. 而每种Cache针对具体的查询请求进行对应的Cache. 本文将从几个方面来阐述上述几种Cache在Solr的运用，具体如下：. （1）Cache的生命周期. （2）Cache的使用场景. （3）Cache的配置介绍.

Solr主从备份

- - 研发管理 - ITeye博客

SOLR复制模式，是一种在分布式环境下用于同步主从服务器的一种实现方式，因之前提到的基于rsync的SOLR不同方式部署成本过高，被SOLR1.4版本所替换，取而代之的就是基于HTTP协议的索引文件传输机制，该方式部署简单，只需配置一个文件即可. 以下讲解具体操作步骤： . 步骤分主服务器和从服务器，允许有多个从服务器，即从服务器的配置一样.

Solr平台化搜索实战必知场景

3.4.0
得分的问题

配置方法

问题和需求

Payload问题

Custom sort (score + custom
value)

BoostQParserPlugin

how can I limit by score
before sorting in a solr query

Score filter

Boost score for early matches

Solr: How can I get all
documents ordered by score with a list of
keywords?

Solr changes document’s
score when its random field value altered

Relevance Customization

Modify
SOLR scoring

Change order before
returning data

limiting the total number of documents
matched

相关 [solr 平台搜索] 推荐：