Solr调优参考

- - 淘宝网通用产品团队博客

共整理三部分，第一部分Solr常规处理，第二部分针对性性处理，前者比较通用，后者有局限性. 务必根据具体应用特性，具体调节参数，对比性能. 具体应用需要全面去把控，各个因素一起起作用. 第一部分. E文连接 http://wiki.apache.org/solr/SolrPerformanceFactors.

Solr调优参考-续

- - 淘宝网综合业务平台团队博客

这篇blog主要以实践出发，从顶到底，从大到细的思路来进一步描述，solr优化，并且是基于横向发展来说的（管理更多core），对于纵向的（core内部、搜索核心技术）. 例如分词、queryparse、分词、实时、分布式的优化、排序等偏轻. 文章有不合理，或者错误的请及时反馈给鹰缘. 最重要、最影响系统整体稳定和吞吐量(针对业务总索引布局优化).

solr的参考资料

- - 企业架构 - ITeye博客

大多数的应用程序将数据存储在关系数据库、xml文件中. 对这样的数据进行搜索是很常见的应用. 所谓的DataImportHandler提供一种可配置的方式向solr导入数据，可以一次全部导入，也可以增量导入. 目标. 能够读取关系数据库中的数据. 通过可配置的方式，能够将数据库中多列、多表的数据生成solr文档 .

Solr SpellCheck 应用

- - 开源软件 - ITeye博客

通过对各类型的SpellCheck组件学习，完成项目拼写检查功能. 本文使用基于拼写词典的实现方式，solr版本为5.3.0. SpellCheck 简述. 拼写检查是对用户错误输入，响应正确的检查建议. 比如输入：周杰轮，响应：你是不是想找周杰伦. Solr的拼写检查大致可分为两类，基于词典与基于Solr索引.

什么是docValues. docValues是一种记录doc字段值的一种形式，在例如在结果排序和统计Facet查询时，需要通过docid取字段值的场景下是非常高效的. 为什么要使用docValues. 这种形式比老版本中利用fieldCache来实现正排查找更加高效，更加节省内存. 倒排索引将字段内存切分成一个term列表，每个term都对应着一个docid列表，这样一种结构使得查询能够非常快速，因为term对应的docid是现成就有的.

solr的使用

- - Web前端 - ITeye博客

solr的原理不和大家一一讲述，主要讲solr在使用过程中的注意事项. 首先是安装solr，安装步骤省略. （不要说我懒，安装步骤导出都是. 成功之后需要在solr里面建立一个针对你的业务的服务，我想建立一个叫做discuz的服务. 然后你在你的solr目录：solr-5.5.3/server/solr/ 下看见了discuz ，这是你刚刚创建的，针对某一业务的整个搜索配置都是在这个目录下配置的.

Solr之缓存篇

- - 淘宝网综合业务平台团队博客

Solr在Lucene之上开发了很多Cache功能，从目前提供的Cache类型有：. 而每种Cache针对具体的查询请求进行对应的Cache. 本文将从几个方面来阐述上述几种Cache在Solr的运用，具体如下：. （1）Cache的生命周期. （2）Cache的使用场景. （3）Cache的配置介绍.

Solr主从备份

- - 研发管理 - ITeye博客

SOLR复制模式，是一种在分布式环境下用于同步主从服务器的一种实现方式，因之前提到的基于rsync的SOLR不同方式部署成本过高，被SOLR1.4版本所替换，取而代之的就是基于HTTP协议的索引文件传输机制，该方式部署简单，只需配置一个文件即可. 以下讲解具体操作步骤： . 步骤分主服务器和从服务器，允许有多个从服务器，即从服务器的配置一样.

solr相似匹配

- - CSDN博客推荐文章

相似匹配　　在我们使用网页搜索时，会注意到每一个结果都包含一个 “相似页面” 链接，单击该链接，就会发布另一个搜索请求，查找出与起初结果类似的文档. Solr 使用 MoreLikeThisComponent（MLT）和 MoreLikeThisHandler 实现了一样的功能. 如上所述，MLT 是与标准 SolrRequestHandler 集成在一起的；MoreLikeThisHandler 与 MLT 结合在一起，并添加了一些其他选项，但它要求发布一个单一的请求.

Solr与Mysql集成指南

- sun - 草根网:互联网界的读者文摘

在《企业级搜索引擎Solr使用入门指南》及《企业级搜索引擎Solr交流》中对Solr的使用做了简单介绍. 在数据库驱动的应用中，当时采....

Solr调优参考

Schema Design Considerations

indexed fields

stored fields

Configuration Considerations

mergeFactor

mergeFactor Tradeoffs

HashDocSet Max Size Considerations

Cache autoWarm Count Considerations

Cache hit rate（缓存命中率）

Explicit Warming of Sort Fields

Optimization Considerations

Updates and Commit Frequency Tradeoffs

Query Response Compression

Embedded vs HTTP Post

RAM Usage Considerations（内存方面的考虑）

OutOfMemoryErrors

Memory allocated to the Java VM

Factors affecting memory usage（影响内存使用量的因素）

相关 [solr 参考] 推荐：