基于lucene的内嵌式kv存储

- - 开源软件 - ITeye博客

诸多业务场景下，都有使用kv型式存储数据供快速查询的需求. 正常的做法有使用HashMap存入内存，或者存入外部的nosql KV数据库/缓存. 使用HashMap做KV存储，速度快，但是如果数据量达到百万及至千万级时，HashMap必将占用大量的java堆内存，给应用带来极大的内存回收压力. 外部kv存储，以堆外（offHeap）存储的方式让我们的应用免于内存回收之忧，但其查询性能往往低于内存map.

lucene排序

- - 开源软件 - ITeye博客

排序是对于全文检索来言是一个必不可少的功能，在实际运用中，排序功能能在某些时候给我们带来很大的方便，比如在淘宝，京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品，或者通过排序来找到评论数最高或卖的最好的商品，再比如在Iteye里的博客栏里，每天都会以降序的方式，来显示出最新发出的几篇博客，有了排序，我们就能在某些时候很方便快速的得到某些有效信息，所以说排序功能，无处不在 ^_^.

Nginx+KV db进行AB灰度测试

- - IT技术博客大学习

周6参加华东运维大会，听了人家淘宝用nginx的一些场景，其中AB的灰度测试可能适用场景会比较普遍，当然大会上，并没有详细讨论实现. 大概需求是：网站类业务在更新new feature时，并不想让全量用户看到，可以针对地区性用户开放此feature. 大概构思了一个方式，使用 nginx+redis/memcache+IP库实现，简单的流程图如下：.

滴滴从KV存储到NewSQL实战

- - DockOne.io

【编者的话】本文讲诉滴滴在分布式NoSQL存储Fusion之上构建NewSQL的实践之路. 详细描述Fusion-NewSQL的特性，应用场景，设计方案. Fusion-NewSQL是由滴滴自研的在分布式KV存储基础上构建的NewSQL存储系统. Fusion-NewSQ兼容了MySQL协议，支持二级索引功能，提供超大规模数据持久化存储和高性能读写.

[原]Lucene系列-facet

- - 文武天下

facet：面、切面、方面. 个人理解就是维度，在满足query的前提下，观察结果在各维度上的分布（一个维度下各子类的数目）. 如jd上搜“手机”，得到4009个商品. 其中品牌、网络、价格就是商品的维度(facet)，点击某个品牌或者网络，获取更细分的结果. 点击品牌小米，获得小米手机的结果，显示27个.

[原]Lucene系列-FieldCache

- - 文武天下

域缓存，加载所有文档中某个特定域的值到内存，便于随机存取该域值. 当用户需要访问各文档中某个域的值时，IndexSearcher.doc(docId)获得Document的所有域值，但访问速度比较慢，而且只能获得Stored域的值. FieldCache能获得域值数组，根据docId random access域值.

Lucene 使用教程

- - 行业应用 - ITeye博客

1 lucene简介 . 1.1 什么是lucene . Lucene是一个全文搜索框架，而不是应用产品. 因此它并不像 http://www.baidu.com/ 或者google Desktop那么拿来就能用，它只是提供了一种工具让你能实现这些产品. 1.2 lucene能做什么 . 要回答这个问题，先要了解lucene的本质.

Lucene 4.x 之 IndexReader

- - zzm

在Lucene 3.x时代，《Lucene In Action》是一本相当不错的参考书，书中详细介绍了Lucene各种高级使用技术，对于开发者来说非常实用. 但是近期Lucene升级到了4.x版本，在性能等各方面有了很大的提高，值得在新项目中使用. 然而Lucene 4.x中的API相比3.x来说有了很大的改变，《Lucene In Action》中的很多内容都已经过时了，并且由于4.x推出的时间不长，还没有比较好的文档来对用法进行说明，这个系列文章就是想记录下自己使用Lucene 4.x的经验体会，供大家参考使用.

文章：集成Lucene和HBase

- - InfoQ cn

在所有先进的应用程序中，不管是购物站点还是社交网络乃至风景名胜站点，搜索都扮演着关键的角色. Lucene搜索程序库事实上已经成为实现搜索引擎的标准. 苹果、IBM、Attlassian（Jira）、Wolfram以及很多大家喜欢的公司【1】都使用了这种技术. 因此，大家对任何能够提升Lucene的可伸缩性和性能的实现都很感兴趣.

Solr\Lucene优劣势分析

- - 淘宝网综合业务平台团队博客

最早lucene2.4以及以前，追溯到2008年前后，lucene刚刚引起大家的关注，到后来Nutch. 、solr的出现，lucene变得更加热. Nutch、Solr的发展，极大推动了lucene的升级. 对于一些接触过搜索，使用过lucene、solr的人来说，一般都会感觉lucene、solr很牛逼.

基于lucene的内嵌式kv存储

应用背景

需求与方案选择

以HashMap为性能参考

方法1：store存储value,默认压缩

方法2：store存储value,去压缩

方法3：使用DocValues存储vaule

方法4：使用Payload存储vaule

方法5： lucene FSA存储value

方法5：Freq存储value信息

总结

相关 [lucene kv] 推荐：