有关Lucene的问题(8)：用Lucene构建实时索引的文档更新问题

有关Lucene的问题(7)：用Lucene构建实时的索引

- -

由于前一章所述的Lucene的事务性，使得Lucene可以增量的添加一个段，我们知道，倒排索引是有一定的格式的，而这个格式一旦写入是非常难以改变的，那么如何能够增量建索引呢. Lucene使用段这个概念解决了这个问题，对于每个已经生成的段，其倒排索引结构不会再改变，而增量添加的文档添加到新的段中，段之间在一定的时刻进行合并，从而形成新的倒排索引结构.

lucene排序

- - 开源软件 - ITeye博客

排序是对于全文检索来言是一个必不可少的功能，在实际运用中，排序功能能在某些时候给我们带来很大的方便，比如在淘宝，京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品，或者通过排序来找到评论数最高或卖的最好的商品，再比如在Iteye里的博客栏里，每天都会以降序的方式，来显示出最新发出的几篇博客，有了排序，我们就能在某些时候很方便快速的得到某些有效信息，所以说排序功能，无处不在 ^_^.

有关Lucene的问题(8)：用Lucene构建实时索引的文档更新问题

- -

在有关Lucene的问题(7)，讨论了使用Lucene内存索引和硬盘索引构建实时索引的问题. 然而有的读者提到，如果涉及到文档的删除及更新，那么如何构建实时的索引呢. 1、Lucene删除文档的几种方式. IndexReader.deleteDocument(int docID)是用 IndexReader 按文档号删除.

[原]Lucene系列-facet

- - 文武天下

facet：面、切面、方面. 个人理解就是维度，在满足query的前提下，观察结果在各维度上的分布（一个维度下各子类的数目）. 如jd上搜“手机”，得到4009个商品. 其中品牌、网络、价格就是商品的维度(facet)，点击某个品牌或者网络，获取更细分的结果. 点击品牌小米，获得小米手机的结果，显示27个.

[原]Lucene系列-FieldCache

- - 文武天下

域缓存，加载所有文档中某个特定域的值到内存，便于随机存取该域值. 当用户需要访问各文档中某个域的值时，IndexSearcher.doc(docId)获得Document的所有域值，但访问速度比较慢，而且只能获得Stored域的值. FieldCache能获得域值数组，根据docId random access域值.

Lucene 使用教程

- - 行业应用 - ITeye博客

1 lucene简介 . 1.1 什么是lucene . Lucene是一个全文搜索框架，而不是应用产品. 因此它并不像 http://www.baidu.com/ 或者google Desktop那么拿来就能用，它只是提供了一种工具让你能实现这些产品. 1.2 lucene能做什么 . 要回答这个问题，先要了解lucene的本质.

在Lucene 3.x时代，《Lucene In Action》是一本相当不错的参考书，书中详细介绍了Lucene各种高级使用技术，对于开发者来说非常实用. 但是近期Lucene升级到了4.x版本，在性能等各方面有了很大的提高，值得在新项目中使用. 然而Lucene 4.x中的API相比3.x来说有了很大的改变，《Lucene In Action》中的很多内容都已经过时了，并且由于4.x推出的时间不长，还没有比较好的文档来对用法进行说明，这个系列文章就是想记录下自己使用Lucene 4.x的经验体会，供大家参考使用.

有关Lucene的问题(8)：用Lucene构建实时索引的文档更新问题

1、Lucene删除文档的几种方式

2、Lucene文档更新的几个问题

2.1、使用IndexReader还是IndexWriter进行删除

2.2、如何在内存中缓存文档的删除

2.3、文档更新的顺序性问题

3、具有更新功能的Lucene实时索引方案

3.1、初始化

3.2、更新文档5

3.3、合并索引

3.4、合并的过程中更新文档5

3.5、重新打开硬盘索引的IndexReader

3.6、替代IndexReader

相关 [lucene 问题 lucene] 推荐：

有关Lucene的问题(7)：用Lucene构建实时的索引

lucene排序

有关Lucene的问题(8)：用Lucene构建实时索引的文档更新问题

[原]Lucene系列-facet

[原]Lucene系列-FieldCache

Lucene 使用教程

Lucene 4.x 之 IndexReader

用Lucene构建实时索引的文档更新问题

文章：集成Lucene和HBase

Solr\Lucene优劣势分析

相关文章

订阅