首页

搜索结果

"tag:"lucene""

<<上篇 1 2

标题及摘要 日期/时间
21
Apache Solr vs ElasticSearch - the Feature Smackdown!
API Feature Solr 4.7.0 ElasticSearch 1.0 Format XML,CSV,JSON JSON HTTP REST API ...
2014-12-28
6:24:00
22
使用Lucene-Spatial实现集成地理位置的全文检索 - haiker - ITeye技术网站
Lucene通过Spatial包提供了对基于地理位置的全文检索的支持,最典型的应用场景就是:“搜索中关村附近1公里内的火锅店,并按远近排序”。使用Lucene-Spatial添加对地理位置的支持,和之前普通文本搜索主要有两点区别: 1. 将坐标信息转化为笛卡尔层,建立索引 [java]view plaincopyprint? privatevoidindexLocation(Documentdocument,JSONObjectjo) thro...
2014-12-28
6:17:00
23
lucene修改相似度实现:去掉文本长度和重复词的影响 - sling2007的日志 - 网易博客
文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关,得分越高。分值计算公式如下: score(q,d) = coord(q,d) · queryNorm(q) · ∑ ( tf(t in d) · idf(t)2 · t.getBoost() · norm(t,d) ) t in q 其中 tf(t in d) 这个值衡量着Term在文档中出现的频...
2014-2-13
21:28:00
24
有关Lucene的问题(4):影响Lucene对文档打分的四种方式 - forfuture1978的专栏 - 博客频道 - CSDN.NET
在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。 如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。 这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。 如果不进行设定,则Document Boost和Field Boost默认为1。 Document Boost及FieldBoost的设定方式如下: ...
2014-2-12
14:18:00
25
lucene之排序、设置权重、优化、分布式搜索_孤独浪子_新浪博客
2. 多字段搜索 使用 MultiFieldQueryParser 可以指定多个搜索字段。 Query query = MultiFieldQueryParser.Parse("name*", new string[] { FieldName, FieldValue }, analyzer); IndexReader reader = IndexReader.Open(directory); IndexSearcher searcher = new IndexSearcher(re...
2014-2-12
14:16:00
26
Blur 上手 - 建于Hadoop 和 Lucene上的搜索工具
Blur是一个新的Apache 2.0许可的软件项目,提供了建于Hadoop和Lucene之上一个搜索功能。elasticsearch和Solr已经存在,为什么建立新的东西?虽然这些项目运作良好,不过他们没有与一个坚实的Hadoop生态系统集成。Blur始建专门针对大数据,从一开始考虑到可扩展性,冗余和性能,同时利用Hadoop堆...
2012-4-26
14:08:15
27
在appengine上用compass来集成lucene实现全文搜索
using a compass + JDO Search on appengine Compass http://www.compass-project.org/ Demo video http://www.kimchy.org/searchable-google...
2010-4-27
17:01:56
28
How to read all the data from an Lucene index?
How to read all the data from a Lucene index? Document numbers start at 0. You will never get a document marked "deleted" from either IndexReader or IndexSearcher. IndexReader reader = IndexReader.open(....); for (int i = 0; i reader.maxDoc(...
2008-12-5
16:37:13
29
如何安装Nutch和Hadoop
Lucene Java, 提供了基于Java的索引和搜索技术. Nutch 是基于Lucene Java 的提供web 搜索应用软件 Hadoop 是被Nutch用来的分布式计算平台. Lucy 是Lucene Java开放的C的接口, with Perl and Ruby bindings. Solr 是一个基于Lucene建立的高性能搜索服务器, 有XML/HTTP 和JSON/Python/Ruby APIs, 关键字高亮, 结果中搜索, 缓存, 复制, 和...
2007-8-13
12:11:28
30
Lucene 基础指南
作者:lighter, 江南白衣 Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 Field:Document中的一个字段,相当于数据库中的Column ,Field是lucene比较多概念一个术语,详细见后。 ...
2007-2-2
12:59:06
31
Lucene: 忽略指定的字符(Escaping Special Characters)
Lucene: 忽略指定的字符(Escaping Special Characters)
2007-1-6
11:44:17
32
several existing strategies to clustering Lucene
All of this impacts how Lucene works in a cluster. Each node performing the search needs access to the index. To make search work in a clustered environment we must provide this. There are 3 ways of doing this. Use a shared file system between all ...
2006-12-5
19:50:11
33
用Terracotta 集群Lucene(Clustering Lucene with Terracotta)
www.theserverside.com昨天发布了一个消息:Terracotta 宣布他们发布的集群JVM技术Terracotta DSO,在Terracotta Public License下开放源代码。之前Orion Letizi和Steve 已经试过用Terracotta集群Lucene索引,并且工作得挺好。 Clustering Lucene和 Clustering Lucene, Part II: An Example You Can Try Yourself是Orion Letizi发布...
2006-12-5
19:41:54
34
Lucene FAQ
This is the official Lucene FAQ.
2006-11-4
14:27:16
35
Search-Enable Your Application with Lucene
By: Craig Walls The e-commerce Web site that I work on has seen several incarnations of its search feature. We started with plain vanilla SQL using "like" clauses, but this didn't perform well and left a lot to be desired in language feature...
2006-11-4
14:08:25
36
Integrate advanced search functionalities into your apps
集成Lucene的高级搜索功能到你的应用程序。 这篇文章谈到了,如何创建索引,如何使用条件搜索,如何对搜索结果排序
2006-10-17
14:12:05

<<上篇 1 2