ElasticSearch 2 (18) - 深入搜索系列之控制相关度 - Richaaaard - 博客园

- -

ElasticSearch 2 (18) - 深入搜索系列之控制相关度. 处理结构化数据（比如：时间、数字、字符串、枚举）的数据库只需要检查一个文档（或行，在关系数据库）是否与查询匹配. 布尔是/非匹配是全文搜索的基础部分，但不止这些，我们也同样需要知道每个文档与查询的相关度，在全文搜索引擎中我们不仅需要找到匹配的文档，还需要根据他们相关度的高低，对他们进行排序.

Elasticsearch：使用 Elasticsearch 进行语义搜索

- - 掘金后端

在数字时代，搜索引擎在通过浏览互联网上的大量可用信息来检索数据方面发挥着重要作用. 此方法涉及用户在搜索栏中输入特定术语或短语，期望搜索引擎返回与这些确切关键字匹配的结果. 虽然关键字搜索对于简化信息检索非常有价值，但它也有其局限性. 主要缺点之一在于它对词汇匹配的依赖. 关键字搜索将查询中的每个单词视为独立的实体，通常会导致结果可能与用户的意图不完全一致.

[Elasticsearch] 分布式搜索

- - 编程语言 - ITeye博客

本文翻译自Elasticsearch官方指南的 Distributed Search Execution一章. 在继续之前，我们将绕一段路来谈谈在分布式环境中，搜索是如何执行的. 和在分布式文档存储(Distributed Document Store)中讨论的基本CRUD操作相比，这个过程会更加复杂一些.

ElasticSearch入门-搜索如此简单

- - ITeye博客

搜索引擎我也不是很熟悉，但是数据库还是比较了解. 可以把搜索理解为数据库的like功能的替代品. 第一、like的效率不行，在使用like时，一般都用不到索引，除非使用前缀匹配，才能用得上索引. 第二、like的不能做到完全的模糊匹配. 比如like '%化痰冲剂%'就不能把”化痰止咳冲剂“搜索出来.

Elasticsearch搜索类型(query type)详解

- - ITeye博客

欢迎发送邮件至 [email protected]. 请支持原创 http://donlianli.iteye.com/blog/2094305. es在查询时，可以指定搜索类型为QUERY_THEN_FETCH,QUERY_AND_FEATCH,DFS_QUERY_THEN_FEATCH和DFS_QUERY_AND_FEATCH.

在基于Elasticsearch实现搜索建议一文中我们曾经介绍过如何基于Elasticsearch来实现搜索建议，而本文是在此基础上进一步优化搜索体验，在当搜索无结果或结果过少时提供推荐搜索词给用户. 在根据用户输入和筛选条件进行搜索后，有时返回的是无结果或者结果很少的情况，为了提升用户搜索体验，需要能够给用户推荐一些相关的搜索词，比如用户搜索【迪奥】时没有找到相关的商品，可以推荐搜索【香水】、【眼镜】等关键词.

基于Elasticsearch实现搜索建议

- - GinoBeFunny

搜索建议是搜索的一个重要组成部分，一个搜索建议的实现通常需要考虑建议词的来源、匹配、排序、聚合、关联的文档数和拼写纠错等，本文介绍一个基于Elasticsearch实现的搜索建议. 电商网站的搜索是最基础最重要的功能之一，搜索框上面的良好体验能为电商带来更高的收益，我们先来看看淘宝、京东、亚马逊网站的搜索建议.

【翻译】用 elasticsearch 和 elasticsearch 为数十亿次客户搜索提供服务

- - IT技术博客大学习

标签： elasticsearch elasticsearch 搜索. 原文地址： http://www.elasticsearch.org/blog/using-elasticsearch-and-logstash-to-serve-billions-of-searchable-events-for-customers/.

Elasticsearch分布式搜索架构原理 | Elasticsearch权威指南（中文版）

- -

在继续之前，我们将绕道讲一下搜索是如何在分布式环境中执行的. 它比我们之前讲的基础的增删改查(create-read-update-delete，CRUD)请求要复杂一些. 本章的信息只是出于兴趣阅读，使用Elasticsearch并不需要理解和记住这里的所有细节. 阅读这一章只是增加对系统如何工作的了解，并让你知道这些信息以备以后参考，所以别淹没在细节里.

开源搜索引擎评估:lucene sphinx elasticsearch

- - 鲁塔弗的博客

lucene系,java开发,包括 solr和 elasticsearch. sphinx,c++开发,简单高性能. 搜索引擎程序这个名称不妥当,严格说来应该叫做索引程序(indexing program),早期主要用来做中文全文搜索,但是随着互联网的深入普及,各家网站规模越来越大,索引程序在优化网站架构上发挥了更大的作用: 替代mysql数据库内置的索引.

ElasticSearch 2 (18) - 深入搜索系列之控制相关度 - Richaaaard - 博客园

ElasticSearch 2 (18) - 深入搜索系列之控制相关度

摘要

版本

内容

背后的理论（Theory Behind Relevance Scoring）

布尔模型（Boolean Model）

词频/逆向文档频率（TF/IDF）

词频（Term frequency）

逆向文档频率（Inverse document frequency）

字段长度正则值（Field-length norm）

结合（Putting it together）

向量空间（Vector Space Model）

Lucene的计分函数（Lucene’s Practical Scoring Function）

查询正则因子（Query Normalization Factor）

查询协调（Query Coordination）

索引时字段层权重提升（Index-Time Field-Level Boosting）

查询时权重提升（Query-Time Boosting）

提升索引权重（Boosting an Index）

t.getBoost()

使用查询结构修改相关度（Manipulating Relevance with Query Structure）

不完全不（Not Quite Not）

权重提升查询（boosting Query）

忽略TF/IDF（Ignoring TF/IDF）

constant_score查询

function_score查询（function_score Query）

流行度提升权重（Boosting by Popularity）

修饰语（modifier）

因子（factor）

提升模式（boost_mode）

最大提升值（max_boost）

提升过滤集权重（Boosting Filtered Subsets）

过滤vs.查询（filter Versus query）

函数（functions）

score_mode

随机计分（Random Scoring）

越近越好（The Closer, The Better）

理解价格语句（Understanding the price Clause）

脚本评分（Scoring with Scripts）

可插拔的相似度算法（Pluggable Similarity Algorithms）

Okapi BM25

词频饱和度（Term-frequency saturation）

字段长正则化（Field-length normalization）

BM25调优（Tuning BM25）

修改相似度（Changing Similarities）

配置BM25（Configuring BM25）

调试相关度是最后10%的事情（Relevance Tuning Is the Last 10%）

参考

相关 [elasticsearch 搜索 系列] 推荐：

相关文章

订阅

相关 [elasticsearch 搜索系列] 推荐：