分布式检索系统 ElasticSearch

标签: 技术 ElasticSearch 分布式 搜索 | 发表时间:2014-01-07 14:49 | 作者:丕子
出处:http://www.zhizhihu.com

ElasticSearch最近发展不错,github等都用它,可以关注I下。

ElasticSearch是分布式,REST风格,搜索和分析系统。具有实时数据,实时分析,分布式,高可用性,多租户,全文搜索,面向文档,冲突管理,自由模式,rest风格API,每个操作的持久性,Apache 2的开源许可证,基于Apache Lucene之上的特点。

http://www.elasticsearch.org/

相关 [分布 检索 系统] 推荐:

分布式检索系统 ElasticSearch

- - 丕子
ElasticSearch最近发展不错,github等都用它,可以关注I下. ElasticSearch是分布式,REST风格,搜索和分析系统. 具有实时数据,实时分析,分布式,高可用性,多租户,全文搜索,面向文档,冲突管理,自由模式,rest风格API,每个操作的持久性,Apache 2的开源许可证,基于Apache Lucene之上的特点.

分布式全文检索系统SolrCloud简介

- - UC技术博客
本文简单描述SolrCloud的特性,基本结构和入门,基于Solr4.5版本. Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库. Solr是以Lucene为基础实现的文本检索应用服务. SolrCloud是Solr4.0版本开发出的具有开创意义的基于Solr和Zookeeper的分布式搜索方案,或者可以说,SolrCloud是Solr的一种部署方式.

solrCloud分布式检索流程

- - CSDN博客互联网推荐文章
好久没写solr的文章了,刚好需要在公司作个分享,先总结一些先. 引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991. solrCloud分布式检索主要流程如下:. 搜索   video,“美女斗秀场” 取按相关度排序取得2条记录~.

再收集一下基于内容图像检索系统

- Peter - 丕子
基于内容图像检索已经发展二十多年,基本简单技术已经成熟,总结一下几个系统. 下面的十款搜索引擎可以帮你实现,以图找图,以图搜图,以图片搜索相似的图片. 一:http://tineye.com/. Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意.

基于内容的图像检索系统(合集)

- - CSDN博客推荐文章
基于内容的图像检索,即CBIR(Content-based image retrieval),是计算机视觉领域中关注大规模数字图像内容检索的研究分支. 典型的CBIR系统,允许用户输入一张图片,以查找具有相同或相似内容的其他图片. 而传统的图像检索是基于文本的,即通过图片的名称、文字信息和索引关系来实现查询功能.

为什么标签系统和全文检索还不够好用?

- - 滯銷書
Web 2.0 概念红火的时候,Delicious、Flickr 等服务如日中天,其使用标签(tag)管理和检索内容的方式也颇受追捧,网站和应用程序纷纷学习. 但这么些年用下来,除了 Delicious 之外,并没有觉得标签有多好用,特别是像 Evernote 和为知这样需要保存内容的笔记工具. 一个原因是,不支持组合标签的标签系统就是残废.

分布式缓存系统 Xixibase

- Le - 开源中国社区最新软件
Xixibase是一个高性能,跨平台的分布式缓存系统. Xixibase server 采用 C++ 实现,底层网络库采用的是Boost Asio. Xixibase 主要特点: 1. 实现'Local Cache'功能, 当客户端打开'Local Cache'选项, 客户端可以将数据同时存储在Server 端和本地,并且保证本地数据和Server 端的数据的一致性.

分布式消息系统:Kafka

- - 标点符
Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发,之后成为Apache项目的一部分. Kafka是一个分布式的,可划分的,冗余备份的持久性的日志服务. 在大数据系统中,常常会碰到一个问题,整个大数据是由各个子系统组成,数据需要在各个子系统中高性能,低延迟的不停流转. 传统的企业消息系统并不是非常适合大规模的数据处理.

分布式系统介绍-PNUTS

- - CSDN博客推荐文章
PNUTS是Yahoo!的分布式数据库系统,支持地域上分布的大规模并发操作. 它根据主键的范围区间或者其哈希值的范围区间将表拆分为表单元(Tablet),多个表单元存储在一个服务器上. 一个表单元控制器根据服务器的负载情况,进行表单元的迁移和拆分. 每条记录的数据都没有固定的模式(采用JSON格式的文本).

Ganglia:分布式监控系统

- - CSDN博客移动开发推荐文章
1         环境安装配置. 1.1      依赖软件下载. Ganglia是伯克利开发的一个集群监控软件. 可以监视和显示集群中的节点的各种状态信息,比如如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现. 而ganglia又依赖于一个web服务器用来显示集群状态,用rrdtool来存储数据和生成曲线图,需要xml解析因此需要expat,配置文件解析需要libconfuse.