solrCloud分布式检索流程

标签: solrcloud 分布 检索 | 发表时间:2013-11-29 07:49 | 作者:duck_genuine
出处:http://blog.csdn.net

好久没写solr的文章了,刚好需要在公司作个分享,先总结一些先。

引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991

solrCloud分布式检索主要流程如下:

检索流程


搜索   video,“美女斗秀场” 取按相关度排序取得2条记录~

过程是:

从集群里得知:video—>两个分片信息

所以请求被并行分发到两个分片搜索,各自取top2

第一次返回
返回:

shard1返回:

vid:score
1,   0.5f
2,   0.3f

shard2返回:

vid:score
3,    0.6f
4,   0.2f 


合并结果:取top2
vid:score 
3,    0.6f    (shard2)
1,    0.5f    (shard1)



再取正向文档数据:


通过主键并行去两个分片取正向文档数据:字段(vid,times,hd)
文档id分别:

3:

{vid:3,times:100,hd:1}

1:

{vid:1,times:200,hd:0}



再合并结果返回


如果是要翻页,也就是取第3到第4个结果,则会发起请求每一个分片返回4个结果再合并排序

引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991




作者:duck_genuine 发表于2013-11-28 23:49:28 原文链接
阅读:67 评论:0 查看评论

相关 [solrcloud 分布 检索] 推荐:

solrCloud分布式检索流程

- - CSDN博客互联网推荐文章
好久没写solr的文章了,刚好需要在公司作个分享,先总结一些先. 引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991. solrCloud分布式检索主要流程如下:. 搜索   video,“美女斗秀场” 取按相关度排序取得2条记录~.

分布式全文检索系统SolrCloud简介

- - UC技术博客
本文简单描述SolrCloud的特性,基本结构和入门,基于Solr4.5版本. Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库. Solr是以Lucene为基础实现的文本检索应用服务. SolrCloud是Solr4.0版本开发出的具有开创意义的基于Solr和Zookeeper的分布式搜索方案,或者可以说,SolrCloud是Solr的一种部署方式.

SolrCloud简介

- - 开源软件 - ITeye博客
SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案. SolrCloud是Solr的基于Zookeeper一种部署方式. Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式. SolrCloud有几个特色功能:. 集中式的配置信息使用ZK进行集中配置.

solrCloud+tomcat+zookeeper集群配置

- - 研发管理 - ITeye博客
     SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作为集群的配置信息中心.    上面也说了  SolrCloud是基于Solr和Zookeeper的分布式搜索方案,所有要部署solrCloud+tomcat+zookeeper的集群,必须先安装zookeeper.

solrcloud 部署方式比较

- - 研发管理 - ITeye博客
solrcloud 的部署其实有两种方式可选,那么我们在实践开发中应该怎样选择呢. 第一种:当启动solr服务器时,内嵌的启动一个Zookeeper服务器,然后将这些内嵌的Zookeeper服务器组成一个集群.  第二种:将Zookeeper服务器独立的配置一个集群,然后将solr交给Zookeeper进行管理.

SolrCloud 4.3.1+Tomcat 7安装配置实践

- - 开源软件 - ITeye博客
我们使用Solr Replication可以实现Solr服务器的可用性,即使某一个索引副本由于磁盘介质故障或者误操作删除等,其他的多个复制副本仍然可以提供服务. 如果只是单纯的基于Solr Replication技术,只能对一个索引进行管理维护,当索引数据达到一定规模,搜索的性能成了瓶颈,除了重新规划设计索引,实现逻辑划分以外,没有更好地方法实现查询服务器的可扩展性.

分布式检索系统 ElasticSearch

- - 丕子
ElasticSearch最近发展不错,github等都用它,可以关注I下. ElasticSearch是分布式,REST风格,搜索和分析系统. 具有实时数据,实时分析,分布式,高可用性,多租户,全文搜索,面向文档,冲突管理,自由模式,rest风格API,每个操作的持久性,Apache 2的开源许可证,基于Apache Lucene之上的特点.

SolrCloud你值得拥有,性能表现良好

- - CSDN博客互联网推荐文章
转贴请声明原文: http://blog.csdn.net/duck_genuine/article/details/8644412. solrCloud的压力测试:. 上一篇文章提过使用solr3.6做的架构优化. 测试的时候还没有做更大数据量的并发请求压测试,最近来了新机器,比之前更加好,但没想要把索引放内存,而是放在ssd,内存是满 足的,但使用高于线上2倍多请求的时候,响应就没有之前那么良好,有下降的趋势,即使再加多8个core顶住 ,表现还是差差的.

solr安装-tomcat+solrCloud构建稳健solr集群

- - 互联网 - ITeye博客
solrCloud的搭建可以有两种方式:使用solr内嵌的jetty来搭建;使用外部web容器tomcat来搭建. 对于使用jett来搭建参考solr官方的手册照着做肯定ok,下面我主要讲的是如何使用tomcat来搭建solrCloud. 废话不多说,开始我们的工作. 1.搭建tomcat单机版solr.

MySQL全文检索笔记

- - 博客园_首页
MySQL 4.x版本及以上版本提供了全文检索支持,但是表的存储引擎类型必须为MyISAM,以下是建表SQL,注意其中显式设置了存储引擎类型.    其中FULLTEXT(title, body) 给title和body这两列建立全文索引,之后检索的时候注意必须同时指定这两列.    说明全文匹配时忽略大小写.