solr安装-tomcat+solrCloud构建稳健solr集群

标签: solr tomcat solrcloud | 发表时间:2015-08-24 17:13 | 作者:ssxxjjii
出处:http://www.iteye.com

http://blog.csdn.net/xyls12345/article/details/27504965

solrCloud的搭建可以有两种方式:使用solr内嵌的jetty来搭建;使用外部web容器tomcat来搭建。对于使用jett来搭建参考solr官方的手册照着做肯定ok,下面我主要讲的是如何使用tomcat来搭建solrCloud。

 

废话不多说,开始我们的工作!

1.搭建tomcat单机版solr

见我的上一篇博文 solr安装-tomcat单机版

2.安装配置zookeeper

具体下载,安装,配置不详细说了,很简单。只列出我的关键配置项,如下:

clientPort=4181

server.2=hadoop.datanode5.com:2888:9888

server.3=hadoop.datanode2.com:2888:9888
server.1=hadoop.datanode3.com:2888:9888

3. 配置solrCloud

(1)先配置主服务器tomcat 10.2.50.46

vim /usr/apache-tomcat-7.0.54/bin/catalina.sh   在图片所示位置加入以下代码

JAVA_OPTS="$JAVA_OPTS -Dbootstrap_confdir=/usr/solr/collection1/conf -Dcollection.configName=myconf -DzkHost=hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181"

注:其中DzkHost是用来指定zookeeper服务器的ip和端口。 confdir目录指定所有的索引库都从collection1索引库中同步字段

 

(2)配置从服务器tomcat 10.2.50.28 和10.2.50.52

vim /home/tomcat/bin/catalina.sh 在和上图同样的位置加入

JAVA_OPTS="-DzkHost=hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181"

(3)配置solr collection配置文件

/usr/solr/solr.xml:配置hostport为tomcat的服务端口;配置zkHhost。

 

<solr><solrcloud><strname="host">${host:}</str><intname="hostPort">8080</int><strname="hostContext">${hostContext:solr}</str><intname="zkClientTimeout">${zkClientTimeout:15000}</int><boolname="genericCoreNodeNames">${genericCoreNodeNames:true}</bool><strname="zkHost">hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181</str></solrcloud><shardHandlerFactoryname="shardHandlerFactory"class="HttpShardHandlerFactory"><intname="socketTimeout">${socketTimeout:0}</int><intname="connTimeout">${connTimeout:0}</int></shardHandlerFactory></solr>

/usr/solr/collection1/core.properties:删除该文件(这样集群启动后就没有collection)

 

/usr/solr/collection1/conf/solrconfig.xml:修改如下配置项:

<dataDir>${solr.data.dir:/data_solr/example-collection}</dataDir>

 

将所有的这些配置同步到各个节点上。

(3) 保存后依次启动tomcat,输入http://10.2.50.46:8080,看到如下界面说明成功


正常情况下,应该是没有collection和core的,我这里是自己创建了一个collection。

(4)创建collection,shard,core

有两种方式:一种是创建collection,自动分配shard和replica;另一种是创建collection,手动分配shard和replica。推荐后者,因为可控性强。

方式一:

curl 'http://localhost:7070/solr/admin/collections?action=CREATE&name=europe-collection&numShards=3&replicationFactor=3&maxShardsPerNode=3'

这样会出来一个collection,它有3个shard,每个shard有1个数据节点,2个备份节点,即该collection共有9个core

缺点:不灵活,不能选择适合的节点,不能选择数据存放路径,不能选择实例存放路径

方式二:

curl 'http://localhost:8080/solr/admin/cores?action=CREATE&name=cz_collection-shard1-replica1&instanceDir=/usr/solr/cz_collection-shard1-replica1&dataDir=/data_solr/cz_collection-shard1-replica1&collection=cz_collection&shard=shard1'

curl 'http://localhost:8080/solr/admin/cores?action=CREATE&name=cz_collection-shard1-replica2&instanceDir=/usr/solr/cz_collection-shard1-replica2&dataDir=/data_solr/cz_collection-shard1-replica2&collection=cz_collection&shard=shard1'

这样可以创建出一个collection,并自己指定该collection的shard和replica的所有配置项。还可以继续接着创建。

以上两种方式的具体api调用,请参看solr官方文档。

(5)集群运维

a.集群会发生变化的就是collection的配置,因此当collection的配置文件发生变化后就应该使用命令更新zookeeper中配置文件信息,solr很好提供了运维工具:

#collection配置
#将配置文件上传到ZooKeeper中
java -classpath .:/usr/solr/lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181 -confdir /usr/solr/collection1/conf -confname myconf
#将上传到ZooKeeper中配置文件与Collection相关联
java -classpath .:/usr/solr/lib/* org.apache.solr.cloud.ZkCLI -cmd linkconfig -collection cz_collection -confname myconf -zkhost hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181

b.对于collection,shard,core运维使用api接口即可,在此不说了。

ok,大功告成 微笑!抽时间自己也写个类似solrCloud的东西玩玩!

 

参考文章:

http://myjeeva.com/solrcloud-cluster-single-collection-deployment.html#deploying-solrcloud

 

http://wiki.apache.org/solr/SolrCloudTomcat

http://wiki.apache.org/solr/SolrTomcat

http://blog.csdn.net/woshiwanxin102213/article/details/18793271



已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [solr tomcat solrcloud] 推荐:

solr安装-tomcat+solrCloud构建稳健solr集群

- - 互联网 - ITeye博客
solrCloud的搭建可以有两种方式:使用solr内嵌的jetty来搭建;使用外部web容器tomcat来搭建. 对于使用jett来搭建参考solr官方的手册照着做肯定ok,下面我主要讲的是如何使用tomcat来搭建solrCloud. 废话不多说,开始我们的工作. 1.搭建tomcat单机版solr.

solrCloud+tomcat+zookeeper集群配置

- - 研发管理 - ITeye博客
     SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作为集群的配置信息中心.    上面也说了  SolrCloud是基于Solr和Zookeeper的分布式搜索方案,所有要部署solrCloud+tomcat+zookeeper的集群,必须先安装zookeeper.

SolrCloud 4.3.1+Tomcat 7安装配置实践

- - 开源软件 - ITeye博客
我们使用Solr Replication可以实现Solr服务器的可用性,即使某一个索引副本由于磁盘介质故障或者误操作删除等,其他的多个复制副本仍然可以提供服务. 如果只是单纯的基于Solr Replication技术,只能对一个索引进行管理维护,当索引数据达到一定规模,搜索的性能成了瓶颈,除了重新规划设计索引,实现逻辑划分以外,没有更好地方法实现查询服务器的可扩展性.

SolrCloud简介

- - 开源软件 - ITeye博客
SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案. SolrCloud是Solr的基于Zookeeper一种部署方式. Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式. SolrCloud有几个特色功能:. 集中式的配置信息使用ZK进行集中配置.

solrcloud 部署方式比较

- - 研发管理 - ITeye博客
solrcloud 的部署其实有两种方式可选,那么我们在实践开发中应该怎样选择呢. 第一种:当启动solr服务器时,内嵌的启动一个Zookeeper服务器,然后将这些内嵌的Zookeeper服务器组成一个集群.  第二种:将Zookeeper服务器独立的配置一个集群,然后将solr交给Zookeeper进行管理.

Solr SpellCheck 应用

- - 开源软件 - ITeye博客
通过对各类型的SpellCheck组件学习,完成项目拼写检查功能. 本文使用基于拼写词典的实现方式,solr版本为5.3.0. SpellCheck 简述. 拼写检查是对用户错误输入,响应正确的检查建议. 比如输入:周杰轮,响应:你是不是想找 周杰伦. Solr的拼写检查大致可分为两类,基于词典与基于Solr索引.

Solr DocValues详解

- - 企业架构 - ITeye博客
什么是docValues. docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的. 为什么要使用docValues. 这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存. 倒排索引将字段内存切分成一个term列表,每个term都对应着一个docid列表,这样一种结构使得查询能够非常快速,因为term对应的docid是现成就有的.

solr的使用

- - Web前端 - ITeye博客
solr的原理不和大家一一讲述,主要讲solr在使用过程中的注意事项.  首先是安装solr,安装步骤省略. (不要说我懒,安装步骤导出都是. 成功之后 需要在solr里面建立一个针对你的业务的服务,我想建立一个叫做discuz的服务. 然后你在你的solr目录 :solr-5.5.3/server/solr/  下看见了discuz   ,这是你刚刚创建的,针对某一业务的整个搜索配置都是在这个目录下配置的.

solrCloud分布式检索流程

- - CSDN博客互联网推荐文章
好久没写solr的文章了,刚好需要在公司作个分享,先总结一些先. 引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991. solrCloud分布式检索主要流程如下:. 搜索   video,“美女斗秀场” 取按相关度排序取得2条记录~.

Solr调优参考

- - 淘宝网通用产品团队博客
共整理三部分,第一部分Solr常规处理,第二部分针对性性处理,前者比较通用,后者有局限性. 务必根据具体应用特性,具体调节参数,对比性能. 具体应用需要全面去把控,各个因素一起起作用. 第一部分. E文连接 http://wiki.apache.org/solr/SolrPerformanceFactors.