solr4.0环境搭建

标签: solr4 环境 | 发表时间:2012-11-18 22:00 | 作者:yangaming
出处:http://blog.csdn.net

因近期想搞个知识库,所以选择solr,现在最新的solr是4.0,所以用solr4.0。

服务器:tomcat6

  JDK   :1.6

 SOLR :4.0

中文分词器 :ik-analyzer,mmseg4j


安装:目前mmseg4j的版本是mmseg4j-1.9.0.v20120712-SNAPSHOT,经过测试,发现这个版本有bug:

	java.lang.RuntimeException: java.lang.NoSuchMethodError: org.apache.l
	ucene.analysis.Tokenizer.reset(Ljava/io/Reader;)V
	由于solr4.0对其中的有些类与方法做了调整,所以还是等待mmseg4j新版本修复吧。果断使用了ik-analyzer。
    一、将apache-solr-4.0.0\example\webapps\solr.war放在tomcat的webapps下启动服务器解压该war包,另外还需要增加几个jar包:
	apache-solr-dataimporthandler-4.0.0.jar
	apache-solr-dataimporthandler-extras-4.0.0.jar
	这两个jar包可以在solr的dist中可以找到
	另外还需要相应数据库的驱动包,比如
	mysql-connector-java-5.1.13-bin.jar
    二、将apache-solr-4.0.0\example下的solr拷贝至apache-tomcat-6.0.29-solr\bin下
    三、在apache-tomcat-6.0.29-solr\bin\solr\collection1\conf下的solrconfig.xml增加以下数据库配置
	  
  <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">     
          <lst name="defaults">     
               <str name="config">data-config.xml</str>     
          </lst>     
  </requestHandler> 

    四、将apache-tomcat-6.0.29-solr\bin\solr\collection1\conf下增加data-config.xml文件,内容如下:
	  
<dataConfig>  
    <dataSource type="JdbcDataSource"  
   driver="com.mysql.jdbc.Driver"  
   url="jdbc:mysql://localhost:3306/solrdb"  
   user="root"  
   password="888888"/>  
    <document name="content">  
        <entity name="node" query="select id,author,title,content from solrdb">  
            <field column="id" name="id" />  
            <field column="author" name="author" />  
            <field column="title" name="title" />  
            <field column="content" name="content" />
        </entity>  
    </document>  
</dataConfig>
 
    五、增加中文分词器,ik-analyzer的配置如下:
	它的安装部署十分简单,将IKAnalyzer2012.jar部署亍项目的lib目录中;IKAnalyzer.cfg.xml不stopword.dic文件放置在class根目录(对于web项目,通常是WEB-I	NF/classes目彔,同hibernate、log4j等配置文件相同)下即可
	solr4.0中schema.xml配置解析器:
	  
<schema name="example" version="1.1"> 
	…… 
	<fieldType name="text" class="solr.TextField"> 
		<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> 
	</fieldType>
	…… 
</schema>
六、schema.xml完整配置:
  
<?xml version="1.0" encoding="UTF-8" ?>  
<schema name="example" version="1.5">  
  <types>      

    <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>

  
      <fieldType name="string" class="solr.StrField" sortMissingLast="true" /> 
  <!-- IKAnalyzer 配置 -->
     <fieldType name="text" class="solr.TextField"> 
     	<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> 
     </fieldType>
   
</types>  
  
  
 <fields>  
   <field name="id" type="string" indexed="true" stored="true" required="true" /> 
   <field name="author" type="text" indexed="true" stored="true" multiValued="false"/>  
   <field name="title" type="text" indexed="true" stored="true" multiValued="false"/>  
   <field name="content" type="text" indexed="true" stored="true" multiValued="false" />  
   <field name="_version_" type="long" indexed="true" stored="true"/>
 </fields>  
  
 <uniqueKey>id</uniqueKey>  
 <defaultSearchField>content</defaultSearchField>  
 <solrQueryParser defaultOperator="OR"/>  
<copyField source="title" dest="content"/>  
<copyField source="author" dest="content"/>

  
</schema>  

解析:multiValued的个人理解是配置true则返回单条数据,false则可以返回多条,以后深入理解了再详解。defaultSearchField配置默认搜索索引,copyField可以讲 title、author字段添加至content默认搜索中
	七、登录管理页面:
	中文分词器分词的示例:
	  
	query示例:
	  

 


作者:yangaming 发表于2012-11-18 22:00:52 原文链接
阅读:0 评论:0 查看评论

相关 [solr4 环境] 推荐:

Hadoop环境搭建

- - 统计之都
Author:张丹(Conan). @晒粉丝 http://www.fens.me. @每日中国天气 http://apps.weibo.com/chinaweatherapp. RHadoop实践系列文章. RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析. Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.

jbpm环境搭建

- - 编程语言 - ITeye博客
   使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的实现.    工作流要解决的主要问题是:为实现某个业务目标,在多个参与者之间,利用计算机,按某种预定规则自动传递.   jbpm 即java Business Process Management,是基于java的业务流程管理系统引擎底层基于Active Diagram模型.

libgdx 环境搭建

- - CSDN博客推荐文章
1) libgdx 开发包下载: google code(最新 libgdx-0.9.7.zip    2012.11.12). 2) libgdx 主干源码下载: github tags. libgdx的android开发包主要有 gdx.jar, gdx-backend-android.jar,以及 armeabi 和 armeabi-v7a ( 区别).

solr4.0环境搭建

- - CSDN博客推荐文章
因近期想搞个知识库,所以选择solr,现在最新的solr是4.0,所以用solr4.0. 中文分词器 :ik-analyzer,mmseg4j. 安装:目前mmseg4j的版本是mmseg4j-1.9.0.v20120712-SNAPSHOT,经过测试,发现这个版本有bug:. 由于solr4.0对其中的有些类与方法做了调整,所以还是等待mmseg4j新版本修复吧.

与环境的互动

- 十年恋一人! - 玩意儿
本文原始链接:http://www.cngadget.cn/perfect-angle.html. 每个人都有特色的一面,当你的左脸变右脸.

appium windows下环境搭建

- - CSDN博客移动开发推荐文章
appium 介绍:Appium 是一个开源、跨平台的自动化测试工具,用于测试原生和轻量移动应用,支持 iOS, Android 和 FirefoxOS 平台. Appium 驱动苹果的 UIAutomation 库和 Android 的 UiAutomator 框架,使用 Selenium 的 WebDriver JSON 协议.

Android + Eclipse + PhoneGap 环境配置

- - CSDN博客推荐文章
用了3天的时间,终于把环境搭建完毕,郁闷了N天,终于完成了. 这里我只是讲述我安装的过程,仅供大家参考. 环境搭建首先要去下载一些安装包:. (下载前注意一下,电脑是32位还是64位的请注意选择安装包). java环境的JDK:http://www.oracle.com/technetwork/java/javase/downloads/index.html.

Java环境变量Classpath

- - 译言-电脑/网络/数码科技
Classpath是一个参数,它的值可以通过命令行指定,或者通过环境变量来指定. Classpath这个参数的值,被Java虚拟机或者Java编译器所使用,它告诉Java虚拟机机,Java编译器,去哪里寻找用户定义的类和包. 与传统的动态载入行为类似,当执行一个Java程序的时候,Java虚拟机会寻找和载入类(但是,只有当这个类被用到的时候,Java虚拟机才会载入它.

嵌入式环境搭建之开发板软件环境

- - CSDN博客推荐文章
转载请注明出处:http://blog.csdn.net/ruoyunliufeng/article/details/44995039. 开发板软件环境:uboot(用官方给的,后续我会考虑分析移植).                             内核(本来想用官方的降低难度,但给的不支持nfs,简单更改下吧,后续考虑移植精简新内核).

探秘 Twitter 和 Facebook 的办公环境

- 个篱 - 爱范儿 · Beats of Bits
Twitter 的办公室在旧金山,2009 年底搬进去的,之前是 Bebo 的办公室. 新的办公室内装颇具风格,由 Sara Morishige Williams 操刀,拥有宽敞的开放式办公空间,Twitter 元素更加十足:到处可见“@”和小鸟的图案. 充满小鸟元素,舒适、宽敞、自然的办公和休息区域:.