elasticsearch RESTful搜索引擎-(java jest 使用[入门])

标签: elasticsearch restful 搜索引擎 | 发表时间:2015-08-06 11:09 | 作者:
出处:http://m635674608.iteye.com

elasticsearch简称ES

jest

好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)

  • 它是ES的java客户端,基于http restful...
  • jest是开源的....其他就不清楚了,看源代码吧..哈.

如果对ES不了解请看: elasticsearch RESTful搜索引擎-简介

上一篇文章: elasticsearch RESTful搜索引擎-安装

费话不多说了,下面开始 ES -->> jest 入门

 

首先看看项目的目录结构

我一般习惯了用maven去管理我的项目...所以...看pom.xml吧 

 

Xml代码    收藏代码
  1. <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  
  2.     xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">  
  3.     <modelVersion>4.0.0</modelVersion>  
  4.     <groupId>com.mkfree</groupId>  
  5.     <artifactId>ES-jest</artifactId>  
  6.     <version>0.0.1-SNAPSHOT</version>  
  7.     <packaging>war</packaging>  
  8.     <dependencies>  
  9.         <!-- jest -->  
  10.         <dependency>  
  11.             <groupId>io.searchbox</groupId>  
  12.             <artifactId>jest</artifactId>  
  13.             <version>0.0.2</version>  
  14.         </dependency>  
  15.         <!-- elasticsearch  -->  
  16.         <dependency>  
  17.             <groupId>org.elasticsearch</groupId>  
  18.             <artifactId>elasticsearch</artifactId>  
  19.             <version>0.20.2</version>  
  20.         </dependency>  
  21.         <dependency>  
  22.             <groupId>junit</groupId>  
  23.             <artifactId>junit</artifactId>  
  24.             <version>4.10</version>  
  25.         </dependency>  
  26.     </dependencies>  
  27.     <repositories>  
  28.         <!-- 添加 sonatype仓库-->  
  29.         <repository>  
  30.             <id>sonatype</id>  
  31.             <name>Sonatype Groups</name>  
  32.             <url>https://oss.sonatype.org/content/groups/public/</url>  
  33.         </repository>  
  34.     </repositories>  
  35. </project>  

 1.配置jest客户端

 

InitES类

 

Java代码    收藏代码
  1. package com.mkfree.jest.config;  
  2.   
  3. import io.searchbox.client.JestClient;  
  4. import io.searchbox.client.JestClientFactory;  
  5. import io.searchbox.client.config.ClientConfig;  
  6. import io.searchbox.client.config.ClientConstants;  
  7.   
  8. import java.util.LinkedHashSet;  
  9.   
  10. /** 
  11.  * 初始化连接es服务端,这里相当于dao层..自己去理解吧.. 
  12.  *  
  13.  * @author hk 
  14.  *  
  15.  *         2013-1-12 下午11:27:37 
  16.  */  
  17. public class InitES {  
  18.   
  19.     /** 
  20.      * 静态,单例... 
  21.      */  
  22.     private static JestClient JestClient;  
  23.   
  24.     /** 
  25.      * 配置jest客户端,到时使用spring时,可以用配置方式 ,现在暂时使用new ... 
  26.      *  
  27.      * @return 
  28.      */  
  29.     private static ClientConfig clientConfig() {  
  30.         // es的服务端地址,暂时我是用我虚拟机的(ubuntu)做服务器  
  31.         String connectionUrl = "http://192.168.56.101:9200";// 一般都是9200端口  
  32.         ClientConfig clientConfig = new ClientConfig();  
  33.         // 当你用集群时,就有可能会有多个es的服务端,这里我暂时没有集群  
  34.         LinkedHashSetservers = new LinkedHashSet();  
  35.         servers.add(connectionUrl);  
  36.         clientConfig.getServerProperties().put(ClientConstants.SERVER_LIST, servers);  
  37.         clientConfig.getClientFeatures().put(ClientConstants.IS_MULTI_THREADED, false);  
  38.         return clientConfig;  
  39.     }  
  40.   
  41.     /** 
  42.      * 获取一个jest的对象 
  43.      *  
  44.      * @return 
  45.      */  
  46.     public static JestClient jestClient() {  
  47.         JestClientFactory factory = new JestClientFactory();  
  48.         factory.setClientConfig(clientConfig());  
  49.         if (JestClient != null) {  
  50.             JestClient = factory.getObject();  
  51.         }  
  52.         return JestClient;  
  53.     }  
  54. }  

 

 News 新闻类

 

Java代码    收藏代码
  1. package com.mkfree.jest.domain;  
  2.   
  3. import io.searchbox.annotations.JestId;  
  4.   
  5. /** 
  6.  * 虚拟news 搜索文章 
  7.  *  
  8.  * @author hk 
  9.  *  
  10.  *         2013-1-12 下午11:38:29 
  11.  */  
  12. public class News {  
  13.   
  14.     @JestId  
  15.     private int id;  
  16.     private String title;  
  17.     private String content;  
  18.   
  19.     public int getId() {  
  20.         return id;  
  21.     }  
  22.   
  23.     public void setId(int id) {  
  24.         this.id = id;  
  25.     }  
  26.   
  27.     public String getTitle() {  
  28.         return title;  
  29.     }  
  30.   
  31.     public void setTitle(String title) {  
  32.         this.title = title;  
  33.     }  
  34.   
  35.     public String getContent() {  
  36.         return content;  
  37.     }  
  38.   
  39.     public void setContent(String content) {  
  40.         this.content = content;  
  41.     }  
  42.   
  43. }  

 

 SearchService 搜索服务接口

 

Java代码    收藏代码
  1. package com.mkfree.jest.service;  
  2.   
  3. import io.searchbox.client.JestClient;  
  4. import io.searchbox.client.JestResult;  
  5. import io.searchbox.core.Bulk;  
  6. import io.searchbox.core.Index;  
  7. import io.searchbox.core.Search;  
  8. import io.searchbox.indices.CreateIndex;  
  9. import io.searchbox.indices.DeleteIndex;  
  10.   
  11. import java.io.IOException;  
  12. import java.util.List;  
  13.   
  14. import org.elasticsearch.index.query.QueryBuilder;  
  15. import org.elasticsearch.index.query.QueryBuilders;  
  16.   
  17. import com.mkfree.jest.config.InitES;  
  18. import com.mkfree.jest.domain.News;  
  19.   
  20. /** 
  21.  * es简单服务接口 
  22.  *  
  23.  * @author hk 
  24.  *  
  25.  *         2013-1-12 下午11:47:16 
  26.  */  
  27. public class SearchService {  
  28.   
  29.     private static JestClient jestClient = InitES.jestClient();  
  30.   
  31.     /** 
  32.      * 创建es news索引 
  33.      */  
  34.     public void builderSearchIndex() {  
  35.         int num = 10000;  
  36.         long start = System.currentTimeMillis();  
  37.         try {  
  38.             // 如果索引存在,删除索引  
  39.             DeleteIndex deleteIndex = new DeleteIndex("news");  
  40.             jestClient.execute(deleteIndex);  
  41.   
  42.             // 创建索引  
  43.             CreateIndex createIndex = new CreateIndex("news");  
  44.             jestClient.execute(createIndex);  
  45.             // Bulk 两个参数1:索引名称2:类型名称(用文章(article)做类型名称)  
  46.             Bulk bulk = new Bulk("news", "article");  
  47.             // 添加添加100万条假数据去服务端(ES)  
  48.             for (int i = 0; i < num; i++) {  
  49.                 News news = new News();  
  50.                 news.setId(i + 1);  
  51.                 news.setTitle("elasticsearch RESTful搜索引擎-(java jest 使用[入门])" + (i + 1));  
  52.                 news.setContent("好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)"  
  53.                         + (i + 1));  
  54.                 bulk.addIndex(new Index.Builder(news).build());  
  55.             }  
  56.             jestClient.execute(bulk);  
  57.         } catch (Exception e) {  
  58.             e.printStackTrace();  
  59.         }  
  60.         long end = System.currentTimeMillis();  
  61.         System.out.println("创建索引时间:数据量是  " + num + "记录,共用时间 -->> " + (end - start) + " 毫秒");  
  62.     }  
  63.   
  64.     /** 
  65.      * 搜索新闻 
  66.      *  
  67.      * @param param 
  68.      * @return 
  69.      */  
  70.     public ListsearchsNews(String param) {  
  71.         try {  
  72.             long start = System.currentTimeMillis();  
  73.             QueryBuilder queryBuilder = QueryBuilders.queryString(param);  
  74.             Search search = new Search(Search.createQueryWithBuilder(queryBuilder.toString()));  
  75.             search.addIndex("news");  
  76.             search.addType("article");  
  77.             JestResult result = jestClient.execute(search);  
  78.             long end = System.currentTimeMillis();  
  79.             System.out.println("在100万条记录中,搜索新闻,共用时间 -->> " + (end - start) + " 毫秒");  
  80.             return result.getSourceAsObjectList(News.class);  
  81.         } catch (IOException e) {  
  82.             e.printStackTrace();  
  83.         } catch (Exception e) {  
  84.             e.printStackTrace();  
  85.         }  
  86.         return null;  
  87.     }  
  88. }  

 

 最后,模拟action SearchAction

 

Java代码    收藏代码
  1. package com.mkfree.jest.action;  
  2.   
  3. import java.util.List;  
  4.   
  5. import org.junit.Test;  
  6.   
  7. import com.mkfree.jest.domain.News;  
  8. import com.mkfree.jest.service.SearchService;  
  9.   
  10. /** 
  11.  * 简单搜索控制器,暂时用junit去代替...(大家可以想想,怎么实现成web),下一篇会结合spring springmvc jest做成web方式... 
  12.  *  
  13.  * @author hk 
  14.  *  
  15.  *         2013-1-12 下午11:49:02 
  16.  */  
  17. public class SearchAction {  
  18.   
  19.     private SearchService searchService = new SearchService();  
  20.   
  21.     /** 
  22.      * 创建news索引 
  23.      */  
  24.     @Test  
  25.     public void buildSearchIndex() {  
  26.         searchService.builderSearchIndex();  
  27.     }  
  28.   
  29.     /** 
  30.      * 搜索新闻 
  31.      */  
  32.     @Test  
  33.     public void searchNews() {  
  34.         String param = "个人";  
  35.         Listnews = searchService.searchsNews(param);  
  36.         System.out.println("id   标题                                           内容");  
  37.         for (int i = 0; i < news.size(); i++) {  
  38.             News article = news.get(i);  
  39.             System.out.println(article.getId() + "   " + article.getTitle() + "   " + article.getContent());  
  40.         }  
  41.     }  
  42. }  

 以后就是全部的代码了...好了,下面我们执行创建索引

 

运行buildSearchIndex();现在我们是虚拟10000条记录
结果:

 

Java代码    收藏代码
  1. 创建索引时间:数据量是  10000记录,共用时间 -->> 4749 毫秒  

 效率方面感觉还好吧...

 

现在我们看回服务器输出的日志信息是什么..

红色框里,看到删除news索引后重新创建news索引,现在看看服务器那边的目录结构

创建的索引ES默认存放了data目录下,多了一个nodes的目录..ES的索引文件就保存在这里...概念性的理解我不多说了,我也不是很熟悉,慢慢研究...

下面执行搜索 searchNews();

结果:

 

Java代码    收藏代码
  1. 在10000条记录中,搜索新闻,共用时间 -->> 260 毫秒  
  2. id   标题                                                        内容  
  3. 2   elasticsearch RESTful搜索引擎-(java jest 使用[入门])2         好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)2  
  4. 7   elasticsearch RESTful搜索引擎-(java jest 使用[入门])7         好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)7  
  5. 14   elasticsearch RESTful搜索引擎-(java jest 使用[入门])14       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)14  
  6. 19   elasticsearch RESTful搜索引擎-(java jest 使用[入门])19       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)19  
  7. 21   elasticsearch RESTful搜索引擎-(java jest 使用[入门])21       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)21  
  8. 26   elasticsearch RESTful搜索引擎-(java jest 使用[入门])26       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)26  
  9. 33   elasticsearch RESTful搜索引擎-(java jest 使用[入门])33       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)33  
  10. 38   elasticsearch RESTful搜索引擎-(java jest 使用[入门])38       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)38  
  11. 40   elasticsearch RESTful搜索引擎-(java jest 使用[入门])40       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)40  
  12. 45   elasticsearch RESTful搜索引擎-(java jest 使用[入门])45       好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢)45  

 

 搜索结果是,从10000条记录中搜索出10条记录...至于下一页的...再研究吧..这次就先不说了,等下次结合spring 时,做成一个Web项目的时候再说了(加油吧...)

源代码下载: http://blog.mkfree.com/posts/38

 

本文章来自: http://blog.mkfree.com/posts/38

 

 

http://jkhhuse.iteye.com/blog/1871575

http://oyhk.iteye.com/blog/1769211

 

http://www.searchly.com/documentation/developer-api-guide/java-jest/





已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [elasticsearch restful 搜索引擎] 推荐:

elasticsearch RESTful搜索引擎-(java jest 使用[入门])

- - zzm
elasticsearch简称ES. 好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来更好,多多研究源代码吧...迟点,会写一些关于ES的源代码研究文章,现在暂时还是入门的阶段.哈..(不敢,不敢). 它是ES的java客户端,基于http restful.... jest是开源的....其他就不清楚了,看源代码吧..哈..

开源搜索引擎评估:lucene sphinx elasticsearch

- - 鲁塔弗的博客
lucene系,java开发,包括 solr和 elasticsearch. sphinx,c++开发,简单高性能. 搜索引擎程序这个名称不妥当,严格说来应该叫做 索引程序(indexing program),早期主要用来做中文全文搜索,但是随着互联网的深入普及,各家网站规模越来越大,索引程序在 优化网站架构上发挥了更大的作用: 替代mysql数据库 内置的索引.

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

- - zzm
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项. 由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络爬虫抓取到的网络资源进行实时的索引和搜索. 搜 索引擎架构在ElasticSearch之上,是一个典型的分布式在线实时交互查询架构,无单点故障,高伸缩、高可用.

分布式搜索引擎Elasticsearch的架构分析

- - 掘金后端
ES(Elasticsearch下文统一称为ES)越来越多的企业在业务场景是使用ES存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES作为传统关系型数据库的补充,提供了关系型数据库不具备的一些能力. ES最先进入大众视野的是其能够实现全文搜索的能力,也是由于基于Lucene的实现,内部有一种倒排索引的数据结构.

配置高性能 ElasticSearch 搜索引擎集群的9个小贴士

- - ITeye资讯频道
Loggly服务底层的很多核心功能都使用了ElasticSearch作为搜索引擎. 就像Jon Gifford(译者注:Loggly博客作者之一)在他近期关于“ElasticSearch vs Solr”的文章中所述,日志管理在搜索技术方面产生一些粗暴的需求,坚持下来以后,它必须能够:. 在超大规模数据集上可靠地进行准实时索引 – 在我们的案例中,每秒有超过100,000个日志事件与此同时,在该索引上可靠高效地处理超大量的搜索请求.

[译] 使用 Docker 和 Elasticsearch 搭建全文本搜索引擎应用

- - IT瘾-dev
作者简介:Patrick Triest是一位全栈工程师,数据爱好者,持续学习者,洁癖编程者. 作者github地址为 https://github.com/triestpa,本文地址参见 https://blog.patricktriest.com. 本文源码可以在GitHub repository 中找到 - https://github.com/triestpa/guttenberg-search.

利用kibana学习 elasticsearch restful api (DSL) - Ruthless - 博客园

- -
利用kibana学习 elasticsearch restful api (DSL). 1、了解elasticsearch基本概念. PUT 创建索引,eg:PUT /movie_index 新建movie_index索引. GET 用于检索数据,eg:GET movie_index/movie/1.

我的ElasticSearch集群部署总结--大数据搜索引擎你不得不知 - 王安琪

- - 博客园_首页
摘要:世上有三类书籍:1、介绍知识,2、阐述理论,3、工具书;世间也存在两类知识:1、技术,2、思想. 以下是我在部署ElasticSearch集群时的经验总结,它们大体属于第一类知识“techknowledge(技术)”. 关键词:ElasticSearch, 搜索引擎, 集群, 大数据, Solr, 大数据.

uSniff:BT种子搜索引擎

- leqoqo - 软件志
一、uSniff相关信息: 1、官方主页:http://www.usniff.com/ 2、简介:uSniff是一个BT种子搜索引擎,简单、易用、实时是其最大的优点,其搜索引擎数据库包含了17个知名种子站点的种子信息,目的是想发展成为世界上最大的BT种子搜索引擎,而且对于每个种子,该搜索引擎都会进行安全认证,以保证用户的正常使用.

资源搜索引擎

- - 不死鸟 - 分享为王官网
易搜 阿里百度夸克网盘搜索. tg中文搜索 电报资源搜索引擎. 千帆搜索 电报资源搜索引擎. 影视搜 影视聚合搜索引擎. 辅助狗 无捆绑软件搜索引擎. 查报告 可查询各行业的分析报告. 学霸盘 课程资料百度网盘. 库问搜索 PDF文献资料搜索.