ElasticSearch的JAVA客户端操作

标签： elasticsearch java 客户端 | 发表时间：2016-12-24 09:57 | 作者：diegolau

出处：http://www.iteye.com

一、java操作ES有两种客户端：

1、TransportClient：轻量级的Client，使用Netty线程池，Socket连接到ES集群。本身不加入到集群，只作为请求的处理。

2、Node Client：客户端节点本身也是ES节点，加入到集群，和其他ElasticSearch节点一样。频繁的开启和关闭这类Node Clients会在集群中产生“噪音”。

二、TransportClient的基本使用

1、创建Client

public ElasticSearchService(String ipAddress, int port) {

client = new TransportClient()

.addTransportAddress(new InetSocketTransportAddress(ipAddress,

port));

}

2、创建/删除Index和Type信息

// 创建索引

public void createIndex() {

client.admin().indices().create(new CreateIndexRequest(IndexName))

.actionGet();

}

// 清除所有索引

public void deleteIndex() {

IndicesExistsResponse indicesExistsResponse = client.admin().indices()

.exists(new IndicesExistsRequest(new String[] { IndexName }))

.actionGet();

if (indicesExistsResponse.isExists()) {

client.admin().indices().delete(new DeleteIndexRequest(IndexName))

.actionGet();

}

// 删除Index下的某个Type

public void deleteType(){

client.prepareDelete().setIndex(IndexName).setType(TypeName).execute().actionGet();

}

// 定义索引的映射类型

public void defineIndexTypeMapping() {

try {

XContentBuilder mapBuilder = XContentFactory.jsonBuilder();

mapBuilder.startObject()

.startObject(TypeName)

.startObject("properties")

.startObject(IDFieldName).field("type", "long").field("store", "yes").endObject()

.startObject(SeqNumFieldName).field("type", "long").field("store", "yes").endObject()

.startObject(IMSIFieldName).field("type", "string").field("index", "not_analyzed").field("store", "yes").endObject()

.startObject(IMEIFieldName).field("type", "string").field("index", "not_analyzed").field("store", "yes").endObject()

.startObject(DeviceIDFieldName).field("type", "string").field("index", "not_analyzed").field("store", "yes").endObject()

.startObject(OwnAreaFieldName).field("type", "string").field("index", "not_analyzed").field("store", "yes").endObject()

.startObject(TeleOperFieldName).field("type", "string").field("index", "not_analyzed").field("store", "yes").endObject()

.startObject(TimeFieldName).field("type", "date").field("store", "yes").endObject()

.endObject()

.endObject();

PutMappingRequest putMappingRequest = Requests

.putMappingRequest(IndexName).type(TypeName)

.source(mapBuilder);

client.admin().indices().putMapping(putMappingRequest).actionGet();

} catch (IOException e) {

log.error(e.toString());

}

这里自定义了某个Type的索引映射（Mapping），默认ES会自动处理数据类型的映射：针对整型映射为long，浮点数为double，字符串映射为string，时间为date，true或false为boolean。

注意：针对字符串，ES默认会做“analyzed”处理，即先做分词、去掉stop words等处理再index。如果你需要把一个字符串做为整体被索引到，需要把这个字段这样设置：field("index", "not_analyzed")。

详情参考：https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping-intro.html

3、索引数据

// 批量索引数据

public void indexHotSpotDataList(List<Hotspotdata> dataList) {

if (dataList != null) {

int size = dataList.size();

if (size > 0) {

BulkRequestBuilder bulkRequest = client.prepareBulk();

for (int i = 0; i < size; ++i) {

Hotspotdata data = dataList.get(i);

String jsonSource = getIndexDataFromHotspotData(data);

if (jsonSource != null) {

bulkRequest.add(client

.prepareIndex(IndexName, TypeName,

data.getId().toString())

.setRefresh(true).setSource(jsonSource));

}

BulkResponse bulkResponse = bulkRequest.execute().actionGet();

if (bulkResponse.hasFailures()) {

Iterator<BulkItemResponse> iter = bulkResponse.iterator();

while (iter.hasNext()) {

BulkItemResponse itemResponse = iter.next();

if (itemResponse.isFailed()) {

log.error(itemResponse.getFailureMessage());

}

// 索引数据

public boolean indexHotspotData(Hotspotdata data) {

String jsonSource = getIndexDataFromHotspotData(data);

if (jsonSource != null) {

IndexRequestBuilder requestBuilder = client.prepareIndex(IndexName,

TypeName).setRefresh(true);

requestBuilder.setSource(jsonSource)

.execute().actionGet();

return true;

}

return false;

}

// 得到索引字符串

public String getIndexDataFromHotspotData(Hotspotdata data) {

String jsonString = null;

if (data != null) {

try {

XContentBuilder jsonBuilder = XContentFactory.jsonBuilder();

jsonBuilder.startObject().field(IDFieldName, data.getId())

.field(SeqNumFieldName, data.getSeqNum())

.field(IMSIFieldName, data.getImsi())

.field(IMEIFieldName, data.getImei())

.field(DeviceIDFieldName, data.getDeviceID())

.field(OwnAreaFieldName, data.getOwnArea())

.field(TeleOperFieldName, data.getTeleOper())

.field(TimeFieldName, data.getCollectTime())

.endObject();

jsonString = jsonBuilder.string();

} catch (IOException e) {

log.equals(e);

}

return jsonString;

}

ES支持批量和单个数据索引。

4、查询获取数据

// 获取少量数据100个

private List<Integer> getSearchData(QueryBuilder queryBuilder) {

List<Integer> ids = new ArrayList<>();

SearchResponse searchResponse = client.prepareSearch(IndexName)

.setTypes(TypeName).setQuery(queryBuilder).setSize(100)

.execute().actionGet();

SearchHits searchHits = searchResponse.getHits();

for (SearchHit searchHit : searchHits) {

Integer id = (Integer) searchHit.getSource().get("id");

ids.add(id);

}

return ids;

}

// 获取大量数据

private List<Integer> getSearchDataByScrolls(QueryBuilder queryBuilder) {

List<Integer> ids = new ArrayList<>();

// 一次获取100000数据

SearchResponse scrollResp = client.prepareSearch(IndexName)

.setSearchType(SearchType.SCAN).setScroll(new TimeValue(60000))

.setQuery(queryBuilder).setSize(100000).execute().actionGet();

while (true) {

for (SearchHit searchHit : scrollResp.getHits().getHits()) {

Integer id = (Integer) searchHit.getSource().get(IDFieldName);

ids.add(id);

}

scrollResp = client.prepareSearchScroll(scrollResp.getScrollId())

.setScroll(new TimeValue(600000)).execute().actionGet();

if (scrollResp.getHits().getHits().length == 0) {

break;

}

return ids;

}

这里的QueryBuilder是一个查询条件，ES支持分页查询获取数据，也可以一次性获取大量数据，需要使用Scroll Search。

5、聚合（Aggregation Facet）查询

// 得到某段时间内设备列表上每个设备的数据分布情况<设备ID，数量>

public Map<String, String> getDeviceDistributedInfo(String startTime,

String endTime, List<String> deviceList) {

Map<String, String> resultsMap = new HashMap<>();

QueryBuilder deviceQueryBuilder = getDeviceQueryBuilder(deviceList);

QueryBuilder rangeBuilder = getDateRangeQueryBuilder(startTime, endTime);

QueryBuilder queryBuilder = QueryBuilders.boolQuery()

.must(deviceQueryBuilder).must(rangeBuilder);

TermsBuilder termsBuilder = AggregationBuilders.terms("DeviceIDAgg").size(Integer.MAX_VALUE)

.field(DeviceIDFieldName);

SearchResponse searchResponse = client.prepareSearch(IndexName)

.setQuery(queryBuilder).addAggregation(termsBuilder)

.execute().actionGet();

Terms terms = searchResponse.getAggregations().get("DeviceIDAgg");

if (terms != null) {

for (Terms.Bucket entry : terms.getBuckets()) {

resultsMap.put(entry.getKey(),

String.valueOf(entry.getDocCount()));

}

return resultsMap;

}

Aggregation查询可以查询类似统计分析这样的功能：如某个月的数据分布情况，某类数据的最大、最小、总和、平均值等。

详情参考：https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-aggs.html

本文参考：http://www.cnblogs.com/luxiaoxun/p/4869509.html

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

ElasticSearch的JAVA客户端操作

相关 [elasticsearch java 客户端] 推荐：

ElasticSearch的JAVA客户端操作

Elasticsearch：在 Java 客户端中使用 truststore 来创建 HTTPS 连接

elasticsearch java API------批量添加索引

elasticsearch RESTful搜索引擎-(java jest 使用[入门])

[转]Elasticsearch Java虚拟机配置详解（转）

Elasticsearch过滤与聚合的先后顺序java实现

JAVA的Corba客户端 - 服务端通信实现

Windows7+Eclipse环境下Hbase Java客户端的开发

java实现JT809协议数据对接客户端

[原]Jaeger的客户端采样配置(Java版)

相关文章

订阅