基于Solr的HBase多条件查询测试

- - 互联网 - ITeye博客

某电信项目中采用HBase来存储用户终端明细数据，供前台页面即时查询. HBase无可置疑拥有其优势，但其本身只对rowkey支持毫秒级的快速检索，对于多字段的组合查询却无能为力. 针对HBase的多条件查询也有多种方案，但是这些方案要么太复杂，要么效率太低，本文只对基于Solr的 HBase多条件查询方案进行测试和验证.

Solr与HBase架构设计 - aitanjupt

- - 博客园_首页

摘要：本篇是本人在做一个大数据项目. ，对于系统架构总结的一点想法，如何在保证存储量的情况下，又能保证数据的检索速度. 前提： Solr、SolrCloud提供了一整套的数据检索方案，HBase提供了完善的大数据存储机制. 需求： 1、对于添加到HBase中的结构化数据，能够检索出来.

基于solr实现hbase的二级索引 - oO脾气不坏Oo

- - 博客园_首页

了解hbase的都知道，由于hbase基于行健有序存储，在查询时使用行健十分高效，然后想要实现关系型数据库那样可以随意组合的多条件查询、查询总记录数、分页等就比较麻烦了. 想要实现这样的功能，我们可以采用两种方法：. 使用hbase提供的filter，. 自己实现二级索引，通过二级索引查询多符合条件的行健，然后再查询hbase.

最近接触的项目中，需要针对HBase的数据进行索引查询，主要支持中文查询，分页查询等. 在此情况下，学习了搜索服务器solr. 总结了一些方法和经验，正好可以分享个大家，鼓励自己，共同学习. HBase目前只支持对rowkey的一级索引，对于二级索引还不支持，当然可以把所有要索引的字段都拼接到rowkey中，根据hbase的filter功能进行查询，但是这样操作数据会涉及到全表扫描，效率很低，速度慢，不利于后期扩展.

基于cdh5.7.5集群的solr(4.10.3-cdh5.7.5)+hbase(1.2.0-cdh5.7.5)构建二级索引方案

- - 行业应用 - ITeye博客

作为开发人员，在阅读该篇博客之前最好已具备以下基本技能：. 了解Linux命令、HBase Shell、Solr schema.xml文件的常用的标签含义、CDH集群基本操作(所需服务安装、卸载、配置). 在Hbase中,表的RowKey 按照字典排序, Region按照RowKey设置split point进行shard，通过这种方式实现的全局、分布式索引.

Solr SpellCheck 应用

- - 开源软件 - ITeye博客

通过对各类型的SpellCheck组件学习，完成项目拼写检查功能. 本文使用基于拼写词典的实现方式，solr版本为5.3.0. SpellCheck 简述. 拼写检查是对用户错误输入，响应正确的检查建议. 比如输入：周杰轮，响应：你是不是想找周杰伦. Solr的拼写检查大致可分为两类，基于词典与基于Solr索引.

Solr DocValues详解

- - 企业架构 - ITeye博客

什么是docValues. docValues是一种记录doc字段值的一种形式，在例如在结果排序和统计Facet查询时，需要通过docid取字段值的场景下是非常高效的. 为什么要使用docValues. 这种形式比老版本中利用fieldCache来实现正排查找更加高效，更加节省内存. 倒排索引将字段内存切分成一个term列表，每个term都对应着一个docid列表，这样一种结构使得查询能够非常快速，因为term对应的docid是现成就有的.

solr的使用

- - Web前端 - ITeye博客

solr的原理不和大家一一讲述，主要讲solr在使用过程中的注意事项. 首先是安装solr，安装步骤省略. （不要说我懒，安装步骤导出都是. 成功之后需要在solr里面建立一个针对你的业务的服务，我想建立一个叫做discuz的服务. 然后你在你的solr目录：solr-5.5.3/server/solr/ 下看见了discuz ，这是你刚刚创建的，针对某一业务的整个搜索配置都是在这个目录下配置的.

Solr调优参考

- - 淘宝网通用产品团队博客

共整理三部分，第一部分Solr常规处理，第二部分针对性性处理，前者比较通用，后者有局限性. 务必根据具体应用特性，具体调节参数，对比性能. 具体应用需要全面去把控，各个因素一起起作用. 第一部分. E文连接 http://wiki.apache.org/solr/SolrPerformanceFactors.

Solr之缓存篇

- - 淘宝网综合业务平台团队博客

Solr在Lucene之上开发了很多Cache功能，从目前提供的Cache类型有：. 而每种Cache针对具体的查询请求进行对应的Cache. 本文将从几个方面来阐述上述几种Cache在Solr的运用，具体如下：. （1）Cache的生命周期. （2）Cache的使用场景. （3）Cache的配置介绍.

基于Solr的HBase多条件查询测试

背景：

原理：

测试环境：

测试结果：

以下列出测试环境的搭建、以及相关代码实现过程。

一、Solr环境的搭建

二、读取HBase源表的数据，在Solr中建立索引

三、结合Solr进行HBase数据的多条件查询：

小结：

相关 [solr hbase 条件] 推荐：