Solr与HBase架构设计 - aitanjupt

- - 博客园_首页

摘要：本篇是本人在做一个大数据项目. ，对于系统架构总结的一点想法，如何在保证存储量的情况下，又能保证数据的检索速度. 前提： Solr、SolrCloud提供了一整套的数据检索方案，HBase提供了完善的大数据存储机制. 需求： 1、对于添加到HBase中的结构化数据，能够检索出来.

HBase 系统架构

- - 博客园_首页

HBase是Apache Hadoop的数据库，能够对大型数据提供随机、实时的读写访问. HBase的目标是存储并处理大型的数据. HBase是一个开源的，分布式的，多版本的，面向列的存储模型. 5 可在廉价PC Server搭建大规模结构化存储集群. HBase是Google BigTable的开源实现，其相互对应如下：.

HBASE数据架构

- - 数据库 - ITeye博客

关系数据库一般用B+树，HBASE用的是LSM树. MYSQL所用类B+树一般深度不超过3层，数据单独存放，在B+树的叶节点存储指向实际数据的指针，叶节点之间也相互关联，类似双向链表. 这种结构的特点是数据更新或写入导致数据页表分散，不利于顺序访问. LSM存储中，各个文件的结构类似于B+树，但是分多个存在内存或磁盘中，更新和写入变成了磁盘的顺序写，只在合并时去掉重复或过时的数据.

基于Solr的HBase多条件查询测试

- - 互联网 - ITeye博客

某电信项目中采用HBase来存储用户终端明细数据，供前台页面即时查询. HBase无可置疑拥有其优势，但其本身只对rowkey支持毫秒级的快速检索，对于多字段的组合查询却无能为力. 针对HBase的多条件查询也有多种方案，但是这些方案要么太复杂，要么效率太低，本文只对基于Solr的 HBase多条件查询方案进行测试和验证.

HBase Metrics机制、架构

- - 开源软件 - ITeye博客

HBase Metrics是一种监控信息实时收集机制. 功能性信息（Compaction Queue、Store Files个数等）. JVM使用信息 (Heap Memory 的变化). 借助与Hadoop Metrics同样的方式，向Ganglia汇报. Ganglia的架构图：. Ganglia相关特性：.

基于solr实现hbase的二级索引 - oO脾气不坏Oo

- - 博客园_首页

了解hbase的都知道，由于hbase基于行健有序存储，在查询时使用行健十分高效，然后想要实现关系型数据库那样可以随意组合的多条件查询、查询总记录数、分页等就比较麻烦了. 想要实现这样的功能，我们可以采用两种方法：. 使用hbase提供的filter，. 自己实现二级索引，通过二级索引查询多符合条件的行健，然后再查询hbase.

最近接触的项目中，需要针对HBase的数据进行索引查询，主要支持中文查询，分页查询等. 在此情况下，学习了搜索服务器solr. 总结了一些方法和经验，正好可以分享个大家，鼓励自己，共同学习. HBase目前只支持对rowkey的一级索引，对于二级索引还不支持，当然可以把所有要索引的字段都拼接到rowkey中，根据hbase的filter功能进行查询，但是这样操作数据会涉及到全表扫描，效率很低，速度慢，不利于后期扩展.

基于cdh5.7.5集群的solr(4.10.3-cdh5.7.5)+hbase(1.2.0-cdh5.7.5)构建二级索引方案

- - 行业应用 - ITeye博客

作为开发人员，在阅读该篇博客之前最好已具备以下基本技能：. 了解Linux命令、HBase Shell、Solr schema.xml文件的常用的标签含义、CDH集群基本操作(所需服务安装、卸载、配置). 在Hbase中,表的RowKey 按照字典排序, Region按照RowKey设置split point进行shard，通过这种方式实现的全局、分布式索引.

Solr SpellCheck 应用

- - 开源软件 - ITeye博客

通过对各类型的SpellCheck组件学习，完成项目拼写检查功能. 本文使用基于拼写词典的实现方式，solr版本为5.3.0. SpellCheck 简述. 拼写检查是对用户错误输入，响应正确的检查建议. 比如输入：周杰轮，响应：你是不是想找周杰伦. Solr的拼写检查大致可分为两类，基于词典与基于Solr索引.

Solr DocValues详解

- - 企业架构 - ITeye博客

什么是docValues. docValues是一种记录doc字段值的一种形式，在例如在结果排序和统计Facet查询时，需要通过docid取字段值的场景下是非常高效的. 为什么要使用docValues. 这种形式比老版本中利用fieldCache来实现正排查找更加高效，更加节省内存. 倒排索引将字段内存切分成一个term列表，每个term都对应着一个docid列表，这样一种结构使得查询能够非常快速，因为term对应的docid是现成就有的.

Solr与HBase架构设计 - aitanjupt

相关 [solr hbase 架构] 推荐：