首页

搜索结果

"tag:"java""

<<上篇 1 2 3 4 5 6 7 8 9 10 11 12 13 ... 下篇>>

标题及摘要 日期/时间
41
java Jackson 库操作 json 的基本演示 - joyous的专栏 - 博客频道 - CSDN.NET
核心库下载地址 http://repo1.maven.org/maven2/com/fasterxml/jackson/core/ jackson-annotations-2.2.2.jar jackson-core-2.2.2.jar jackson-databind-2.2.2.jar 文件类型支持模块 http://repo1.maven.org/maven2/com/fasterxml/jackson/dataformat/ jackson-dataformat-xml-2.2.2.jar 导...
2015-1-29
5:19:51
42
Drill:企业级Hadoop和NoSQL的SQL查询引擎
Apache的Drill是一个开源的,用于Hadoop和NoSQL的低延迟SQL查询引擎。 现代大数据的应用,如社交,移动互联网,互联网和物联网有着大量的用户,比传统的事务应用程序更大的数据量。这些应用程序相关的数据集的发展非常迅速,往往是自我描述,可以包括复杂的类型,比如JSON,和Parquet。 Apache的Drill从底层建立了可伸缩性地提供低延迟查询对这种快速发展的多结构化数据集。 零日分析及快速应用开发 Apache的Drill可以直接查询自我描述和半结构化数据文件(如JSON,,P...
2015-1-8
23:50:00
43
ElasticSearch: Java API | Javalobby
ElasticSearch Java API 官方文档: http://www.elasticsearch.org/guide/en/elasticsearch/client/java-api/current/index.html ElasticSearch提供了Java API,因此可通过使用Client对象异步执行所有操作。Client对象可以批量执行操作,累计。 Java的API可以在内部使用,以执行所有的API在ElasticSearch。 在本教程中,我们将考虑如何开展将Java API一些操作...
2015-1-5
18:19:00
44
Lucene 4.4 以后近实时NRT检索
Lucene4.4之后,NRTManager及NRTManagerReopenThread已经都没有了,如果做近实时搜索的话,就要这么做, 初始化: Directory directory = new RAMDirectory(); IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_48, new StandardAnalyzer(ver)); IndexWriter indexWriter = new IndexWriter(d...
2014-12-30
17:15:00
45
分布式搜索ElasticSearch构建集群与简单搜索实例应用 - 苏若年 - 博客园
分布式ElasticSearch集群构建的方法. 1.通过在程序中创建一个嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信. 复制代码 /**在运行该测试实例时,已经在本地建立了对应的索引库datum*/ public static void main(String[] args) { //当你启动一个节点,它会自动加入同网段的es集群,一个前提就是es的集群名(cluster.name)这个参数要设置一致。 String cluster...
2014-12-30
1:32:00
46
Code Samples - Zoie - Confluence
Zoie is a real-time search and indexing system built onApache Lucene. Donated byLinkedIn.comon July 19, 2008, and has been deployed in a real-time large-scale consumer website: LinkedIn.com handling millions of searches as well as millions of updates dail...
2014-12-28
19:43:00
47
Apache Solr vs ElasticSearch - the Feature Smackdown!
API Feature Solr 4.7.0 ElasticSearch 1.0 Format XML,CSV,JSON JSON HTTP REST API ...
2014-12-28
6:24:00
48
使用Lucene-Spatial实现集成地理位置的全文检索 - haiker - ITeye技术网站
Lucene通过Spatial包提供了对基于地理位置的全文检索的支持,最典型的应用场景就是:“搜索中关村附近1公里内的火锅店,并按远近排序”。使用Lucene-Spatial添加对地理位置的支持,和之前普通文本搜索主要有两点区别: 1. 将坐标信息转化为笛卡尔层,建立索引 [java]view plaincopyprint? privatevoidindexLocation(Documentdocument,JSONObjectjo) thro...
2014-12-28
6:17:00
49
【log4jdbc】log4jdbc日志框架介绍_梁小坏Leo_新浪博客
配置方法 1.导入log4jdbcjar JDK1.4 JDK1.5 选择 log4jdbc3-1.2.jar JDK1.6 JDK1.7 选择 log4jdbc4-1.2.jar 2.导入SLF4J的jar 下载最新SLF4J http://www.slf4j.org/download.html 下载之后将得到2个jar文件,导入项目classpath 3.修改你的项目的JDBC驱动 Driver Class数据库类型 oracle.jdbc.driver.OracleDriverOlder O...
2014-12-24
21:02:00
50
使用HBase EndPoint(coprocessor)进行计算 « 搜索技术博客-淘宝
如果要统对hbase中的数据,进行某种统计,比如统计某个字段最大值,统计满足某种条件的记录数,统计各种记录特点,并按照记录特点分类(类似于sql的group by)~ 常规的做法就是把hbase中整个表的数据scan出来,或者稍微环保一点,加一个filter,进行一些初步的过滤(对于rowcounter来说,就加了FirstKeyOnlyFilter),但是这么做来说还是会有很大的副作用,比如占用大量的网络带宽(当标级别到达千万级别,亿级别之后)尤为明显,RPC的...
2014-12-9
1:25:00
51
hbase用coprocessor实现二级索引 | 邓的博客
HBase在0.92之后引入了coprocessors,提供了一系列的钩子,让我们能够轻易实现访问控制和二级索引的特性。下面简单介绍下两种coprocessors,第一种是Observers,它实际类似于触发器,第二种是Endpoint,它类似与存储过程。由于这里只用到了Observers,所以只介...
2014-12-9
1:17:00
52
[HBase] Hbase Coprocessors - 芒果先生Mango的专栏 - 博客频道 - CSDN.NET
本文是笔者学习过程中的简单笔记,日后会逐渐增加内容,主要参考资料是《Hbase The Definitive Guide》。 我们可以通过Filter来减少从Server到Client在网络上传输的数据总量,以提升效率。通过HBase的Coprocessor特性,我们甚至可以将计算(computation)移动到数据所在的节点。 Introduction to Coprocessors coprocessor使你能够直接在每个region server上执行任意的代码。更精确地说,它提供一些通过事件触发的...
2014-12-9
1:10:00
53
HBase Coprocessor 剖析与编程实践 - 林场 - 博客园
1.起因(Why HBase Coprocessor) HBase作为列族数据库最经常被人诟病的特性包括:无法轻易建立“二级索引”,难以执行求和、计数、排序等操作。比如,在旧版本的(0.92)Hbase中,统计数据表的总行数,需要使用Counter方法,执行一次MapReduce Job才能得到。虽然HBase在数据存储层中集成了MapReduce,能够有效用于数据表的分布式计算。然而在很多情况下,做一些简单的相加或者聚合计算的时候,如果直接将计算过程放置在server端,能够减少...
2014-12-9
1:04:00
54
如何使用Hadoop的Partitioner - 三劫散仙 - ITeye技术网站
Partitioner的作用: 对map端输出的数据key作一个散列,使数据能够均匀分布在各个reduce上进行后续操作,避免产生热点区。 Hadoop默认使用的分区函数是Hash Partitioner,源码如下: Java代码 /** *LicensedtotheApacheSoftwareFoundation(ASF)underone *ormorecontributorlicenseagreements.SeetheNOTICEfile *distribu...
2014-12-6
0:53:00
55
MapReduce:详解Shuffle过程 - 每天一小步 - ITeye技术网站
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuffle是必须要了解的。我看过很多相关的资料,但每次看完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job 性能调优的工作,需要深入代码研究MapReduce的运行机制,这才对Shuffle探了个究竟。考虑到之前我在看相关资料而看不懂时很恼火,所以在这里我尽最大的可能试着把Shuffle说清楚,让每一位想了解它原理的朋友都能有所收获。如果你对这篇文章有任...
2014-12-6
0:18:00
56
hadoop中MapReduce多种join实现实例分析 - 蚂蚁 - 51CTO技术博客
一、概述 对于RDBMS中的join操作大伙一定非常熟悉,写sql的时候要十分注意细节,稍有差池就会耗时巨久造成很大的性能瓶颈,而在Hadoop中使用MapReduce框架进行join的操作时同样耗时,但是由于hadoop的分布式设计理念的特殊性,因此对于这种join操作同样也具备了一定的特殊性。本文主要对M...
2014-12-5
22:48:00
57
为你的 Hadoop 集群选择合适的硬件 - 技术翻译 - 开源中国社区
这是在一个平衡Hadoop集群中,为数据节点/任务追踪器提供的推荐规格: 在一个磁盘阵列中要有12到24个1~4TB硬盘 2个频率为2~2.5GHz的四核、六核或八核CPU 64~512GB的内存 有保障的千兆或万兆以太网(存储密度越大,需要的网络吞吐量越高) 名字节点角色负责协调集群上的数据存储,作业追踪器协调数据处理(备用的名字节点不应与集群中的名字节点共存,并且运行在与之相同的硬件环境上。)。Cloudera推荐客户购买在RAID1或10配置上有足够功率和企业级磁...
2014-12-5
19:34:00
58
Dubbo Zookeeper 初探
2. 服务提供者的工程 a. dubbo-demo-api 定义接口 1 2 3 public interface IProcessData { public String deal(String data); } ...
2014-12-4
19:45:00
59
HBase性能调优 | Ken Wu's Blog
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。 配置优化 zookeeper.session.timeout 默认值:3分钟(180000ms) 说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServer会被Zookeeper从RS集群清单中移除,HMaster收到移除通知后,会对这台server负责的regions重新...
2014-11-29
17:08:00
60
hbase 优化 - 阿里古古 - ITeye技术网站
主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考:淘宝Ken Wu同学的博客。 1. 表的设计 1.1 Pre-Creating Regions 默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入HBase时,会...
2014-11-29
17:03:00

<<上篇 1 2 3 4 5 6 7 8 9 10 11 12 13 ... 下篇>>