首页

搜索结果

"category:/database"

1 2 3 4 5 6 下篇>>

标题及摘要 日期/时间
1
十大最热门的大数据技术
预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险; NoSQL数据库:非关系型数据库包括Key-value型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库; 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据; 流式分析:软件可以对多个高吞吐量的数据...
2016-3-20
1:30:00
2
5分钟开启Esper之旅 - Binhua Liu - 博客园
在我之前发表的文章中,我提到我最近热衷于Complex Event Processing (CEP) (复杂事件处理)。简单来说,CEP把数据流作为输入,根据一系列预定义的规则,把数据(或部分数据)重定向给监听者们;又或者是当发现数据中的隐含的模式(Pattern)时,触发事件。在大量数据被产生出来并需要进行实时地分析的场景下,CEP特别有用。 有一个很不错的软件项目,可以让你做到这一点,叫做ESPER。你可以在这里找到该项目的网站。Esper向程序员提供一个称为EPL的语言,有些类似于SQL语言,它可...
2015-12-11
19:32:00
3
Oracle中B-TREE索引的深入理解(原创) - CzmMiao的博客生活 - ITeye技术网站
索引概述 索引与表一样,也属于段(segment)的一种。里面存放了用户的数据,跟表一样需要占用磁盘空间。只不过,在索引里的数据存放形式与表里的数据存放形式非常的不一样。在理解索引时,可以想象一本书,其中书的内容就相当于表里的数据,而书前面的目录就相当于该表的索引。同时,通常情况下,索引所占用的磁盘空间要比表...
2015-7-28
3:46:00
4
How to make searching faster ImproveSearchingSpeed - Lucene-java Wiki
How to make searching faster Here are some things to try to speed up the seaching speed of your Lucene application. Please seeImproveIndexingSpeedfor how to speed up indexing. Be sure you really need to speed things up.Many of the ideas here are ...
2015-7-24
17:10:00
5
使用Lucene的MoreLikeThisQuery实现相关内容推荐
在分析MoreLikeThisQuery之前,首先介绍一下MoreLikeThis。 在实现搜索应用的时候,时常会遇到"更多相似文章","更多相关问题"之类的需求,也即根据当前文档的文本内容,在索引库中查询相类似的文章。 我们可以使用MoreLikeThis实现此功能: IndexReader reader = IndexReader.open(……); ...
2015-4-19
23:58:00
6
lucene实现自定义的评分 - 学习笔记 - 博客频道 - CSDN.NET
Lucene按一个或多个字段进行排序是基本的功能,但可能需要更高级的自定义排序功能,并通过调整得分。Lucene自定义排序调整打分方法,有下面几种: 1、在索引阶段设置Document Boost和Field Boost,提升文档或字段的排名,例如: Document doc1 = new Document(); Field f1 = new Field("contents", "common hello hello", Field.Store.NO, Field...
2015-3-11
13:34:00
7
Lucene索引阶段设置Document Boost和Field Boost 实现合理打分 - 漫步天涯-IT - 博客频道 - CSDN.NET
在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。 如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。 这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。 如果不进行设定,则Document Boost和Field Boost默认为1。 Document Boost及FieldBoost的设定方式如下: ...
2015-3-10
15:48:00
8
lucene FieldCache 实现分组统计 - 记录我的点点滴滴 - 51CTO技术博客
所谓分组统计,就是类似sql里group by的功能。在solr里,这个功能称为faceting。lucene本身不支持分组统计,不过可以使用fieldCache来实现分组统计功能,而且也有很好的性能。solr根据不同的情况,还提供了其他方法(filterCache和UnInvertedField)来实现,这个以后再说。 fieldCache是lucene用来排序的缓存。对要用来排序的字段,lucene会从索引中将每篇文档该字段的值都读出来,放到一个大小为maxDoc的数组中。maxDoc是lucene内...
2015-3-10
15:15:00
9
记录Presto数据查询引擎的配置过程 - 夜丶帝 - 博客园
配置准备: 1、centos6.4系统的虚拟机4个(master、secondary、node1、node2) 2、准备安装包 hadoop-cdh4.4.0、hive-cdh4.4.0、presto、discovery-server、hbase、JDK7.0+64bit、pythin2.4+、postgresql 3、配置规划 主机:192.168.69.180 master (hadoop、hbase、discovery-server、hive、presto、postgresql) 副主...
2015-3-2
5:06:00
10
mysql-5.6 Slave支持crash-safe | ISADBA|FH.CN
mysql异常关机会导致slave复制故障,slave复制中断,解决办法是启用crash-safe,或者找到前一个pos号重新启动进行同步,或者使用relay_log_recovery=ON参数启动。 slave支持crash-safe是mysql-5.6复制功能最重要的改进之一。但是如何正确配置开启这个功能呢?我们来澄清一下如何完成. 具体方法: 1、停止slave的mysql实例 2、my.cnf文件中添加relay_log_info_repository=TABLE 和 relay_log_rec...
2015-1-21
17:57:00
11
Drill:企业级Hadoop和NoSQL的SQL查询引擎
Apache的Drill是一个开源的,用于Hadoop和NoSQL的低延迟SQL查询引擎。 现代大数据的应用,如社交,移动互联网,互联网和物联网有着大量的用户,比传统的事务应用程序更大的数据量。这些应用程序相关的数据集的发展非常迅速,往往是自我描述,可以包括复杂的类型,比如JSON,和Parquet。 Apache的Drill从底层建立了可伸缩性地提供低延迟查询对这种快速发展的多结构化数据集。 零日分析及快速应用开发 Apache的Drill可以直接查询自我描述和半结构化数据文件(如JSON,,P...
2015-1-8
23:50:00
12
Hue ——一个用于Apache Hadoop大数据分析的Web界面应用
Hue是一个用于Apache Hadoop分析数据的Web界面。它支持文件和作业浏览器,Hive,Pig,Impala,Spark,Oozie的编辑器,Solr的搜索仪表板,HBase,Sqoop2,等等。 Hue官方网站:http://gethue.com 它的特点: 文件浏览器用于访问HDFS 编辑器开发和运行Hive查询 搜索应用程序查询,探索,可视化数据和仪表板使用Solr Impala应用程序执行交互式SQL查询 Spark编辑器和Dashboard ...
2015-1-7
17:49:00
13
ElasticSearch: Java API | Javalobby
ElasticSearch Java API 官方文档: http://www.elasticsearch.org/guide/en/elasticsearch/client/java-api/current/index.html ElasticSearch提供了Java API,因此可通过使用Client对象异步执行所有操作。Client对象可以批量执行操作,累计。 Java的API可以在内部使用,以执行所有的API在ElasticSearch。 在本教程中,我们将考虑如何开展将Java API一些操作...
2015-1-5
18:19:00
14
Lucene 4.4 以后近实时NRT检索
Lucene4.4之后,NRTManager及NRTManagerReopenThread已经都没有了,如果做近实时搜索的话,就要这么做, 初始化: Directory directory = new RAMDirectory(); IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_48, new StandardAnalyzer(ver)); IndexWriter indexWriter = new IndexWriter(d...
2014-12-30
17:15:00
15
分布式搜索ElasticSearch构建集群与简单搜索实例应用 - 苏若年 - 博客园
分布式ElasticSearch集群构建的方法. 1.通过在程序中创建一个嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信. 复制代码 /**在运行该测试实例时,已经在本地建立了对应的索引库datum*/ public static void main(String[] args) { //当你启动一个节点,它会自动加入同网段的es集群,一个前提就是es的集群名(cluster.name)这个参数要设置一致。 String cluster...
2014-12-30
1:32:00
16
Code Samples - Zoie - Confluence
Zoie is a real-time search and indexing system built onApache Lucene. Donated byLinkedIn.comon July 19, 2008, and has been deployed in a real-time large-scale consumer website: LinkedIn.com handling millions of searches as well as millions of updates dail...
2014-12-28
19:43:00
17
Apache Solr vs ElasticSearch - the Feature Smackdown!
API Feature Solr 4.7.0 ElasticSearch 1.0 Format XML,CSV,JSON JSON HTTP REST API ...
2014-12-28
6:24:00
18
使用Lucene-Spatial实现集成地理位置的全文检索 - haiker - ITeye技术网站
Lucene通过Spatial包提供了对基于地理位置的全文检索的支持,最典型的应用场景就是:“搜索中关村附近1公里内的火锅店,并按远近排序”。使用Lucene-Spatial添加对地理位置的支持,和之前普通文本搜索主要有两点区别: 1. 将坐标信息转化为笛卡尔层,建立索引 [java]view plaincopyprint? privatevoidindexLocation(Documentdocument,JSONObjectjo) thro...
2014-12-28
6:17:00
19
向oracle中导入导出 *.csv文件 - Eolande - 博客园
在 Oracle 数据库中,我们通常在不同数据库的表间记录进行复制或迁移时会用以下几种方法: 1. A 表的记录导出为一条条分号隔开的 insert 语句,然后执行插入到 B 表中 2. 建立数据库间的 dblink,然后用 create tableB as select * fromA@dblinkwhere ...,或 insert intoB select * fromA@dblinkwhere ... 3. exp A表,再 imp 到 B 表,exp 时可加查询条件 4. 程序实现 selec...
2014-12-25
22:53:00
20
【log4jdbc】log4jdbc日志框架介绍_梁小坏Leo_新浪博客
配置方法 1.导入log4jdbcjar JDK1.4 JDK1.5 选择 log4jdbc3-1.2.jar JDK1.6 JDK1.7 选择 log4jdbc4-1.2.jar 2.导入SLF4J的jar 下载最新SLF4J http://www.slf4j.org/download.html 下载之后将得到2个jar文件,导入项目classpath 3.修改你的项目的JDBC驱动 Driver Class数据库类型 oracle.jdbc.driver.OracleDriverOlder O...
2014-12-24
21:02:00

1 2 3 4 5 6 下篇>>