首页

搜索结果

"category:/database"

<<上篇 1 2 3 4 5 6 下篇>>

标题及摘要 日期/时间
41
B-树和B+树的应用:数据搜索和数据库索引 - guisu,程序人生。 - 博客频道 - CSDN.NET
B-树 1 .B-树定义 B-树是一种平衡的多路查找树,它在文件系统中很有用。 定义:一棵m 阶的B-树,或者为空树,或为满足下列特性的m 叉树: ⑴树中每个结点至多有m 棵子树; ⑵若根结点不是叶子结点,则至少有两棵子树; ⑶除根结点之外的所有非终端结点至少有[m/2] 棵子树; ⑷所有的非终端结点中包含以下信息数据: (n,A0,K1,A1,K2,…,Kn,An) 其中:Ki(i=1,2,…,n)为关键码,且KiKi+1, Ai为指向子树根结点的指针(i=0,1,...
2014-6-6
7:11:00
42
从B树、B+树、B*树谈到R 树 - 结构之法 算法之道 - 博客频道 - CSDN.NET
3.3文件查找的具体过程(涉及磁盘IO操作) 为了简单,这里用少量数据构造一棵3叉树的形式,实际应用中的B树结点中关键字很多的。上面的图中比如根结点,其中17表示一个磁盘文件的文件名;小红方块表示这个17文件内容在硬盘中的存储位置;p1表示指向17左子树的指针。 其结构可以简单定义为: typedefstruct{ /*文件数*/ intfile_num; /*文件名(key)*/ char* file_name[max_file_num]; /*指向子节点的指针*/ BTNode * BTptr[...
2014-6-6
7:08:00
43
[慢查优化]建索引时注意字段选择性 & 范围查询注意组合索引的字段顺序 - 旁观者 - 博客园
写在前面的话: 之前曾说过“不要求每个人一定理解 联表查询(join/left join/inner join等)时的mysql运算过程”,但对于字段选择性差意味着什么,组合索引字段顺序意味着什么,要求每个人必须了解; 重复上一次的话:把mysql客户端(如SQLyog,如HeidiSQL)放在桌面上,时不时拿出来 explain 一把,这是一种美德! 确保亲手查过SQL的执行计划,一定要注意看执行计划里的 possible_keys、...
2014-5-27
17:28:00
44
ORACLE 索引失效_jzj5202003_新浪博客
以下情况会导致索引失效: 1) 直接导入: imp with SKIP_UNUSABLE_INDEXES=Y or sqlldr with SKIP_INDEX_MAINTENANCE 2) 在索引维护过程中出现ORA-1652/1653错误: sqlldr DIRECT=Y failes with ORA-1652 or 1653 3) 分区维护导致ROWID发生改变: ALTER TABLE MOVE PARTITION ALTER TABLE TRUNCATE PARTITION ALTER T...
2014-5-11
1:41:00
45
Oracle 数据库隔离级别,特性,问题和解决方法 - 1-2-3 - 博客园
Oracle的序列化(serializable)隔离级别 序列化,顾名思义,是让并发的事务感觉上是一个挨一个地串行执行的。之所以说是“感觉上”,是因为当2个事务并发时,Oracle并不会阻塞其中一个事务去等待另一个事务执行完毕再执行,而是仍然让2个事务同时并行,那么如何能“感觉”是串行的呢?请看下图的实验。 用户B的事务因为指定了serializable隔离级别,所以虽然在查询费用明细表之前,用户A提交了对费用明细表的更改,但是因为用户A提交的更改是在用...
2014-3-6
11:02:00
46
Linux上Oracle 11g安装步骤图解 - gaojun - 博客园
另,可参考: Redhat Linux安装Oracle 11g R2数据库 1、检查硬件 内存 # grep MemTotal /proc/meminfo 交换空间 # grep SwapTotal /proc/meminfo 磁盘空间 # df -ah 2、下载软件 Oracle Database 10g Release 2 (10.2.0.1) Software下载位置: http://otn.oracle.com/software/products/database/oracle10g/index...
2014-2-20
15:21:00
47
Silent Oracle 11g R2 install using only the command line | Beyond Oracle
1. Add Oracle public yum repository. [root@localhost ~]$ cd /etc/yum.repos.d [root@localhost ~]$ wget http://public-yum.oracle.com/public-yum-el5.repo # edit the file public-yum-el5.repoand enable both the [el5_u5_base] and the [ol5_u5_base] repositories ...
2014-2-19
21:26:00
48
SQL执行计划 Execution plan with Derby
CALL SYSCS_UTIL.SYSCS_SET_RUNTIMESTATISTICS(1); select * from EDW_BPM_OBJECT; call SYSCS_UTIL.SYSCS_SET_RUNTIMESTATISTICS(0); VALUES SYSCS_UTIL.SYSCS_GET_RUNTIMESTATISTICS();
2013-11-26
11:40:00
49
Oracle 高水位(HWM: High Water Mark) 说明 - David Dai -- Focus on Oracle - 博客频道 - CSDN.NET
Oracle表段中的高水位线HWM 在Oracle数据的存储中,可以把存储空间想象为一个水库,数据想象为水库中的水。水库中的水的位置有一条线叫做水位线,在Oracle中,这条线被称为高水位线(High-warter mark, HWM)。在数据库表刚建立的时候,由于没有任何数据,所以这个时候水位线是空的,也就是说HWM为最低值。当插入了数据以后,高水位线就会上涨,但是这里也有一个特性,就是如果你采用delete语句删除数据的话,数据虽然被删除了,但是高水位线却没有降低,还是你刚才删除数据以前那么高的水位。...
2013-10-31
10:58:00
50
学会定制MapReduce里的partition,sort和grouping,Secondary Sort Made Easy_HadoopChina_新浪博客
通过初期的几个开发员培训班,我发现有不少学员容易“偏爱”缺省的MapReduce行为,而忽略如何在代码里根据自己应用的需要来定制不同于系统缺省的行为。这篇文章结合Secondary Sort来介绍“Shuffle & Sort”里涉及到的三个重要操作。 缺省情况下,MapReduce Framework的Shuffle & Sort过程将所有和某一个键相关联的值“组合”(group)在一起,传送到一个唯一确定的Redu...
2013-6-21
16:17:00
51
MapReduce里面的二次排序、组排序和Partitioner - FacingTheSunCN的专栏 - 博客频道 - CSDN.NET
在MapReduce程序中,我们常常需要对属于同一个key的value进行排序,即“二次排序”,将key和value进行组合,合并成一个新的key,给map去排序。在Hadoop 1.0.4中,利用setSortComparatorClass()对二次排序进行设定,但是sort comparator需要自己实现一个comparator,下面是一个自己实现的comparator的例子。 [java]view plaincopy publicstaticclass...
2013-6-21
14:39:00
52
mapreduce编程(二)- 大象书中求每一年的最高温度 - - 博客频道 - CSDN.NET
1 通过设置了partitioner来进行分区。因为分区是按照年份来进行,所以同年的数据就可以分区到一个reducer中。 2 自定义key比较器,按照年份升序,温度值降序。这样map输出的所有kv对就是按照年份升序,温度值降序排列的。 3 自定义分组比较器,所有同一年的数据属于同一个组,那么在reduce输出的时候,只需要取第一个value就能达到输出一年最高气温的目的。
2013-6-21
11:45:00
53
Hadoop 中的两表join | Alex的个人Blog
Common Join 最为普通的join策略,不受数据量的大小影响,也可以叫做reduce side join ,最没效率的一种join 方式. 它由一个mapreduce job 完成. 首先将大表和小表分别进行map 操作, 在map shuffle 的阶段每一个map output key 变成了table_name_tag_prefix + join_column_value , 但是在进行partition 的时候它仍然只使用join_column_value 进行hash. 每一个reduc...
2013-6-21
10:54:00
54
HBase MapReduce实例分析 - 新城主力唱好 - 博客园
跟Hadoop的无缝集成使得使用MapReduce对HBase的数据进行分布式计算非常方便,本文将介绍HBase下 MapReduce开发要点。很好理解本文前提是你对Hadoop MapReduce有一定的了解,如果你是初次接触Hadoop MapReduce编程,可以参考"第一个MapReduce应用"这篇文章来建立基本概念。
2013-6-9
11:42:00
55
Ken Wu's Blog » HBase性能调优
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。 配置优化 zookeeper.session.timeout 默认值:3分钟(180000ms) 说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServer会被Zookeeper从RS集群清单中移除,HMaster收到移除通知后,会对这台server负责的regions重新...
2013-6-7
14:56:00
56
hbase ( key 设计 ) 条件查询排序分页
Paging is a very common use-case for web sites and many other applications. In relational databases, this is easily implemented with LIMIT and OFFSET, or by selecting the row number in the query and adding conditionals based on it’s value. HBase 0.1...
2013-6-7
11:58:00
57
Ken Wu's Blog » HBase二级索引与Join
1,按索引建表 每一个索引建立一个表,然后依靠表的row key来实现范围检索。row key在HBase中是以B+ tree结构化有序存储的,所以scan起来会比较效率。 单表以row key存储索引,column value存储id值或其他数据 ,这就是Hbase索引表的结构。 如何Join? 多索引(多表)的join场景中,主要有两种参考方案: 1,按索引的种类扫描各自独立的单索引表,最后将扫描结果merge。 这个方案的特点是简单,但是如果多个索引扫描结果数据量比较大的话,merge就会遇到瓶颈。 ...
2013-6-7
11:39:00
58
HBase存储时间相关多列数据的两种方案 - 大圆那些事 - 博客园
多行单列 表结构设计 Row Key:用户标识ID + (Long.MAX_VALUE - timestamp) Column Family:’cf’ Column Qualifier:’’ Value:宝贝、URL等 其中,使用(Long.MAX_VALUE – timestamp)作为Row Key的后半部分是为了便于获取最近插入的数据,一个用户标识ID下的数据存储在多个Row Key下,每个Row Key下仅有一个Column Qualif...
2013-6-7
9:47:00
59
如何理解Hadoop-Hbase原理与应用小结 - leonarding技术博客 - ITPUB个人空间 - powered by X-Space
1 我们常说HBase是“数据即日志”的数据库,它是怎样修改和删除数据的?和Oracle这类传统的RDBMS有什么区别? 答:首先Hbase中的一个“元素”是由行键、列族名、限定符、时间戳唯一标识的并且行键作为数据行在表里的唯一标识,我们只有通过行键来访问列族别无他法。 修改数据:我们先找到要修改的行键把新的数据记录追加到对应的列族中并打上一个新时间戳代表最新版本。 删除数据:插入带有删除标记的行进入,相当于把整个行键所在的行删了。 小结:hbas...
2013-6-7
8:51:00
60
Oracle快速插入500w条数据sql语句_一声叹息_新浪博客
declare count1 number(10):=1; begin loop insert into TASK_ITEMS values ( HIBERNATE_SEQUENCE.nextval, '470400205421112'||count1, '21-000000002222'); count1 := count1+1; exit when count11000000; end loop; end;
2012-12-26
8:14:19

<<上篇 1 2 3 4 5 6 下篇>>