mysql分区举例---HASH分区

标签： mysql 分区 hash | 发表时间：2012-10-03 20:20 | 作者：

出处：http://www.iteye.com

上接RANGE分区

HASH分区：

hash分区的目的是将数据均匀的分布到预先定义的各个分区中，保证各分区的数据数量大致一致。在RANGE和LIST分区中，必须明确指定一个给定的列值或列值集合应该保存在哪个分区中；而在HASH分区中，MYSQL自动完成这些工作，用户所要做的只是基于将要被散列的列值指定一个列值或者表达式，以及指定呗分区的表将要被分割成的分区数量。

要使用HAHS分区来分割一个表，要在CREATE TABLE语句上添加一个PARTITION BY HASH（expr）子句，其中“expr”是返回一个整数的表达式。expr可以仅仅是字段类型为整型的列名。此外，用户很可能需要在后面再添加一个PARTITITIONS num子句，其中num是YGI额非负的整数，它表示将要被分割成分区的数量。如果没有包含一个PARTITIONS子句，分区数量默认为1.

mysql> create table t_hash (

-> a int,

-> b datetime)

-> partition by hash (YEAR(b))

-> partitions 4;

Query OK, 0 rows affected (0.85 sec)

插入2010-04-01进入表t_hash,那么

MOD(YEAR('2010-04-01'),4)

=MOD(2010，4)

因此该记录会被放入分区p2中。

mysql> insert into t_hash select 1,'2010-01-01';

Query OK, 1 row affected (0.14 sec)

Records: 1 Duplicates: 0 Warnings: 0

mysql> select * from information_schema.partitions

-> where table_schema=database() and table_name='t_hash'\G;

*************************** 1. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: test

TABLE_NAME: t_hash

PARTITION_NAME: p0

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 1

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: HASH

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: YEAR(b)

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: NULL

TABLE_ROWS: 0

AVG_ROW_LENGTH: 0

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: NULL

UPDATE_TIME: NULL

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

*************************** 2. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: test

TABLE_NAME: t_hash

PARTITION_NAME: p1

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 2

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: HASH

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: YEAR(b)

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: NULL

TABLE_ROWS: 0

AVG_ROW_LENGTH: 0

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: NULL

UPDATE_TIME: NULL

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

*************************** 3. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: test

TABLE_NAME: t_hash

PARTITION_NAME: p2

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 3

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: HASH

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: YEAR(b)

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: NULL

TABLE_ROWS: 1

AVG_ROW_LENGTH: 16384

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: NULL

UPDATE_TIME: NULL

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

*************************** 4. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: test

TABLE_NAME: t_hash

PARTITION_NAME: p3

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 4

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: HASH

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: YEAR(b)

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: NULL

TABLE_ROWS: 0

AVG_ROW_LENGTH: 0

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: NULL

UPDATE_TIME: NULL

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

4 rows in set (0.04 sec)

可以看到P2分区有一条记录。当前这个例子并不能把数据均匀的分布到各个分区，因为按照YEAR函数进行的，该值本身是离散的。如果对连续的值进行HASH分区，如自增长的主键，则可以较好地将数据平均分布。

MYSQL还支持一种LINEAR HASH分区，分区算法不一样，算法如下：

mysql> create table t_hash (

-> a int,

-> b datetime)

-> partition by linear hash (YEAR(b))

-> partitions 4;

取大于分区数量4的下一个2的幂值V，V=POWER(2，CEILING(LOG(2，num)))=4

所在分区N=YEAR('2010-04-01')&(V-1)=2.

LINEAR HASH分区的优点在于增加、删除、合并和拆分分区将变得更加快捷，有利于处理含有

大量数据的表。缺点在于，与使用HASH分区得到的数据分布相比，各个分区间数据的分布可能不大均衡。

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

mysql分区举例---HASH分区

- - ITeye博客

hash分区的目的是将数据均匀的分布到预先定义的各个分区中，保证各分区的数据数量大致一致. 在RANGE和LIST分区中，必须明确指定一个给定的列值或列值集合应该保存在哪个分区中；而在HASH分区中，MYSQL自动完成这些工作，用户所要做的只是基于将要被散列的列值指定一个列值或者表达式，以及指定呗分区的表将要被分割成的分区数量.

mysql 索引优化 btree hash rtree

- - 数据库 - ITeye博客

mysql里目前只支持4种索引分别是:b-tree,full-text,hash以及r-tree索引. b-tree索引应该是mysql里最广泛的索引的了,除了archive,基本所有的存储引擎都支持它. 1.b-tree在myisam里的形式和innodb稍有不同. 在innodb里面有两种形态:其一是primary key形态其leafnode里存放的是数据.而且不仅存放了索引键的数据,还存放了其他字段的数据.其二是secondary index,其leafnode和普通的b-tree差不多,只是还存放了指向主键的信息.

MySQL分区技术

- - 数据库 - ITeye博客

mysql分区技术是mysql5.1以后出现的新技术，能替代分库分表技术，它的优势在于只在物理层面来降低数据库压力. 常用的MySQL分区类型：. 1.RANGE分区：基于属于一个给定的连续区间的列值，把多行分配给分区（基于列）. 2.LIST分区：类似于按RANGE分区，区别在于LIST分区是基于列值匹配一个离散值集合的某个值来进行选择（基于列值是固定值的）.

一致性hash

- - 互联网 - ITeye博客

一致性hash算法 - consistent hashing. 分类：算法艺术2010-02-02 09:19 69836人阅读评论(97) 收藏举报. 算法 cache object 服务器存储 c. 一致性 hash 算法（ consistent hashing ）.

mysql分区举例---子分区

- - ITeye博客

mysql允许RANGE和LIST分区上再进行HASH和KEY的子分区. 建立ts3表和ts2一模一样. 已有 0 人发表留言，猛击->> 这里<<-参与讨论. —软件人才免语言低担保赴美带薪读研.

Hash Collision DoS 问题

- mazhechao - 酷壳 - CoolShell.cn

最近，除了国内明文密码的安全事件，还有一个事是比较大的，那就是 Hash Collision DoS （Hash碰撞的拒绝式服务攻击），有恶意的人会通过这个安全弱点会让你的服务器运行巨慢无比. 这个安全弱点利用了各语言的Hash算法的“非随机性”可以制造出N多的value不一样，但是key一样数据，然后让你的Hash表成为一张单向链表，而导致你的整个网站或是程序的运行性能以级数下降（可以很轻松的让你的CPU升到100%）.

局部敏感Hash

- - xiaobaoqiu Blog

之前在项目中做数据聚合去重的逻辑的时候简单看过局部敏感Hash(Locality Sensitive Hashing,简称LSH)这个东东. LSH可以理解为一种衡量文本相似度的算法，特点是散列前的相似点经过哈希之后，也能够在一定程度上相似，并且具有一定的概率保证. 其有坚实的理论依据(98年左右理论就提出来了，99年有第一版实现)并且在高维数据空间中表现优异.

Hash算法的使用

- khsing - Glider's home

在对语料文本进行2，3元切分时，需要借助hash表来获得切分内容在内存中的位置，以便能够记录语料库中出现的次数. 以前知道有很多hash算法，但没认真研究过，今天才知道hash算法差距还是很明显的. 首先我选择的是暴雪在魔兽里的hash算法，这个算法很高级，是time33类型的一个变种（有关time33的介绍，可以参考：http://www.cnblogs.com/napoleon_liu/articles/1911571.html），而且很巧妙的借助3次hash避免字符串比较这种费时的操作，并且不用链表来存储冲突，3次hash冲突值能相等的可能行只有1/10的23次方，应该说不可能冲突了.

Min-Hash和推荐系统

- - xlvector - Recommender System

前几年看Google News Recommendation的那篇Paper，对里面提到的MinHash的算法基本没有注意，因为之前的习惯都是只注意论文的模型那块，至于怎么优化模型一般都只是扫一眼. 不过最近看了大量的Google Paper，发现Google在实现一个算法方面确实有很多独到之处. 其实，Min-Hash是LSH（Locality Sensitive Hash）的一种，我之前对LSH的了解仅仅限于知道它能把两个相似的东西Hash成两个汉明距离接近的2进制数.

一致性HASH算法

- - 企业架构 - ITeye博客

一致性 hash 算法（ consistent hashing ）. consistent hashing 算法早在 1997 年就在论文 . Consistent hashing and random trees 中被提出，目前在cache 系统中应用越来越广泛；. 比如你有 N 个 cache 服务器（后面简称 cache ），那么如何将一个对象 object 映射到 N 个 cache 上呢，你很可能会采用类似下面的通用方法计算 object 的 hash 值，然后均匀的映射到到 N 个 cache ；.

mysql分区举例---HASH分区

相关 [mysql 分区 hash] 推荐：

mysql分区举例---HASH分区

mysql 索引优化 btree hash rtree

MySQL分区技术

一致性hash

mysql分区举例---子分区

Hash Collision DoS 问题

局部敏感Hash

Hash算法的使用

Min-Hash和推荐系统

一致性HASH算法

相关文章

订阅