SQL常见的可优化点

标签: MySQL优化设计 join primary key 分页 索引 | 发表时间:2014-06-10 20:43 | 作者:OurMySQL
出处:http://ourmysql.com

   # ###################################################

   # 索引相关

   # ###################################################

    1. 查询(或更新,删除,可以转换为查询)没有用到索引

   这是最基础的步骤,需要对sql执行explain查看执行计划中是否用到了索引,需要重点关注type=ALL, key=NULL的字段。

    2.  在索引字段上施加函数

   to_char(gmt_created, ‘mmdd’) = ’0101′

   正确的写法

   gmt_created between to_date(“20090101″, “yyyymmdd”) and to_date(“20090102″, “yyyymmdd”)

   

    3. 在索引字段上使用全模糊

   member_id like ‘%alibab%’

   B树无法解决此类问题,可以考虑搜索引擎。

   但是member_id like ‘alibab%’可以用到索引。

   其实,对任何一个字段使用 like ‘%xxxx%’都是一种不规范的做法,需要能检查到这种错误用法。

   

    4.  多列字段的索引,没有用到前导索引

   索引:(memeber_id, group_id)

   where group_id=9234,实际上,这个条件是没有办法用到上面的索引的。这是一个很常见的误用。要理解为什么不能用到这个索引,需要理解mysql如何构造多列索引的。

   索引是一棵B树,问题是,对于多列索引,mysql将索引字段按照索引建立的顺序进行拼装,组成一个新的字符串,这个字符串被用来做为构建B树的键。所以,在查询条件里,如果没有用到前导列,就没办法访问多列索引的B树。

   应该建立索引:(group_id, member_id)

   

    5. 访问到了索引之外的字段

   索引(member_id, subject)

   select subject from offer where member_id=234

   在member_id=234记录数很多的情况下,会优于

   select subject, gmt_created from offer where member_id=234

   原因是第二条sql会根据索引查找到的rowid访问表里的记录。第一条sql使用索引范围扫描就可以得到结果。

   如果某个sql执行次数很多,但是读取的字段没有被索引覆盖,那么,可能需要建立覆盖性索引。

   

    6.  计数count(id)有时比count(*)慢

   count(id) === count(1) where id is not null

   如果没有(id)索引,那么会用全表扫描,而count(*)会使用最优的索引进行用索引快速全扫描

   计数统一使用count(*)

   

    7.  正确使用stop机制

   判断member_id在offer表中是否存在记录:

   select count(*) from offer where member_id=234 limit 1

   优于

   select count(*) from offer where member_id=234

   原因是第一条sql会在得到第一条符合条件的记录后停止。

   # ###################################################

   # 高效分页

   # ###################################################

    1.  高效的分页

   使用join技术,利用索引查找到符合条件的id,构造成临时表,用这个小的临时表与原表做join

   select *

   from

   (

   select t.*, rownum AS rn

   from

   (select * from blog.blog_article

   where domain_id=1

   and draft=0

   order by domain_id, draft, gmt_created desc) t

   where rownum >= 2

   ) a

   where a.rn <= 3

   应该改写成

   select blog_article.*

   from

   (

   select rid, rownum as rn

   from

   (

   select rowid as id from blog.blog_article

   where domain_id=1

   and draft=0

   order by domain_id, draft, gmt_created desc

   ) t

   where rownum >= 2

   ) a, blog_article

   where a.rn >= 3

   and a.rid = blog_article.rowid

    2. order by没有用到索引

   有索引(a, b,c )

   混合排序规则

   ORDER BY a ASC, b DESC, c DESC /* mixed sort direction */

   缺失了前导列

   WHERE g = const ORDER BY b, c /* a prefix is missing */

   缺失了中间列

   WHERE a = const ORDER BY c /* b is missing */

   使用了不在索引中的列进行排序

   WHERE a = const ORDER BY a, d /* d is not part of index */

   # ###################################################

   # 高效地利用primary key

   # ###################################################

    随机查询

   一个错误的做法:

   select * from title where kind_id=1 order by rand() limit 1;

   create index k on title(kind_id);

   这个sql执行过程中需要全表扫描,并且将数据保存到临时表,这是一个非常耗时的操作。

   改进的做法,利用偏移量。

   select round(rand() * count(*)) from title where kind_id=1;

   select * from title where kind_id=1 limit 1 offset $random;

   create index k on title(kind_id);

   相比上面的做法,这种写法能够利用到kind_id上的索引,减少了需要扫描的数据块。但是,如果offset非常大,那么需要扫描的数据块也非常大,极端情况是扫描索引k的所有数据块。

   最优的做法,利用主键进行范围查找

   select round(rand() * count(*)) from title where kind_id=1;

   select * from title where kind_id = and id > $random limit 1;

   这个sql利用primary key进行范围查询,完全走索引,并且只读取一条记录,速度非常快。但是,这种用法的限制是primary key必须是int型,并且是连续自增长的。

   # ###################################################

   # 高效join

   # ###################################################

1. 小表驱动大表进行join
2. 避免子查询

   子查询是一个影响性能的隐患。应该使用join改写sql。

   # ###################################################

   # 数据类型

   # ###################################################

    1.  避免隐式转换

   CREATE TABLE `user` (

   `id` smallint(5) unsigned NOT NULL AUTO_INCREMENT,

   `account` char(11) NOT NULL COMMENT ”,

   `email` varchar(128),

   PRIMARY KEY (`id`),

   UNIQUE KEY `username` (`account`)

   ) ENGINE=InnoDB CHARSET=utf8;

   mysql> explain select * from user where account=123 \G

   *************************** 1. row ***************************

   id: 1

   select_type: SIMPLE

   table: user

   type: ALL

   possible_keys: username

   key: NULL

   key_len: NULL

   ref: NULL

   rows: 2

   Extra: Using where

   1 row in set (0.00 sec)

   可以看到,account=123的条件并没有用到唯一索引`username`。mysql的server从storage engine中读取所有的记录,使用to_number()函数,将记录中的account转换成数字,被转换后的数字用来和参数比较。我们的测试表里有2条记录,而执行计划中rows的值也是2,并且type的值为ALL,这也说明索引`username`并没有被用到。

   mysql> explain select * from user where account=’123′ \G

   *************************** 1. row ***************************

   id: 1

   select_type: SIMPLE

   table: user

   type: const

   possible_keys: username

   key: username

   key_len: 33

   ref: const

   rows: 1

   Extra:

   1 row in set (0.00 sec)

   参数为字符串类型,我们可以看到索引`username`,被使用到了。

   这是一个经常被误用的做法。

   

    2. 主键不是自增列

   自增列的主键有多个好处:

   插入性能高。

   减小page的碎片。

   提供二级索引的性能,降低二级索引的空间,因为二级索引存储的是主键的值,并不是page中的行id。

猜您喜欢

相关 [sql 常见 优化] 推荐:

SQL常见的可优化点

- - OurMySQL
查询(或更新,删除,可以转换为查询)没有用到索引.    这是最基础的步骤,需要对sql执行explain查看执行计划中是否用到了索引,需要重点关注type=ALL, key=NULL的字段.    B树无法解决此类问题,可以考虑搜索引擎.    但是member_id like ‘alibab%’可以用到索引.

sql优化

- - 数据库 - ITeye博客
是对数据库(数据)进行操作的惟一途径;. 消耗了70%~90%的数据库资源;独立于程序设计逻辑,相对于对程序源代码的优化,对SQL语句的优化在时间成本和风险上的代价都很低;. 可以有不同的写法;易学,难精通. 固定的SQL书写习惯,相同的查询尽量保持相同,存储过程的效率较高. 应该编写与其格式一致的语句,包括字母的大小写、标点符号、换行的位置等都要一致.

sql 优化

- - SQL - 编程语言 - ITeye博客
转:数据库SQL优化大总结之 百万级数据库优化方案. 2014-07-18 09:33 雲霏霏 雲霏霏的博客 字号:. 网上关于SQL优化的教程很多,但是比较杂乱. 近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充. 网上关于SQL优化的教程很多,但是比较杂乱. 近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充.

索引SQL优化

- - SQL - 编程语言 - ITeye博客
(一)深入浅出理解索引SQL优化 (转).         实际上,您可以把索引理解为一种特殊的目录. 微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引). 下面,我们举例来说明一下聚集索引和非聚集索引的区别:  .

优化sql查询

- - 数据库 - ITeye博客
1、 首先要搞明白什么叫执行计划. 执行计划是数据库根据SQL语句和相关表的统计信息作出的一个查询方案,这个方案是由查询优化器自动分析产生的,比如一条SQL语句如果用来从一个 10万条记录的表中查1条记录,那查询优化器会选择“索引查找”方式,如果该表进行了归档,当前只剩下5000条记录了,那查询优化器就会改变方案,采用 “全表扫描”方式.

sql语句优化

- - 数据库 - ITeye博客
性能不理想的系统中除了一部分是因为应用程序的负载确实超过了服务器的实际处理能力外,更多的是因为系统存在大量的SQL语句需要优化. 为了获得稳定的执行性能,SQL语句越简单越好. 对复杂的SQL语句,要设法对之进行简化. 1)不要有超过5个以上的表连接(JOIN). 2)考虑使用临时表或表变量存放中间结果.

SQL Server优化50法

- - CSDN博客推荐文章
虽然查询速度慢的原因很多,但是如果通过一定的优化,也可以使查询问题得到一定程度的解决.   查询速度慢的原因很多,常见如下几种:没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷).   I/O吞吐量小,形成了瓶颈效应.   没有创建计算列导致查询不优化.   内存不足网络速度慢查询出的数据量过大(可以采用多次查询,其他的方法降低数据量).

oracle sql 优化大全

- - Oracle - 数据库 - ITeye博客
最近遇到了oracle sql优化的问题,找了一下,发现这文章实在不错,跟大家分享一下,如果以后有什么新的改进也会继续补充的. 1     前言… 2 . 2     总纲… 2 . 3     降龙十八掌… 3 . 第一掌 避免对列的操作… 3 . 第二掌 避免不必要的类型转换… 4 . 第三掌 增加查询的范围限制… 4 .

Oracle SQL性能优化

- - 数据库 - ITeye博客
(1)      选择最有效率的表名顺序(只在基于规则的优化器中有效):. ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表. 如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

SQL Server优化50法

- - CSDN博客数据库推荐文章
  虽然查询速度慢的原因很多,但是如果通过一定的优化,也可以使查询问题得到一定程度的解决.   查询速度慢的原因很多,常见如下几种:. 没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷). I/O吞吐量小,形成了瓶颈效应. 查询出的数据量过大(可以采用多次查询,其他的方法降低数据量).