数据仓库中的SQL性能优化（Hive篇）

- - 奔跑的兔子

一个Hive查询生成多个map reduce job，一个map reduce job又有map，reduce，spill，shuffle，sort等多个阶段，所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化（其中又会有细分），针对MR全局的优化，和针对整个查询（多MR job）的优化，下文会分别阐述.

数据仓库中的SQL性能优化（MySQL篇）

- - 奔跑的兔子

做数据仓库的头两年，使用高配置单机 + MySQL的方式来实现所有的计算（包括数据的ETL，以及报表计算. 用过MySQL自带的MYISAM和列存储引擎Infobright. 这篇文章总结了自己和团队在那段时间碰到的一些常见性能问题和解决方案. P.S.如果没有特别指出，下面说的mysql都是指用MYISAM做存储引擎.

深入浅出数据仓库中SQL性能优化之Hive篇

- - 极客521 | 极客521

一个Hive查询生成多个Map Reduce Job，一个Map Reduce Job又有Map，Reduce，Spill，Shuffle，Sort等多个阶段，所以针对Hive查询的优化可以大致分为针对MR中单个步骤的优化（其中又会有细分），针对MR全局的优化，和针对整个查询（多MRJob）的优化，下文会分别阐述.

（1）选择最有效率的表名顺序(只在基于规则的优化器中有效)：. ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名，FROM子句中写在最后的表(基础表 driving table)将被最先处理，在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表. 如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

SQL之性能优化

- - CSDN博客数据库推荐文章

在实际应用中，数据库中的数据会有很多，若要从这些数据表中检索数据，就需要对系统进行优化，提高数据库系统的响应速度，下面就是日常一些查询优化的方法. 索引可以提高数据库查询的速度，提高数据库的访问性能，但同时也会影响数据更新操作（例如插入、修改、删除）的速度. 如果WHERE子句中经常用到的某一列或者某几列创建索引.

Sql性能优化梳理

- - IT瘾-geek

本文主要针对的是关系型数据数据库MySql. 键值类数据库可以参考最简大数据Redis. 先简单梳理下Mysql的基本概念，然后分创建时和查询时这两个阶段的优化展开. 第一层：客户端通过连接服务，将要执行的sql指令传输过来. 第二层：服务器解析并优化sql，生成最终的执行计划并执行. 第三层：存储引擎，负责数据的储存和提取.

SQL性能优化十条经验

- - CSDN博客推荐文章

尽量避免在一个复杂查询里面使用 LIKE '%parm1%'—— 红色标识位置的百分号会导致相关列的索引无法使用，最好不要用.. 其实只需要对该脚本略做改进，查询速度便会提高近百倍. a、修改前台程序——把查询条件的供应商名称一栏由原来的文本输入改为下拉列表，用户模糊输入供应商名称时，直接在前台就帮忙定位到具体的供应商，这样在调用后台程序时，这列就可以直接用等于来关联了.

基于 Flink SQL 构建实数据仓库：OPPO 数据中台之基石

- - IT瘾-dev

本文整理自 2019 年 4 月 13 日在深圳举行的 Flink Meetup 会议，分享嘉宾张俊，目前担任 OPPO 大数据平台研发负责人，也是 Apache Flink contributor. - OPPO 实时数仓的演进思路；. - 基于 Flink SQL 的扩展工作；. - 构建实时数仓的应用案例；.

记一次成功的sql注入入侵检测附带sql性能优化

- Bloger - 博客园-首页原创精华区

很多同学和园友都遇到过sql注入的，其中大部分都是代码的不严谨造成的，都是犯过很多错误才学会认真起来. 但是如果是让你接手一个二等残废的网站，并让你在上面改版，而且不能推翻式改版，只能逐步替换旧的程序，那么你会非常痛苦，例如我遇到的问题：. .

数据仓库中的SQL性能优化（Hive篇）

Map阶段的优化(map phase)

Reduce阶段的优化(reduce phase)

Map与Reduce之间的优化(spill, copy, sort phase)

Spill 与 Sort

Copy

文件格式的优化

Job整体优化

Job执行模式

JVM重用

索引

Join算法

数据倾斜

Top N问题

SQL整体优化

Job间并行

减少Job数

相关 [数据仓库 sql 性能优化] 推荐：