Prestodb概述及性能测试

标签： prestodb 性能测试 | 发表时间：2014-02-14 22:28 | 作者：yugouai

出处：http://www.iteye.com

概述内容

（1）简介

（2）Hive and Prestodb, comparison of functionality

（3）Hive and Prestodb, comparison of performance

（1）简介

Presto是由facebook开发的一个分布式SQL查询引擎，它被设计为用来专门进行高速、实时的数据分析。它支持标准的ANSI SQL，包括复杂查询、聚合（aggregation）、连接（join）和窗口函数（window functions)。

Presto框架图如下：

下面的架构图中展现了简化的Presto系统架构。客户端（client）将SQL查询发送到Presto的协调员（coordinator）。协调员会进行语法检查、分析和规划查询计划。计划员（scheduler）将执行的管道组合在一起，将任务分配给那些里数据最近的节点，然后监控执行过程。客户端从输出段中将数据取出，这些数据是从更底层的处理段中依次取出的。

Presto的运行模型和Hive或MapReduce有着本质的区别。Hive将查询翻译成多阶段的MapReduce任务，一个接着一个地运行。每一个任务从磁盘上读取输入数据并且将中间结果输出到磁盘上。然而Presto引擎没有使用MapReduce。它使用了一个定制的查询和执行引擎和响应的操作符来支持SQL的语法。除了改进的调度算法之外，所有的数据处理都是在内存中进行的。不同的处理端通过网络组成处理的流水线。这样会避免不必要的磁盘读写和额外的延迟。这种流水线式的执行模型会在同一时间运行多个数据处理段，一旦数据可用的时候就会将数据从一个处理段传入到下一个处理段。这样的方式会大大的减少各种查询的端到端响应时间。

（2）Hive and Prestodb, comparison of functionality

√: Yes; ×: No; Blue: The main differences between hive and presto

	hive 0.11.0	presto 0.56
Implement	Java	Java
DataType
integer	√	√
string	√	√
floating point	√	√
boolean	√	√
map	√	√
list	√	√
struct	√	√
uniontype	√	×
timestamp	√	√
DDL(数据定义语言)
create/alter/drop table	√	×
create view	√	×
truncate table	√	×
desc	√	√
create index	√	×
DML(数据操作语言)
load data	√	×
insert	√	√
explain	√	√
tablesample(基于column做bucket)	√	√
group by	√	√
order by	√	√
having	√	√
limit	√	√
inner/left/right/full join	√	√
union	√	√
sub queries	√	√
Enhanced Aggregation, Cube, Grouping and Rollup	√	×
lateral view	√	×
Function
UDF	√	×
Mathematical Functions	√	√
String Functions	√	√
Date and Time Functions	√	√
Regex	√	√
Type Conversion Functions	√	×
Conditional Functions	√	√
Aggregate Functions	√	√
Windowing	√	√
Distinct	√	√
Url	√	√
Json	√	√

功能上，Presto与Hive有几个不同的地方，也可以说是Presto功能不完善，毕竟Presto推出时间不长，详见如下：

1. Presto完成没有数据写入功能，不能使用create语句建表（可通过CREATE TABLE tablename AS query），建立视图、导数据。

2. Presto不支持UDF（用户自定义函数）。

3. Presto支持窗口函数，但比Hive相对较少。

（3）Hive and Prestodb, comparison of performance

测试环境如下：

由于部分机器涉及应用，暂用4台机器作为prestodb的集群，prestodb所有运算都在内存，所以配置大内存有助于提高prestodb的运算速度（现配置4G）。

以下为具体的测试结果：

记录数：169984827
DML	Hive(s)	Prestodb(s)
limit	5.493	0.05
where	49.255	0.05
count(*)	184.974	86
group by	161.633	110
sub queries	105.686	0.09
join	657.006	177

注：prestodb查询时间只精确到秒，后带小数忽略

参考资料

Prestodb官网： http://prestodb.io/

ZOL频道： http://jishu.zol.com.cn/78874.html

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

Prestodb概述及性能测试

- - 开源软件 - ITeye博客

Presto是由facebook开发的一个分布式SQL查询引擎，它被设计为用来专门进行高速、实时的数据分析. 它支持标准的ANSI SQL，包括复杂查询、聚合（aggregation）、连接（join）和窗口函数（window functions). Presto框架图如下：. 下面的架构图中展现了简化的Presto系统架构.

mongodb性能测试

- - 数据库 - ITeye博客

1） Mongodb的非安全插入方式，在一开始插入性能是非常高的，但是在达到了两千万条数据之后性能骤减，这个时候恰巧是服务器24G内存基本占满的时候（随着测试的进行mongodb不断占据内存，一直到操作系统的内存全部占满），也就是说Mongodb的内存映射方式，使得数据全部在内存中的时候速度飞快，当部分数据需要换出到磁盘上之后，性能下降很厉害.

WebService性能测试

- - ImportNew

（本文也会在最下面通俗的介绍）. 这里给一个站内大哥的讲解： http://www.cnblogs.com/Leo_wl/archive/2010/05/20/1740205.html. 简单点就是测试WebService的一个工具. 官网地址： http://www.soapui.org/. ps：官网是英语的，如果你英语不好的话可以使用谷歌浏览器或360极速浏览器，它可以自动把英文转换成中文.

性能测试工具 CBenchmark

- lele - 开源中国社区最新软件

CBenchmark—-CharlesCui’s Benchmark 这是我实现的一款性能测试工具,之前在工作中常用LoadRunner之类的工具来完成性能测试,但受限于LR极其昂贵的Lisence以及难以定制的SDK,于是我用C/C++实现了这个工具,并借助Linux系统对线程和进程的良好调度,可以实现极高的并发压力.

浏览器性能测试

- - Taobao QA Team

浏览器作为一个浏览网页的平台，自身的性能直接影响网页的解析速度、渲染，而浏览器的性能一般又是由浏览器的内核来决定. 虽然浏览器的评测方法有很多，但是权威的浏览器性能测试方法主要有以下几种：. Acid3测试是检测浏览器与Web标准兼容性的主要方法，也是目前行业中最权威的测试. Acid3是由网页标准计划小组（Web Standards Project, WaSP）设计，测试焦点集中在ECMAScript、DOM Level 3、Media Queries和data: URL，浏览器开启 http://acid3.acidtests.org/测试页面后，页面会不断加载功能、直接给予分数.

Prestodb概述及性能测试

相关 [prestodb 性能测试] 推荐：

Prestodb概述及性能测试

mongodb性能测试

WebService性能测试

性能测试工具 CBenchmark

浏览器性能测试

【闲说】性能测试

Android应用性能测试

web性能测试指标

node.js调研与服务性能测试

HBase随机读写性能测试

相关文章

订阅

Prestodb概述及性能测试

相关 [prestodb 性能 测试] 推荐：

相关文章

订阅

相关 [prestodb 性能测试] 推荐：