CitusDB发布提高PostgreSQL数据库性能的开源工具

标签: Startups TC CitusDB PostgreSQL | 发表时间:2014-04-05 09:33 | 作者:Ron Miller
出处:http://techcrunch.cn
database plan

数据库分析初创公司CitusDB今天发布CSTORE,一款针对PostgreSQL的纵列储存插件,试图抢占甲骨文的奶酪。这款开源工具是该公司面向PostgreSQL的第一款工具,从今天开始就可以免费下载。

“在批量加载数据的分析工作中,使用纵列储存的优势非常明显,”CitusDB在其 官方博客中这么写道,暗示用户使用这款工具可以达到更好的数据库性能。具体有多少呢?CitusDB称使用CSTORE后,查询数据库的速率提高2倍,数据读取时间减少10倍。更重要的是,公司CEO乌穆尔·丘布克丘(Umur Cubukcu)在一封电子邮件中说,通过先进的优化和3倍压缩率提高的数据分析查询性能可以大大降低存储成本。

“在单节点(普通PostgreSQL用户)和PostgreSQL横向扩展(CitusDB)的PB级分析中,纵列储存都可以提供很大的性能提高,”丘布克丘解释道。其中CitusDB纵列储存是专门为CitusDB核心产品设计的,但其他用户可以下载体验。

丘布克丘说,这款工具总体上提供了几处优势。第一,用户可以同时在相同数据库内使用横表与纵表。第二,“我们试图结合PostgreSQL在企业级使用环境中的可靠性和Hadoop的可扩展性,为全球大数据分析客户提供一个简单强大的分析数据库”。

事实上,CitusDB在今年2月底就 发布了其核心产品的3.0版本

CitusDB公司在2011年从Y Combinator毕业, 次年6月发布核心产品的1.0版2013年2月公司又升级了其产品线,当时TC编辑亚历克斯·威廉姆斯如此写道:“CitusDB的核心基于 Google Dremel,Dremel是一款分析能力完全超越Hadoop的实时分析数据库。它的优势是并行计算能力和类似于SQL的功能,可以实时从数千台服务器中的PB级数据里完成查询。”

到目前为止,CitusDB已经从多方获得165万美元投资,投资方包括Data Collective、Bullpen Capital、SV Angel、Trinity Ventures和其他天使投资人。产品客户横跨广告技术、电子商务、零售、安全和移动分析。

从今天开始,新工具将可以在GitHub获得,公司都希望开发社区能贡献自己的力量,为这款工具继续添砖加瓦。(译:王博源)


相关 [citusdb postgresql 数据库] 推荐:

CitusDB发布提高PostgreSQL数据库性能的开源工具

- - TechCrunch 中国
数据库分析初创公司CitusDB今天发布CSTORE,一款针对PostgreSQL的纵列储存插件,试图抢占甲骨文的奶酪. 这款开源工具是该公司面向PostgreSQL的第一款工具,从今天开始就可以免费下载. “在批量加载数据的分析工作中,使用纵列储存的优势非常明显,”CitusDB在其 官方博客中这么写道,暗示用户使用这款工具可以达到更好的数据库性能.

PostgreSQL 数据库维护

- - BlogJava-qileilove
  在PostgreSQL中,使用delete和update语句删除或更新的数据行并没有被实际删除,而只是在旧版本数据行的物理地址上将该行的状态置为已删除或已过期. 因此当数据表中的数据变化极为频繁时,那么在一段时间之后该表所占用的空间将会变得很大,然而数据量却可能变化不大. 要解决该问题,需要定期对数据变化频繁的数据表执行VACUUM操作.

PostgreSQL学习手册(数据库管理)

- - 博客园_首页
    数据库可以被看成是SQL对象(数据库对象)的命名集合,通常而言,每个数据库对象(表、函数等)只属于一个数据库. 不过对于部分系统表而言,如pg_database,是属于整个集群的. 更准确地说,数据库是模式的集合,而模式包含表、函数等SQL对象. 因此完整的对象层次应该是这样的:服务器、数据库、模式、表或其他类型的对象.

PostgreSQL数据库完美备份恢复

- - Linux - 操作系统 - ITeye博客
PostgreSQL自带一个客户端pgAdmin,里面有个备份,恢复选项,也能对数据库进行备份 恢复(还原),但最近发现数据库慢慢庞大的时候,经常出错,备份的文件过程中出错的几率那是相当大,手动调节灰常有限. 所以一直寻找完美的备份恢复方案. 梦里寻他千百度,伊人却在灯火阑珊处...其实PostgreSQL内置不少的工具,寻找的备份恢复方案就在其中:pg_dump,psql.

PostgreSQL数据库、表空间、角色及用户

- - 数据库 - ITeye博客
转自:http://blog.chinaunix.net/uid-354915-id-3499975.html. 1、通过pgAdmin创建数据库TestDb1:. 打开数据库TestDb1看到建库脚本:. 在目录——PostgreSQL(pg_catalog)——数据表——pg_database中可以查看多了一个数据库TestDb1:.

Pivotal开源基于PostgreSQL的数据库Greenplum

- - 博客园_新闻
近日,Pivotal 宣布开源大规模并行处理(MPP)数据库 Greenplum,其架构是针对大型分析型数据仓库和商业智能工作负载专门设计的. 借助 MPP 这种高性能的系统架构,Greenplum 可以将 TB 级的数据仓库负载分解,并使用所有的系统资源并行处理单个查询. Greenplum 数据库基于 PostgreSQL 开源技术.

基于PostgreSQL的开源分布式数据库:Greenplum

- - 标点符
Pivotal宣布开源大规模并行处理(MPP)数据库Greenplum,其架构是针对大型分析型数据仓库和商业智能工作负载专门设计的. 借助MPP这种高性能的系统架构,Greenplum可以将TB级的数据仓库负载分解,并使用所有的系统资源并行处理单个查询. Greenplum数据库基于PostgreSQL开源技术.

PostgreSQL 时序数据库插件 timescaleDB 部署实践(含例子 纽约TAXI数据透视分析) - PostGIS + timescaleDB => PG时空数据库 - Digoal.Zhou’s Blog

- -
现实社会中,很多业务产生的数据具有时序数据属性(在时间维度上顺序写入,同时包括大量时间区间查询统计的需求). 例如业务的FEED数据,物联网产生的时序数据(如气象传感器、车辆轨迹、等),金融行业的实时数据等等. PostgreSQL的UDF和BRIN(块级索引)很适合时序数据的处理. 《PostgreSQL 按需切片的实现(TimescaleDB插件自动切片功能的plpgsql schemaless实现)》.

PostgreSQL 9.1发布

- Kai Chen - Solidot
开源数据库项目PostgreSQL发布了v9.1版. 新版本主要的特性包括:同步复制,序列化快照隔离,支持基于列的排序,近邻邻近索引,外来数据封装,支持SELinux许可控制,等等.

PostgreSQL 9.2发布

- - Solidot
时隔一年之后,开源数据库PostgreSQL发布了v9.2版. 主要新特性包括:原生JSON支持,覆盖索引(covering indexes),改进复制和性能等. PostgreSQL显著改善了可伸缩性:线性可扩展性支持最高64核,仅扫描索引,减少CPU消耗;改进垂直可伸缩性:有效利用大服务器硬件资源,锁管理,仅访问索引等底层操作允许数据库引擎处理更大的工作负荷——每秒最高35万只读查询,每秒写入1.4万条数据.