大数据分页方案

- - IT瘾-tuicool

软件开发中，常用要用到分页、计算总数，数据量超过千万、上亿的时候，往往 count的需要超过 1s 的执行时间，甚至 3-5s，对于一个追求性能的前沿团队来说，这个不能忍啊. mysql 会对所有符合的条件做一次扫描. 如果 a=%d 的数据有 1000W 条，那么数据库就会扫描一次 1000W 条数据库.

关于mysql大数据分页的一些方法。

- - CSDN博客编程语言推荐文章

select * from user limit 0,10; 这种最普通的方法在数据量不大的时候是没问题的. 当数据量大于100W的时候，就要 select * from user limit 1000000,10 ; 此时数据库. 要先扫过前面的100W条记录，再来取10条，所以当数据量越来越大的时候，速度也会越来越慢.

谈大数据(2)

- - 人月神话的BLOG

对于大数据，后面会作为一个系列来谈，大数据涉及的方面特别多，包括主数据，数据中心和ODS，SOA，云计算，业务BI等很多方面的内容. 前面看到一个提法，即大数据会让我们更加关注业务方面的内容，而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了，再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析

算起来，接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受，和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据，应该是近几年IT炒的最热的两个话题了. 在我看来，这两者之间的不同就是：云是做新的瓶，装旧的酒；大数据是找合适的瓶，酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析

这个时代，你在外面混，无论是技术还是产品还是运营还是商务，如果嘴里说不出“大数据”“云存储”“云计算”，真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实，大数据在我的眼里，不是一门技术，而是一种技能，从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时，正好一个妹子推门而入，听到这句话，微微一怔，低头坐下.

交通大数据

- - 人月神话的BLOG

本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景，传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到，对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据，包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技

原文： Fiorenttini 译者： julie20098. [非商业性转载必须注明译者julie20098和相关链接. ，否则视为侵权，追究转载责任. 世界气候数据中心：气候全球数据中心， 220TB 的网络数据， 6PB 的其它数据. 国家能源研究科学计算中心，有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG

对于数据分析层，我们可以看到，其核心重点是针对海量数据形成一个分布式可弹性伸缩的，高查询性能的，支持标准sql语法的一个ODS库. 我们看到对于Hive，impala，InfoBright更多的都是解决这个层面的问题，即解决数据采集问题，解决采集后数据行列混合存储和压缩的问题，然后形成一个支撑标准sql预防的数据分析库.

大数据的一致性

- - 阳振坤的博客

看到了一篇关于数据一致性的文章：下一代NoSQL：最终一致性的末日. ( http://www.csdn.net/article/2013-11-07/2817420 )，其中说到：相比关系型数据库，NoSQL解决方案提供了shared-nothing、容错和可扩展的分布式架构等特性，同时也放弃了关系型数据库的强数据一致性和隔离性，美其名曰：“最终一致性”.

大数据Lambda架构

- - CSDN博客云计算推荐文章

1 Lambda架构介绍. Lambda架构划分为三层，分别是批处理层，服务层，和加速层. 最终实现的效果，可以使用下面的表达式来说明. 1.1 批处理层(Batch Layer, Apache Hadoop). 批处理层主用由Hadoop来实现，负责数据的存储和产生任意的视图数据.

大数据分页方案

为什么会慢？

count(*) 和 count(1)、count(0)

Example 1:

Example 2:

怎么解决？

MyISAM DB

其他 DB 引擎

分页正反偏移

Example 3

游标：上一页的最大值或者最小值

缓存和不精准

其他大神的建议

相关 [大数据分页] 推荐：