斗鱼大数据的玩法

- - IT瘾-bigdata

本文来源于斗鱼数据平台部吴瑞诚先生在光谷猫友会的分享. 我是吴瑞诚，现在负责斗鱼数据平台部，今天给大家分享一下斗鱼大数据这块的玩法. 我先做个自我介绍，我是11年初华科通信硕士毕业就进入淘宝，主要做HBase相关开发，后来回武汉后在1号店转向应用架构方向. 我是14年9月加入斗鱼，当时斗鱼研发是30人的规模，从0开始搭建斗鱼大数据平台，单枪匹马一个人，大概干了三个月，招不到大数据开发，哪怕只是基本了解Hadoop的都很招不到，干的很苦.

斗鱼风控算法体系建设

- -

分享嘉宾：龚灿斗鱼算法负责人. 出品平台：DataFunTalk. 导读：直播行业在业务上面临运营安全、活动安全、流量安全、账号安全、交易安全、内容安全等风险问题，智能风控在技术方面主要有高频对抗、场景繁多、解释性弱等挑战. 本文将分享斗鱼算法团队针对以上问题，如何构建风控算法体系，以及如何应对风控技术方面的挑战.

谈大数据(2)

- - 人月神话的BLOG

对于大数据，后面会作为一个系列来谈，大数据涉及的方面特别多，包括主数据，数据中心和ODS，SOA，云计算，业务BI等很多方面的内容. 前面看到一个提法，即大数据会让我们更加关注业务方面的内容，而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了，再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析

算起来，接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受，和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据，应该是近几年IT炒的最热的两个话题了. 在我看来，这两者之间的不同就是：云是做新的瓶，装旧的酒；大数据是找合适的瓶，酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析

这个时代，你在外面混，无论是技术还是产品还是运营还是商务，如果嘴里说不出“大数据”“云存储”“云计算”，真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实，大数据在我的眼里，不是一门技术，而是一种技能，从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时，正好一个妹子推门而入，听到这句话，微微一怔，低头坐下.

交通大数据

- - 人月神话的BLOG

本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景，传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到，对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据，包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技

原文： Fiorenttini 译者： julie20098. [非商业性转载必须注明译者julie20098和相关链接. ，否则视为侵权，追究转载责任. 世界气候数据中心：气候全球数据中心， 220TB 的网络数据， 6PB 的其它数据. 国家能源研究科学计算中心，有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG

对于数据分析层，我们可以看到，其核心重点是针对海量数据形成一个分布式可弹性伸缩的，高查询性能的，支持标准sql语法的一个ODS库. 我们看到对于Hive，impala，InfoBright更多的都是解决这个层面的问题，即解决数据采集问题，解决采集后数据行列混合存储和压缩的问题，然后形成一个支撑标准sql预防的数据分析库.

大数据的一致性

- - 阳振坤的博客

看到了一篇关于数据一致性的文章：下一代NoSQL：最终一致性的末日. ( http://www.csdn.net/article/2013-11-07/2817420 )，其中说到：相比关系型数据库，NoSQL解决方案提供了shared-nothing、容错和可扩展的分布式架构等特性，同时也放弃了关系型数据库的强数据一致性和隔离性，美其名曰：“最终一致性”.

大数据Lambda架构

- - CSDN博客云计算推荐文章

1 Lambda架构介绍. Lambda架构划分为三层，分别是批处理层，服务层，和加速层. 最终实现的效果，可以使用下面的表达式来说明. 1.1 批处理层(Batch Layer, Apache Hadoop). 批处理层主用由Hadoop来实现，负责数据的存储和产生任意的视图数据.

斗鱼大数据的玩法

1、斗鱼大数据平台整体架构

2、基于ELK的统一日志监控系统

2、斗鱼数据仓库

3、斗鱼个性推荐系统

4.斗鱼风控系统

总结：

Q&A ：

相关 [斗鱼大数据] 推荐：