R 语言企业级数据挖掘应用

- - 刘思喆@贝吉塔行星

三月底参加了中国人民大学统计学院海峡两岸数据挖掘研讨会，和大家简单聊了聊R语言在京东商城的数据挖掘应用. 本来想接着写篇博文说明一下，一直也没腾出时间，今天补上. 在互联网企业，在分析端使用闭源的商用软件几乎是不可能的，原因很简单：成本太高，不管是使用，还是研发及维护. 但我个人觉得这可能还不是最主要的原因，对于互联网企业来说，数据虽然获取更容易，但环境更为复杂.

Python语言在企业级应用上的十大谬误

- - 极客范 - GeekFan.net

语言多元化是PayPal编程文化中一个重要的组成部分. 在C++和Java长期流行的同时，更多的团队选择了JvaScript和Scala. 同时， Braintree的收购也引入了一个久经世故的Ruby社区. Python作为一门特别的语言，在eBay和PayPal有很长的历史. eBay的开发者支持Python这个应用于基层领域多年的语言.

从MongoDB IPO谈谈企业级数据库市场

- - IT瘾-bigdata

作者：巨杉数据库联合创始人&CTO王涛. 10月20日，NoSQL数据库MongoDB在NASDAQ正式 IPO，当日收于 32.07 美元. 截至10月27日，MongoDB报收30.89美元，公司市值保持在15亿美元左右，可以说是分布式数据库的“第一股”. 作为同样数据库行业的一员，也是分布式数据库产品厂商，巨杉一直关注MongoDB的发展.

构建企业级数据仓库的五步法

- - 行业应用 - ITeye博客

即确定数据分析或前端展现的主题(例如:某年某月某地区的啤酒销售情况). 主题要体现出某一方面的各分析角度(维度)和统计数值型数据(量度)之间的关系, 确定主题时要综合考虑.. 确定主题后, 需要考虑分析的技术指标(例如: 年销售额等). 它们一般为数值型数据, 其中有些度量值不可以汇总; 有些可以汇总起来, 以便为分析者提供有用的信息.

0到1搭建企业级数据治理体系

- - IT瘾-dev

数据治理是企业数据建设必不可少的一个环节. 好的数据治理体系可以盘活整条数据链路，最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯. 企业数据治理过程需要注意哪些问题. 总体而言，不能一口一个胖子，路要一步一步地走. 下面我将结合企业级数据治理经验，详细介绍从0到1搭建数据治理体系全流程，帮你梳理数据治理的主要内容以及过程中会遇到的哪些坑.

MySQL企业级数据库灾备(备份)系统-DMB v2.1发布

- 彦强 - MySQL 实验室(BLOG) - MySQL性能、MySQL Cluster集群、MySQL HA高可用等研究 - MySQL实验室

为了这系统宅了很多个周末，又一个小长假过去了, DMB v2.1终于可以那得出手了，现在分享出来让朋友们使用，希望能得到更多更好的建议. DMB 对InnoDB存储引擎支持在线热备(ibbackup, xtrabackup等)，还可以根据用户需求选择备份模式，是否加锁获取Master信息等. “DMB数据库监控及灾备系统(监控、备份) for MySQL” 简单介绍见 http://www.mysqlab.net/tool/dmb/.

语言壁垒

- kylexlau - Chun Tian (binghe)

虽然经常更新微博，但确实又有些日子没写常规博客了. 10 月开始前有必要再写一篇，整理一下近期的各种思路，以良好的精神面貌迎接今年的最后一个季度. 首先发布一个已经不太新的消息：Practical Common Lisp 的中文版《实用 Common Lisp 编程》几经周折终于付印了，下月即可正式出版；读者们甚至已经可以在当当网上预订了.

Google开始面向企业提供大数据分析服务BigQuery，TB级数据十几秒便可返回结果

- - 36氪

Google已经开始销售在线数据分析服务，试图与市场上类似亚马逊网络服务（Amazon Web Services）这样的企业云计算服务竞争. 去年11月，Google曾让部分开发者访问其强大的数据分析软件 — BigQuery，它也是Google自己使用的互联网检索服务的一部分. 周二Google宣布开始销售这个软件，帮助企业用户在数秒内完成万亿字节的扫描.

Java 语言被很多人抱怨语法繁琐、开发效率低、体系繁杂而笨重，为什么还有这么强的生命力，尤其是在企业软件领域？

- - 知乎每日精选

赞同 @pansz 的答案，java生命力源自其独特的优点. 至今为止，java是大量实际得到应用的语言中，可读性最强，最利于阅读和理解，语法最严谨和规范的语言（当然，这也可以理解为语法繁琐的另一种表述）之一，在这一点上，只有已经基本退出历史舞台的pascal可与之相提并论. 而pascal并不是面对对象的，（面对对象的特点和优势我就不再赘述了，有兴趣可以查阅相关资料）.

UnQL：NoSQL查询语言

- 卡飞菲 - Solidot

CouchDB作者Damien Katz与SQLite作者Richard Hipp正在为NoSQL文档数据库开发一种高级查询语言UnQL（发音同Uncle，是UNstructured Query Language的缩写）. Katz表示，他们坚信为了推广NoSQL需要一种通用的查询语言，类似当年推广关系型数据库应运而生的SQL语言.

R 语言企业级数据挖掘应用

为什么要使用R语言

R能不能处理大数据

再看看大数据的流动

相关 [语言企业级数] 推荐：