Spark技术在京东智能供应链预测的应用

- - IT瘾-bigdata

前段时间京东公开了面向第二个十二年的战略规划，表示京东将全面走向技术化，大力发展人工智能和机器人自动化技术，将过去传统方式构筑的优势全面升级. 京东Y事业部顺势成立，该事业部将以服务泛零售为核心，着重智能供应能力的打造，核心使命是利用人工智能技术来驱动零售革新. 1.1 京东的供应链. 京东一直致力于通过互联网电商建立需求侧与供给侧的精准、高效匹配，供应链管理是零售联调中的核心能力，是零售平台能力的关键体现，也是供应商与京东紧密合作的纽带，更是未来京东智能化商业体布局中的核心环节.

我读《京东技术解密》 - Dimmacro

- - 博客园_首页

　　自从今年1月26号开博，打算今年好好整理一下自己这些年的技术积累，整理一些读书笔记. 不为别的，只为能回看过去，不忘初心. 从开博到现在也快一周了吧，说好的一周至少写两篇文章的规定呢. 　　京东技术解密这本书从2014年12月3号晚23点看到了2015年1月26号晚22点，小两月了. 记得这本书还在京东预售的时候，很期望能早点买到，因为个人一直对互联网行业高并发高性能的系统感兴趣，尽管自己在日常工作中用到的不多，也许是受了互联网同事们的蛊惑吧，觉得这才是技术的魅力所在.

Spark概览

- - 简单文本

Spark具有先进的DAG执行引擎，支持cyclic data flow和内存计算. 因此，它的运行速度，在内存中是Hadoop MapReduce的100倍，在磁盘中是10倍. 这样的性能指标，真的让人心动啊. Spark的API更为简单，提供了80个High Level的操作，可以很好地支持并行应用.

Spark与Mapreduce？

- - 崔永键的博客

我本人是类似Hive平台的系统工程师，我对MapReduce的熟悉程度是一般，它是我的底层框架. 我隔壁组在实验Spark，想将一部分计算迁移到Spark上. 年初的时候，看Spark的评价，几乎一致表示，Spark是小数据集上处理复杂迭代的交互系统，并不擅长大数据集，也没有稳定性. 但是最近的风评已经变化，尤其是14年10月他们完成了Peta sort的实验，这标志着Spark越来越接近替代Hadoop MapReduce了.

Spark迷思

- - ITeye博客

目前在媒体上有很大的关于Apache Spark框架的声音，渐渐的它成为了大数据领域的下一个大的东西. 证明这件事的最简单的方式就是看google的趋势图：. 上图展示的过去两年Hadoop和Spark的趋势. Spark在终端用户之间变得越来越受欢迎，而且这些用户经常在网上找Spark相关资料. 这给了Spark起了很大的宣传作用；同时围绕着它的也有误区和思维错误，而且很多人还把这些误区作为银弹，认为它可以解决他们的问题并提供比Hadoop好100倍的性能.

Spark 优化

- - CSDN博客推荐文章

提到Spark与Hadoop的区别，基本最常说的就是Spark采用基于内存的计算方式，尽管这种方式对数据处理的效率很高，但也会往往引发各种各样的问题，Spark中常见的OOM等等. 效率高的特点，注定了Spark对性能的严苛要求，那Spark不同程序的性能会碰到不同的资源瓶颈，比如：CPU，带宽、内存.

[技术讨论]京东产品业务逻辑错误分析

- - CSDN博客推荐文章

双十一，很多人都剁了手，而作为一个程序员，更多的是看到了业务逻辑层的问题，当然，有些问题是为了让用户愿意进入，而不一定是必须花钱，比如在第一次双十一的时候的红包叠加使用，就可以让我实际当时只花了几块钱买到了一张32g的闪迪的TF卡，嗯，双十一活动价格是160，转手120卖掉了. 而因为淘宝本身的物流问题和各种假货以及欺诈行为，我已经很少在淘宝上购买东西了，而更多的转向了京东，主要是因为京东的售后服务确实对于一二线城市的人来说比较便利，三线城市也覆盖了很多.

京东亿级商品搜索核心技术解密

- - 运维派

作者：王春明，现任京东搜索平台部负责人，2011年加入京东搜索团队，期间一直负责京东搜索引擎研发工作，主导了多次搜索架构升级工作保障其满足京东发展需求，擅长搜索引擎、高性能服务开发、分布式系统架构. 招聘：京东搜索平台部木有有高级/资深搜索引擎研发工程师（C/C++) 、高级/资深算法工程师（C/C++）、高级/资深数据系统工程师（java）等职位，期待您的加入，一起打造弹性搜索平台.

Spark&Spark性能调优实战

- - CSDN博客互联网推荐文章

Spark特别适用于多次操作特定的数据，分mem-only和mem & disk. 其中mem-only:效率高，但占用大量的内存，成本很高;mem & disk:内存用完后，会自动向磁盘迁移，解决了内存不足的问题，却带来了数据的置换的消费. Spark常见的调优工具有nman、Jmeter和Jprofile,以下是Spark调优的一个实例分析：.

Mesos上部署spark

- - 开源小站

还是回到之前一直持续的 Mesos话题. 在之前的环节里，我们已经尝试了Mesos的安装，Marathon守护服务以及相对比较主流的Mesos作为Hadoop的资源管理器的实际操作. 这次就说说同属于伯克利出品的Spark. 其实spark最初0.7以前的版本还没有自己的资源管理系统，资源的调度都是通过Mesos来执行的.

Spark技术在京东智能供应链预测的应用

1 背景

2 京东预测系统

3 预测系统核心介绍

4 结合图解Spark书进行应用与优化

5 小结

相关 [spark 技术京东] 推荐：