美团深度学习系统的工程实践

Model	Input Size	Param Size	Flops
AlexNet	227 x 227	233 MB	727 MFLOPs
CaffeNet	224 x 224	233 MB	724 MFLOPs
VGG-VD-16	224 x 224	528 MB	16 GFLOPs
VGG-VD-19	224 x 224	548 MB	20 GFLOPs
GoogleNet	224 x 224	51 MB	2 GFLOPs
ResNet-34	224 x 224	83 MB	4 GFLOPs
ResNet-152	224 x 224	230 MB	11 GFLOPs
SENet	224 x 224	440 MB	21 GFLOPs

- - 美团点评技术团队

深度学习作为AI时代的核心技术，已经被应用于多个场景. 在系统设计层面，由于其具有计算密集型的特性，所以与传统的机器学习算法在工程实践过程中存在诸多的不同. 本文将介绍美团平台在应用深度学习技术的过程中，相关系统设计的一些经验. 本文将首先列举部分深度学习算法所需的计算量，然后再介绍为满足这些计算量，目前业界比较常见的一些解决方案.

深度学习在美团点评的应用

- - 美团点评技术团队

近年来，深度学习在语音、图像、自然语言处理等领域取得非常突出的成果，成了最引人注目的技术热点之一. 美团点评这两年在深度学习方面也进行了一些探索，其中在自然语言处理领域，我们将深度学习技术应用于文本分析、语义匹配、搜索引擎的排序模型等；在计算机视觉领域，我们将其应用于文字识别、目标检测、图像分类、图像质量排序等.

深度学习在推荐系统中的应用

- -

2016年DeepMind开发的AlphaGo在围棋对决中战胜了韩国九段选手李世石，一时成为轰动全球的重大新闻，被全球多家媒体大肆报道. AlphaGo之所以取得这么大的成功，这其中最重要的技术之一是深度学习技术. 经过这几年的发展，深度学习技术已经在图像分类、语音识别、自然语言处理等领域取得突破性进展，甚至在某些方面(如图像分类等)超越了人类专家的水平.

美团点评作为国内最大的生活服务平台，业务种类涉及食、住、行、玩、乐等领域，致力于让大家吃得更好，活得更好，有数亿用户以及丰富的用户行为. 随着业务的飞速发展，美团点评的用户和商户数在快速增长. 在这样的背景下，通过对推荐算法的优化，可以更好的给用户提供感兴趣的内容，帮用户更快速方便的找到所求. 我们目标是根据用户的兴趣及行为，向用户推荐感兴趣的内容，打造一个高精准性、高丰富度且让用户感到欣喜的推荐系统.

为了解决弹幕喷子，直播平台Twitch研发了一个深度学习系统

- - TECH2IPO/创见

从电子邮件到论坛，从论坛到微博，再从微博到现在的视频直播. 当人们在网上发言的速度越来越接近口语的时候，也就给网络喷子带来了越来越多的便利. 虽然从人类学会说到现在，还没有什么办法能阻止人类之间互相对骂. 但网络空间不比线下，一个人用嘴骂人只能被少数人听到，而在网上却可能影响几千人几万人. 在最新一季的南方公园中，甚至认为网络喷子是川普当选和第三次世界大战以及人类登上火星的主要原因.

重读Youtube深度学习推荐系统论文，字字珠玑，惊为神文

- - IT瘾-tuicool

这里是王喆的机器学习笔记，每隔一到两周我会站在算法工程师的角度讲解一些计算广告、推荐系统相关的文章. 二是阿里、facebook、google等一线互联网公司出品的；. 这周我们一起讨论一下Youtube的深度推荐系统论文《Deep Neural Networks for YouTube Recommendations》，这是2016年的论文，按照今天的标准来看，已经没有什幺新颖的地方，我也是两年前读过这篇文章之后就放下了，但前几天重读这篇文章，竟让发现了诸多亮点，几乎处处是套路，处处是经验，不由惊为神文.

美团深度学习系统的工程实践

背景

深度学习的计算量

物理计算性能

业界的解决方案

异构计算的并行方案

数据并行（Data Parallelism）

模型并行（Model Parallelism）

流式并行（Stream Parallelism）

混合并行（Hybrid Parallelism）

异构计算的硬件解决方案

异构计算的通信解决方案

美团的定制化深度学习系统

NLU线上系统

线上系统的业务特点

业务多变

热更新

数据驱动的自动迭代闭环

NLU线上系统的核心设计

算法流程的抽象

热更新流程的设计

声学模型训练系统

参考资料

作者简介

相关 [美团深度学习系统] 推荐：