更新于:07-09 10:57

有关[学习]分类推荐

CTR 预估模型简介--非深度学习篇

于07-15 21:53 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中常用的一些模型,主要是非深度学习模型,包括 LR、GBDT+LR、FM/FFM、MLR. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. LR + 海量人工特征 是业界流传已久的做法,这个方法由于简单、可解释性强,因此在工业界得到广泛应用,但是这种做法依赖于特征工程的有效性,也就是需要对具体的业务场景有深刻的认识才能提取出好的特征.

CTR 预估模型简介--深度学习篇

于07-16 22:36 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中一些深度学习模型,包括 FNN、Wide&Deep、PNN、DIN、 Deep&Cross等. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. FNN 是伦敦大学于 2016 在一篇论文中发表的,模型的结构如下. FNN 假设输入数据的格式是离散的类别特征(表示为 one-hot 编码),且每个特征属于一个 field,通过 embedding 层将高纬稀疏特征映射成低维稠密特征后,再作为多层感知机(MLP)的输入.

[译] 如何选择正确的机器学习算法?

于07-02 00:00 - - dev
机器学习既是一门科学,也是一种艺术. 纵观各类机器学习算法,并没有一种普适的解决方案或方法. 事实上,有几个因素会影响你对机器学习算法的选择. 有些问题是非常特别的,需要用一种特定的解决方法. 例如,如果你对推荐系统有所了解,你会发现它是一类很常用的机器学习算法,用来解决一类非常特殊的问题. 而其它的一些问题则非常开放,可能需要一种试错方法(例如:强化学习).

Facebook 扩大内容核查范围,机器学习+全方位审核打击假新闻

于06-24 17:47 - -
6 月 22 日早晨,Facebook 宣布将扩大其内容核查范围,以打击社交网络上面的虚假新闻和恶作剧消息,并通过相应的打击措施和技术手段,尽量减少虚假新闻带来的恶劣影响. Facebook 在博文中透露,虚假新闻以及恶意篡改内容在一些国家已经成为常态,这使得读者难以判别信息的真假,甚至难以判别与新闻事件相关的图片或视频是否真实.

随机加权平均 -- 在深度学习中获得最优结果的新方法

于06-21 16:06 - - AI开发
本文为雷锋网字幕组编译的技术博客 A Simple Guide to the Versions of the Inception Network,原标题,作者为 Bharath Raj. 翻译 | 龙翔    整理 |  孔令双. 雷锋网 AI 研习社:在这篇文章中,我将讨论最近两篇有趣的论文. 它们提供了一种简单的方式,通过使用一种巧妙的集成方法提升神经网络的性能.

机器学习项目如何管理:看板

于06-13 04:53 - -
在前面的文章中我们看到,涉及机器学习、人工智能的项目,普遍地存在 项目管理的困难. 然后我介绍了针对这类项目 如何设置合理的期望,并且深入分析了 机器学习项目的工作内容. 既然已经知道如何设置客户的期望、又知道可以做哪些事来逼近这个期望,那么围绕期望和动作进行任务的拆解、管理和可视化应该是顺理成章的.

[原]快速学习COSMIC方法之十七:如何寻找更简单有效的规模度量方法?

于05-24 15:52 - dylanren -
  很多企业都在探索合理估算工作量的方法,而工作量的多少主要取决于软件规模的大小,因此在估算软件工作量之前需要先估算其规模. 传统的规模估算方法是进行代码行的估算,但是对于同一个需求,不同经验的人员去估算,结果差别很大,不同的实现语言,估算结果差别也很大,即使不同经验的人员针对同一种需求去实现,实际的代码行数也差别很大,并且实际情况中,往往一个需求可能需要多种语言结合才能实现.

Spark2.x学习笔记:11、RDD依赖关系与stage划分 - CSDN博客

于05-23 17:39 - -
11、 RDD依赖关系与stage划分. Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系. 针对不同的转换函数,RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency).

Google 发布关于机器学习工程的最佳实践

于05-21 10:43 - -
本文档旨在帮助已掌握机器学习基础知识的人员从 Google 机器学习的最佳实践中受益. 它介绍了一种机器学习样式,类似于 Google C++ 样式指南和其他常用的实用编程指南. 如果您学习过机器学习方面的课程,或者拥有机器学习模型的构建或开发经验,则具备阅读本文档所必需的背景知识. 在我们讨论有效的机器学习的过程中,会反复提到下列术语:.

深度学习三大框架对比

于05-18 13:21 - -
| 导语 Science is NOT a battle, it is a collaboration. 人工智能的浪潮正席卷全球,诸多词汇时刻萦绕在我们的耳边,如人工智能,机器学习,深度学习等. “人工智能”的概念早在1956年就被提出,顾名思义用计算机来构造复杂的,拥有与人类智慧同样本质特性的机器.

52个有用的机器学习和预测API(各个方向资源)

于05-14 00:00 - - geek
选自KDnuggets  机器之心编译 参与:吴攀. 人工智能正在成为新一代技术变革的基础技术,但从头开始为自己的应用和业务开发人工智能程序既成本高昂,且往往很难达到自己想要的性能表现,但好在我们有大量现成可用的 API 可以使用. 开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中.

当Google谈论机器学习时,它在谈论什么?

于05-12 19:05 - -
Google 一年一度的开发者大会 I/O 2018,本周在硅谷隆重上演. 这你已经知道了,关于大会报道,请移步 这里. 开幕前一天,Google 在总部举办了一堂名为“机器学习 101”的人工智能课,尝试用最接地气的方法介绍谷歌在机器学习方面正在做的事情. 这堂课的老师 克里斯汀·罗伯森 (Christine Robson) 是 Google AI(原 Google Research)研究员,主攻人机交互方向.

如何在小学阶段养成受益终生的学习习惯?

于05-10 22:50 - -
在阅读中学习科学家解决问题的思路和方法. 来源:小多童书(ID:xiaoduoui). 我是谢刚,感谢小多的邀请,很高兴在这里和大家相会. 我在美国加州从事学校心理学工作,主要负责教育心理的测评、诊断和咨询工作. 在工作 17年中的1000多案例里面,大于85%的都是由于各种不同的原因而造成的学习问题.

9 个超酷的深度学习案例

于05-10 08:02 - -
(点击上方公众号,可快速关注). 深度学习是机器学习中一种基于对数据进行表征学习的方法. 观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等. 而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别). 深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征.

[译] 巧妙使用机器学习的方法来检测 IoT 设备中的 DDoS 攻击

于05-06 00:00 - - dev
异常检测是识别数据中与预期行为有所不同的数据模式. 异常检测技术可以用来区别常用流量与异常攻击流量. 常用简单的基于门阀值的检测技术并不适用于IOT的攻击本质. 而使用机器学习算法的异常检测模型可以有效降低检测中的假阳性. 网络中间件的内存和处理能力有限,导致在异常检测方面在算法上有一定的限制. 智慧家庭网关路由器用的异常检测框架有以下的特征:.

机器学习中的目标函数、损失函数、代价函数有什么区别? - 知乎

于04-29 10:32 - -
@阿萨姆老师的建议,完善下答案:. 首先给出结论:损失函数和代价函数是同一个东西,目标函数是一个与他们相关但更广的概念,对于目标函数来说在有约束条件下的最小化就是损失函数(loss function). 举个例子解释一下:(图片来自Andrew Ng Machine Learning公开课视频). 我们是想用这三个函数分别来拟合Price,Price的真实值记为.

[原]Facebook如何运用机器学习进行亿级用户数据处理

于01-23 14:33 - qq_40027052 -
编译 | 刘畅、尚岩奇、林椿眄. 2017年末,Facebook应用机器学习组发布最新论文,对整个Facebook的机器学习软硬件架构进行了介绍. 纵览全文,我们也可以从中对Facebook各产品的机器学习策略一窥究竟. 论文中涉及到机器学习在全球规模(上亿级数据处理)上的全新挑战,并给出了Facebook的应对策略和解决思路,对相关行业和研究极其有意义.

如何从零到一地开始机器学习?

于04-18 14:16 - 张戎 -
文章首发于 “腾讯织云”:. 导语:作为一个数学系出身,半路出家开始搞机器学习的人,在学习机器学习的过程中自然踩了无数的坑,也走过很多本不该走的弯路. 于是很想总结一份如何入门机器学习的资料,也算是为后来人做一点点微小的贡献. 在 2016 年 3 月,随着 AlphaGo 打败了李世乭,人工智能开始大规模的进入人们的视野.

从先进走向普遍的广告和推荐系统方法之一: 在线学习 | AlgorithmDog

于04-15 18:27 - -
      广告和推荐系统作为机器学习领域的“摇钱树”,一直受到广泛的关注. 在这 5 年,或者说 10 年的维度上,广告和推荐系统发生了改头换面的变化. 传统的方法已经远去,一时先进的新兴的方法广泛走向千家万户. 今天介绍的在线学习,就已经从先进走向了千家万户.       广告和推荐系统的 CTR 预估模型有三种部署形态: 离线预测,在线预测和在线学习,其中在线学习是近几年迅速推广的架构.

阿里妈妈资深技术专家刘凯鹏解读基于深度学习的智能搜索营销

于04-10 14:43 - 机器之心 -
本文结合阿里电商业务场景的特点,介绍了阿里在匹配端和排序端的基于深度学习的一些工作. 搜索营销(sponsored search)是目前广告主在互联网上进行数字化营销的主要手段之一,也是机器学习技术在工业界最成功的应用场景之一. 在搜索营销的场景下,广告主可以通过出价的方式参与流量分配,平台的主要任务是优化流量分配和计价,实现效率的最大化和生态的健康发展.

GitHub 上最著名的20个 Python 机器学习项目,值得收藏!

于04-10 00:00 - - geek
源 | kdnuggets|小象. 开源是技术创新和快速发展的核心. 这篇文章向你展示Python机器学习开源项目以及在分析过程中发现的非常有趣的见解和趋势. 我们分析了GitHub上的前20名Python机器学习项目,发现scikit-Learn,PyLearn2和NuPic是贡献最积极的项目. 让我们一起在Github上探索这些流行的项目.

5-机器学习启蒙- 商品推荐系统1

于03-27 20:53 - shendao - 极客互联
有大量的商品和用户,想要推荐一部分商品给用户. 怎么通过机器学习结合你和别人的历史购物记录做出适合你的推荐. 亚马逊重点关注商品推荐,另一个推荐系统流行的例子是2006-2009. 年主办的比赛,100万美金奖励推荐电影系统. 我们在哪里能见到推荐系统. 来看一些推荐系统起到重要作用的领域. 个性化正在改变我们关于世界的经验.

算法在社区氛围的应用(三): 机器学习在答非所问识别上的运用

于03-27 21:16 - 知一声 -
现在,瓦力可直接识别并处理该题中的答非所问内容. 我们鼓励认真、专业的分享,期待每一次讨论都能碰撞出更多有价值的信息,并希望每一个用心的回答都能够得到好的展示,为他人带来更多帮助. 但是,我们也发现在社区中出现了答非所问类的内容,影响知友们获取有价值内容的效率. 为了更好地识别答非所问类内容,我们采用了多种模型,包括传统的机器学习模型和比较新的深度学习模型.

NLP︱高级词向量表达(二)——FastText(简述、学习笔记) - CSDN博客

于03-14 14:12 - -
FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,不过这个项目其实是有两部分组成的,一部分是这篇文章介绍的. fastText 文本分类(paper:. Classification(高效文本分类技巧)),. 另一部分是词嵌入学习(paper:. Information(使用子字信息丰富词汇向量)).

大规模机器学习框架的四重境界

于03-10 12:00 - - 机器学习 分布式 机器学习
文章为转载,原文链接见 这里,作者是 carbon zhang. 这篇文章主要介绍了分布式机器学习中的若干重点概念和经典论文,包括数据并行和模型并行、分布式框架的流派、参数服务器以及同步协议的演进等,非常值得一看. 自从google发表著名的 GFS、MapReduce、BigTable 三篇paper以后,互联网正式迎来了大数据时代.

如何用Python和机器学习训练中文文本情感分类模型?

于03-12 23:21 - shendao - 极客互联
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析. 其中还会介绍中文停用词的处理方法. 前些日子,我在微信后台收到了一则读者的留言. 我一下子有些懵——这怎么还带点播了呢. 但是旋即我醒悟过来,好像是我自己之前挖了个坑. 如何用Python从海量文本抽取主题.

前提条件和准备工作  |  机器学习速成课程  |  Google Developers

于03-01 21:11 - -
我对机器学习知之甚少或一无所知. 我们建议您按顺序学习所有资料. 我对机器学习有一些了解,但想了解更新、更全面的机器学习知识. 机器学习速成课程是很好的复习进修资料. 您可以按顺序学习所有单元,也可以只学习您感兴趣的单元. 我很了解机器学习,但对 TensorFlow 知之甚少或一无所知. 很多资料对您来说可能太初级了.

机器学习算法选用指南

于02-27 00:00 - - geek
在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题. 虽然有很多有关机器学习算法的文章详细介绍了相关的算法,但要做出最合适的选择依然非常困难. 在这篇文章中,我将对一些基本概念给出简要的介绍,对不同任务中使用不同类型的机器学习算法给出一点建议. 在文章的最后,我将对这些算法进行总结.

机器学习项目如何管理:工作内容

于02-23 13:01 - -
前一篇文章介绍了机器学习的基本过程,然后讨论了如何对机器学习项目设置期望的问题. 我们了解到,度量准确率的指标可以有多种,需要根据应用场景来选择. 一旦选好了度量指标,接下来就可以围绕这个指标来划分任务、监控进度、管理风险. 站在非常宏观的角度,机器学习系统工作的方式是:你有一个模型,你把一堆数据输入给它,然后你以某种方式使用它提供给你的输出.

AI工程师基础能力:机器学习

于02-11 00:00 - - tuicool
试试 下载InfoQ手机客户端,每天上下班路上听新闻,有趣还有料. 本文首发于洪亮劼在极客时间App上开始的独家专栏 《AI技术内参》,更多精彩文章,正在专栏更新. 点击 此处,或扫描下图二维码订阅,永久阅读专栏内所有内容. 想要成为合格的,或者更进一步成为优秀的人工智能工程师或数据科学家,机器学习的各种基础知识是必不可少的.