更新于:03-04 13:15

有关[学习]分类推荐

[原]快速学习COSMIC方法之十七:如何寻找更简单有效的规模度量方法?

于05-24 15:52 - dylanren -
  很多企业都在探索合理估算工作量的方法,而工作量的多少主要取决于软件规模的大小,因此在估算软件工作量之前需要先估算其规模. 传统的规模估算方法是进行代码行的估算,但是对于同一个需求,不同经验的人员去估算,结果差别很大,不同的实现语言,估算结果差别也很大,即使不同经验的人员针对同一种需求去实现,实际的代码行数也差别很大,并且实际情况中,往往一个需求可能需要多种语言结合才能实现.

Spark2.x学习笔记:11、RDD依赖关系与stage划分 - CSDN博客

于05-23 17:39 - -
11、 RDD依赖关系与stage划分. Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系. 针对不同的转换函数,RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency).

Google 发布关于机器学习工程的最佳实践

于05-21 10:43 - -
本文档旨在帮助已掌握机器学习基础知识的人员从 Google 机器学习的最佳实践中受益. 它介绍了一种机器学习样式,类似于 Google C++ 样式指南和其他常用的实用编程指南. 如果您学习过机器学习方面的课程,或者拥有机器学习模型的构建或开发经验,则具备阅读本文档所必需的背景知识. 在我们讨论有效的机器学习的过程中,会反复提到下列术语:.

深度学习三大框架对比

于05-18 13:21 - -
| 导语 Science is NOT a battle, it is a collaboration. 人工智能的浪潮正席卷全球,诸多词汇时刻萦绕在我们的耳边,如人工智能,机器学习,深度学习等. “人工智能”的概念早在1956年就被提出,顾名思义用计算机来构造复杂的,拥有与人类智慧同样本质特性的机器.

52个有用的机器学习和预测API(各个方向资源)

于05-14 00:00 - - geek
选自KDnuggets  机器之心编译 参与:吴攀. 人工智能正在成为新一代技术变革的基础技术,但从头开始为自己的应用和业务开发人工智能程序既成本高昂,且往往很难达到自己想要的性能表现,但好在我们有大量现成可用的 API 可以使用. 开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中.

当Google谈论机器学习时,它在谈论什么?

于05-12 19:05 - -
Google 一年一度的开发者大会 I/O 2018,本周在硅谷隆重上演. 这你已经知道了,关于大会报道,请移步 这里. 开幕前一天,Google 在总部举办了一堂名为“机器学习 101”的人工智能课,尝试用最接地气的方法介绍谷歌在机器学习方面正在做的事情. 这堂课的老师 克里斯汀·罗伯森 (Christine Robson) 是 Google AI(原 Google Research)研究员,主攻人机交互方向.

如何在小学阶段养成受益终生的学习习惯?

于05-10 22:50 - -
在阅读中学习科学家解决问题的思路和方法. 来源:小多童书(ID:xiaoduoui). 我是谢刚,感谢小多的邀请,很高兴在这里和大家相会. 我在美国加州从事学校心理学工作,主要负责教育心理的测评、诊断和咨询工作. 在工作 17年中的1000多案例里面,大于85%的都是由于各种不同的原因而造成的学习问题.

9 个超酷的深度学习案例

于05-10 08:02 - -
(点击上方公众号,可快速关注). 深度学习是机器学习中一种基于对数据进行表征学习的方法. 观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等. 而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别). 深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征.

[译] 巧妙使用机器学习的方法来检测 IoT 设备中的 DDoS 攻击

于05-06 00:00 - - dev
异常检测是识别数据中与预期行为有所不同的数据模式. 异常检测技术可以用来区别常用流量与异常攻击流量. 常用简单的基于门阀值的检测技术并不适用于IOT的攻击本质. 而使用机器学习算法的异常检测模型可以有效降低检测中的假阳性. 网络中间件的内存和处理能力有限,导致在异常检测方面在算法上有一定的限制. 智慧家庭网关路由器用的异常检测框架有以下的特征:.

机器学习中的目标函数、损失函数、代价函数有什么区别? - 知乎

于04-29 10:32 - -
@阿萨姆老师的建议,完善下答案:. 首先给出结论:损失函数和代价函数是同一个东西,目标函数是一个与他们相关但更广的概念,对于目标函数来说在有约束条件下的最小化就是损失函数(loss function). 举个例子解释一下:(图片来自Andrew Ng Machine Learning公开课视频). 我们是想用这三个函数分别来拟合Price,Price的真实值记为.

[原]Facebook如何运用机器学习进行亿级用户数据处理

于01-23 14:33 - qq_40027052 -
编译 | 刘畅、尚岩奇、林椿眄. 2017年末,Facebook应用机器学习组发布最新论文,对整个Facebook的机器学习软硬件架构进行了介绍. 纵览全文,我们也可以从中对Facebook各产品的机器学习策略一窥究竟. 论文中涉及到机器学习在全球规模(上亿级数据处理)上的全新挑战,并给出了Facebook的应对策略和解决思路,对相关行业和研究极其有意义.

如何从零到一地开始机器学习?

于04-18 14:16 - 张戎 -
文章首发于 “腾讯织云”:. 导语:作为一个数学系出身,半路出家开始搞机器学习的人,在学习机器学习的过程中自然踩了无数的坑,也走过很多本不该走的弯路. 于是很想总结一份如何入门机器学习的资料,也算是为后来人做一点点微小的贡献. 在 2016 年 3 月,随着 AlphaGo 打败了李世乭,人工智能开始大规模的进入人们的视野.

从先进走向普遍的广告和推荐系统方法之一: 在线学习 | AlgorithmDog

于04-15 18:27 - -
      广告和推荐系统作为机器学习领域的“摇钱树”,一直受到广泛的关注. 在这 5 年,或者说 10 年的维度上,广告和推荐系统发生了改头换面的变化. 传统的方法已经远去,一时先进的新兴的方法广泛走向千家万户. 今天介绍的在线学习,就已经从先进走向了千家万户.       广告和推荐系统的 CTR 预估模型有三种部署形态: 离线预测,在线预测和在线学习,其中在线学习是近几年迅速推广的架构.

阿里妈妈资深技术专家刘凯鹏解读基于深度学习的智能搜索营销

于04-10 14:43 - 机器之心 -
本文结合阿里电商业务场景的特点,介绍了阿里在匹配端和排序端的基于深度学习的一些工作. 搜索营销(sponsored search)是目前广告主在互联网上进行数字化营销的主要手段之一,也是机器学习技术在工业界最成功的应用场景之一. 在搜索营销的场景下,广告主可以通过出价的方式参与流量分配,平台的主要任务是优化流量分配和计价,实现效率的最大化和生态的健康发展.

GitHub 上最著名的20个 Python 机器学习项目,值得收藏!

于04-10 00:00 - - geek
源 | kdnuggets|小象. 开源是技术创新和快速发展的核心. 这篇文章向你展示Python机器学习开源项目以及在分析过程中发现的非常有趣的见解和趋势. 我们分析了GitHub上的前20名Python机器学习项目,发现scikit-Learn,PyLearn2和NuPic是贡献最积极的项目. 让我们一起在Github上探索这些流行的项目.

5-机器学习启蒙- 商品推荐系统1

于03-27 20:53 - shendao - 极客互联
有大量的商品和用户,想要推荐一部分商品给用户. 怎么通过机器学习结合你和别人的历史购物记录做出适合你的推荐. 亚马逊重点关注商品推荐,另一个推荐系统流行的例子是2006-2009. 年主办的比赛,100万美金奖励推荐电影系统. 我们在哪里能见到推荐系统. 来看一些推荐系统起到重要作用的领域. 个性化正在改变我们关于世界的经验.

算法在社区氛围的应用(三): 机器学习在答非所问识别上的运用

于03-27 21:16 - 知一声 -
现在,瓦力可直接识别并处理该题中的答非所问内容. 我们鼓励认真、专业的分享,期待每一次讨论都能碰撞出更多有价值的信息,并希望每一个用心的回答都能够得到好的展示,为他人带来更多帮助. 但是,我们也发现在社区中出现了答非所问类的内容,影响知友们获取有价值内容的效率. 为了更好地识别答非所问类内容,我们采用了多种模型,包括传统的机器学习模型和比较新的深度学习模型.

NLP︱高级词向量表达(二)——FastText(简述、学习笔记) - CSDN博客

于03-14 14:12 - -
FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,不过这个项目其实是有两部分组成的,一部分是这篇文章介绍的. fastText 文本分类(paper:. Classification(高效文本分类技巧)),. 另一部分是词嵌入学习(paper:. Information(使用子字信息丰富词汇向量)).

大规模机器学习框架的四重境界

于03-10 12:00 - - 机器学习 分布式 机器学习
文章为转载,原文链接见 这里,作者是 carbon zhang. 这篇文章主要介绍了分布式机器学习中的若干重点概念和经典论文,包括数据并行和模型并行、分布式框架的流派、参数服务器以及同步协议的演进等,非常值得一看. 自从google发表著名的 GFS、MapReduce、BigTable 三篇paper以后,互联网正式迎来了大数据时代.

如何用Python和机器学习训练中文文本情感分类模型?

于03-12 23:21 - shendao - 极客互联
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析. 其中还会介绍中文停用词的处理方法. 前些日子,我在微信后台收到了一则读者的留言. 我一下子有些懵——这怎么还带点播了呢. 但是旋即我醒悟过来,好像是我自己之前挖了个坑. 如何用Python从海量文本抽取主题.

前提条件和准备工作  |  机器学习速成课程  |  Google Developers

于03-01 21:11 - -
我对机器学习知之甚少或一无所知. 我们建议您按顺序学习所有资料. 我对机器学习有一些了解,但想了解更新、更全面的机器学习知识. 机器学习速成课程是很好的复习进修资料. 您可以按顺序学习所有单元,也可以只学习您感兴趣的单元. 我很了解机器学习,但对 TensorFlow 知之甚少或一无所知. 很多资料对您来说可能太初级了.

机器学习算法选用指南

于02-27 00:00 - - geek
在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题. 虽然有很多有关机器学习算法的文章详细介绍了相关的算法,但要做出最合适的选择依然非常困难. 在这篇文章中,我将对一些基本概念给出简要的介绍,对不同任务中使用不同类型的机器学习算法给出一点建议. 在文章的最后,我将对这些算法进行总结.

机器学习项目如何管理:工作内容

于02-23 13:01 - -
前一篇文章介绍了机器学习的基本过程,然后讨论了如何对机器学习项目设置期望的问题. 我们了解到,度量准确率的指标可以有多种,需要根据应用场景来选择. 一旦选好了度量指标,接下来就可以围绕这个指标来划分任务、监控进度、管理风险. 站在非常宏观的角度,机器学习系统工作的方式是:你有一个模型,你把一堆数据输入给它,然后你以某种方式使用它提供给你的输出.

AI工程师基础能力:机器学习

于02-11 00:00 - - tuicool
试试 下载InfoQ手机客户端,每天上下班路上听新闻,有趣还有料. 本文首发于洪亮劼在极客时间App上开始的独家专栏 《AI技术内参》,更多精彩文章,正在专栏更新. 点击 此处,或扫描下图二维码订阅,永久阅读专栏内所有内容. 想要成为合格的,或者更进一步成为优秀的人工智能工程师或数据科学家,机器学习的各种基础知识是必不可少的.

《为什么学生不喜欢上学》豆瓣9.4也不够,这本100页的书教会我如何学习

于01-31 22:25 - -
如你所见,封面就像地摊读物,书名又傻里傻气……. 然而,这本书的内容质量,却非常非常高!. 又一本被封面和书名毁了的好书……我们来看这本书的英文名:. Why Don't Students Like School: A Cognitive Scientist Answers Questions About How the Mind Works and What It Means for the Classroom.

微信的机器学习与人工智能应用实践

于01-29 19:49 - -
大家好,我是来自微信的张重阳,很荣幸有这个机会和大家一起交流一下机器学习和人工智能技术在微信的应用实践. 谈起人工智能,大家首先想到的是图像识别、语音识别、机器翻译、机器人这些技术,然而人工智能所涉及的应用场景和商业价值却远不止此. 在日常的经营和管理中,任何一个企业都会维护客户关系,都有销售数据需要分析,都会在生产,销售和运营的各个环节中面对不同的决策问题,新一代的商业智能技术就是利用现在飞速发展的机器学习和数据分析技术对企业商业化过程中面临的各种问题给出自动化的智能解决方案,从而驱动业务快速增长.

机器学习项目如何管理:设置期望

于01-27 19:11 - -
我在之前的一篇文章中提到, 机器学习项目如何管理,目前在行业内是一个普遍存在的难题. 具体而言,对于这类项目,我们需要一套行之有效的工作办法,帮助一线工作者:(1)知道什么时候该做什么事;(2)知道什么时候该看什么指标;(3)知道什么时候可能有什么风险. 这样一套工作办法的第一步,就是对一个机器学习项目设置合理的期望.

[原]机器学习在热门微博推荐系统的应用

于01-25 14:41 - qq_40027052 -
近年来,机器学习在搜索、广告、推荐等领域取得了非常突出的成果,成为最引人注目的技术热点之一. 微博也在机器学习方面做了广泛的探索,其中在推荐领域,将机器学习技术应用于微博最主要的产品之一——热门微博,并取得了显著的效果提升. 热门微博是基于微博原生内容的个性化兴趣阅读产品. 提供最新最热优质内容阅读服务,更好地保障用户阅读效率和质量,同时达到激励微博上内容作者更好的创作和推广内容.

关于Python数据分析,这里有一条高效的学习路径

于01-21 20:29 - -
谷歌的数据分析可以预测一个地区即将爆发的流感,从而进行针对性的预防;淘宝可以根据你浏览和消费的数据进行分析,为你精准推荐商品;口碑极好的网易云音乐,通过其相似性算法,为不同的人量身定制每日歌单……. 数据正在变得越来越常见,小到我们每个人的社交网络、消费信息、运动轨迹……,大到企业的销售、运营数据,产品的生产数据,交通网络数据…….

使用python+机器学习方法进行情感分析(详细步骤) - 51CTO.COM

于01-05 17:49 - -
【限时免费】年底最强一次云计算大会,看传统、社区、互联网企业如何碰撞. 不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会. 无论是主客观分类还是正负面情感分类,机器学习都可以完成任务.