更新于:10-28 22:23

有关[学习]分类推荐

机器学习之类别不平衡问题:模型的评价指标

于11-17 00:00 - - dev
本系列文章主要介绍机器学习中类别不平衡问题的处理,在实际应用中类别不平衡问题是非常常见的,文章主要包括以下部分. (2).不平衡问题的常用指标. (3).从数据集角度处理不平衡问题. (4).从算法角度处理不平衡问题. 本次文章主要是第一部分模型的评价指标,如果对模型的评价指标不了解,那么后续模型的好坏也无从谈起.

使用dlib 进行高质量深度学习人脸识别

于11-03 19:34 - -
自上一次dlib发布以来,我一直在努力为dlib 添加易于使用的. 深度学习对很多事情都很有用,但最受欢迎的应用是人脸识别. 所以显然我必须 向dlib 添加  . 新的例子附带了秃头好莱坞动作英雄的照片,并使用提供的深度模型来识别有多少不同的人以及哪些面孔属于每个人. 下面显示了输入图像以及四个自动识别的面部聚类:.

美团深度学习系统的工程实践

于10-26 01:22 - 美团点评技术团队 -
深度学习作为AI时代的核心技术,已经被应用于多个场景. 在系统设计层面,由于其具有计算密集型的特性,所以与传统的机器学习算法在工程实践过程中存在诸多的不同. 本文将介绍美团平台在应用深度学习技术的过程中,相关系统设计的一些经验. 本文将首先列举部分深度学习算法所需的计算量,然后再介绍为满足这些计算量,目前业界比较常见的一些解决方案.

刚采访了一个大学霸,他的秘诀是预习(学霸开豆瓣啦)

于10-23 12:42 - -
刚才学霸邮件回复了我,我复制下来了:. 今天因为工作需要采访了一个top1学府的尖子学霸. 期间他的很多话深深的震撼了我:. “其实我也不聪明,我很蠢的,我就是靠预习. “就是小学五六年级就开始看初一到初三的课程和作业,初中看高中的,以此类推. ,所以你上初中的时候就在学高中的教材了. “对,也会做高中的习题作业、考卷.

基于深度学习的智能问答-博客-云栖社区-阿里云

于10-15 13:48 - -
纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史. 但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应. 自此,自动问答系统较以往任何时候都显得离实际应用更近. 这一方面归功于机器学习与自然语言处理技术的长足进步,另一方面得益于维基百科等大规模知识库以及海量网络信息的出现.

基于 TensorFlow Serving 的深度学习在线预估

于10-13 00:00 - - dev
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

关于机器学习,你应该知道的 3 个热门专业术语

于10-13 00:00 - - dev
编者按:如果你是刚入门机器学习的AI探索者,你知道什么是胶囊网络吗. 为了帮大家节省查阅晦涩难懂的论文的时间,我们邀请微软亚洲研究院机器学习组实习生吴郦军、罗人千帮大家用最通俗的语言解释了这三个机器学习领域的热门词汇,赶紧收藏吧. 胶囊网络Capsule Networks 胶囊网络(Capsule Networks)是深度学习三巨头之一的Geoffrey Hinton提出的一种全新的神经网络.

好未来励步英语发布3.0完整学习产品,推出AI智能学习机器人

于10-11 17:06 - - 业界
雷锋网消息,10月10日,好未来旗下英语品牌励步英语在北京举行“用ai驱动完整学习——励步英语新十年•新产品发布会”. 会上,励步英语正式推出3.0完整学习产品,提出“用ai驱动完整学习”的理念. 发布3.0完整学习产品,形成线上+线下学习闭环. 雷锋网注:励步英语总经理曹伟. 励步英语总经理曹伟在题为“励步新十年,用ai驱动”的演讲中介绍了励步3.0教育公式:(有爱的老师+有爱的内容)*科技智能=孩子完整的学习体验.

基于TensorFlow Serving的深度学习在线预估

于10-11 21:30 - 美团点评技术团队 -
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

推荐两个英语优质学习材料

于10-06 00:00 - - jianshu
推荐这两个材料,是因为有战友提问. 我的英语能力并不出众,但使用这两个学习材料,对我在英语听力和口语能力的提升帮助巨大. 战友提到有一定的英语基础,这和我刚开始学习时的情形类似. 国内有一定英语基础的人,基本上都具有较大的词汇量和一定的阅读能力,相对来说,听力和口语方面表现较差,这和我们从小到大的英语教育有莫大的关系.

NodeJS学习笔记

于09-17 15:19 - freesky_zh -
今天开始学习NodeJS,在这里做个笔记,记录一下我的学习历程,也方便以后参考. Node.js® 是一个基于  Chrome V8 引擎 的 JavaScript 运行时. 简单的说 Node.js 就是运行在服务端的 JavaScript. Node.js 是一个基于Chrome JavaScript 运行时建立的一个平台.

终结吧!机器学习的数学焦虑

于09-14 14:38 - 大数据文摘 -
本文作者Vincent Chen 是斯坦福大学计算机科学学生,同时也是斯坦福大学人工智能实验室的RA(研究助理). 开始机器学习之旅,需要什么层次的数学功底. 尤其是对于那些没有学过数学和统计学的同学们来说,这个问题当前不甚清楚,在这篇文章中,我将要为那些使用机器学习技术来开发产品或做学术研究的人们提供一些数学背景方面的建议.

在学习中,有一个比掌握知识更重要的能力

于09-08 16:28 - -
  我一朋友的公司,专门给创业者提供创业培训. 有一天,他和我聊道, 现在创业者有一个普遍困扰,那就是不知道该学什么好.   他说:你想啊,创业者累成狗,本来时间就很少,结果创业方法今天出一个还没弄明白,明天就又出来一个——根本学不过来啊. 我说,你以为只有创业者累成狗,没时间学那么多东西啊, 我们都一样.

PMML模型文件在机器学习的实践经验 - CSDN博客

于08-30 15:34 - -
算法工程师和业务开发工程师,所掌握的技能容易在长期的工作中出现比较深的鸿沟,算法工程师辛辛苦苦调参的成果,业务工程师可能不清楚如何使用,如何为线上决策给予支持. 本文介绍一种基于PMML的模型上线方法. 这种方案,在本次参加 QCon 大会时,Paypal的机器学习平台中也有所提及:. 预测模型标记语言(Predictive Model Markup Language,PMML)是一种可以呈现预测分析模型的事实标准语言.

各大公司广泛使用的在线学习算法FTRL详解 - EE_NovRain - 博客园

于08-30 15:22 - -
 转载请注明本文链接:http://www.cnblogs.com/EE-NovRain/p/3810737.html .   现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据流,google先后三年时间(2010年-2013年)从理论研究到实际工程化实现的.

这么多机器学习的应用场景,金融领域到底有何不同?

于08-28 13:33 - 大数据文摘 -
在金融领域,机器学习可能会产生神奇的效果,尽管它本身并没有什么神奇之处(嗯,也许只是一点点). 然而,机器学习项目的成功更多依赖于构建高效的基础结构、收集适当的数据集和应用正确的算法. 机器学习正在对金融服务业产生重大影响. 让我们来看看为什么金融公司会关心这项技术,以及使用人工智能和机器学习可以实现什么解决方案和如何应用这项技术.

机器学习跌下神坛?一些技术趋势正在消失

于08-26 08:36 - -
未来,在路边等待 Uber 或 Lyft 来载你或将成为过去式,届时,我们要做的可能就是走到直升机降落场,叫上一辆无人机. 这种未来的“空中飞的”不仅将减少交通堵塞,而且省去了人类驾驶员. 说到打飞的,事实上无人机技术还远未成熟到可以为我们提供民主化交通服务的地步. 其中第一个挑战便来自于人类对自动化技术的掌握.

手机淘宝推荐中的排序学习-博客-云栖社区-阿里云

于08-20 16:38 - -
周梁:淘宝推荐机器学习技术专家,中国科学院自动化研究所机器学习博士,主要研究工作方向是机器学习、大规模并行算法优化. 先后从事过广告CTR预估,MPI机器学习平台搭建,手淘个性化推荐等多方面工作. 排序学习是推荐、搜索、广告的核心问题. 在手机淘宝的推荐场景中,受制于展示空间的限制,排序学习显得尤为重要.

我们该如何学习机器学习中的数学

于08-04 17:58 - 机器之心 -
数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少. 通常离开学校后很难有机会静下心学习数学知识,因此我们最好能通过阅读小组或读书会等形式营造环境,并专注学习那些在实践中常常需要用到的数学知识. 数学达到什么水平才可以开始机器学习. 人们并不清楚,尤其是那些在校期间没有研究过数学或统计学的人.

Spark机器学习案例 spark-example: spark mllib example

于08-03 22:10 - -
#这是一个Spark MLlib实例 . ##1 K-means基础实例 . 命名为kmeans_data.txt,且上传到hdfs的/spark/mllib/data/路径中. 在Intellij中,点击file->选择project structure->选择Artifact->添加jar->把乱七八糟的依赖移除->勾选Build on make.

Apache PredictionIO机器学习和智能推荐服务搭建 - 简书

于08-02 13:49 - -
一、PredictionIO介绍. Apache PredictionIO 是一个孵化中的机器学习服务器,它可以为为开发人员和数据科学家创建任何机器学习任务的预测引擎. PredictionIO以Spark为计算引擎,mysql or HBase+Elasticsearch or PostgreSql 为数据存储,并提供了常用的模板引擎:.

图灵奖得主John Hennessy、David Patterson访谈:未来小学生都能做机器学习

于07-27 18:51 - - 人工智能
雷锋网 AI 科技评论按:在 Google Cloud Next 2018 大会上有一个万众期待的环节,就是今年三月获得 2017 年图灵奖的 John L. Patterson 两人的现场访谈. 谷歌母公司 Alphabet 董事长、斯坦福大学前校长 John Hennessy 与谷歌 TPU 团队、UC 伯克利大学退休教授 David Patterson 两人因计算机体系架构的设计与评价方法以及对 RISC 微处理器行业的巨大影响获得图灵奖后,在多个场合进行了演讲.

CTR 预估模型简介--非深度学习篇

于07-15 21:53 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中常用的一些模型,主要是非深度学习模型,包括 LR、GBDT+LR、FM/FFM、MLR. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. LR + 海量人工特征 是业界流传已久的做法,这个方法由于简单、可解释性强,因此在工业界得到广泛应用,但是这种做法依赖于特征工程的有效性,也就是需要对具体的业务场景有深刻的认识才能提取出好的特征.

CTR 预估模型简介--深度学习篇

于07-16 22:36 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中一些深度学习模型,包括 FNN、Wide&Deep、PNN、DIN、 Deep&Cross等. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. FNN 是伦敦大学于 2016 在一篇论文中发表的,模型的结构如下. FNN 假设输入数据的格式是离散的类别特征(表示为 one-hot 编码),且每个特征属于一个 field,通过 embedding 层将高纬稀疏特征映射成低维稠密特征后,再作为多层感知机(MLP)的输入.

[译] 如何选择正确的机器学习算法?

于07-02 00:00 - - dev
机器学习既是一门科学,也是一种艺术. 纵观各类机器学习算法,并没有一种普适的解决方案或方法. 事实上,有几个因素会影响你对机器学习算法的选择. 有些问题是非常特别的,需要用一种特定的解决方法. 例如,如果你对推荐系统有所了解,你会发现它是一类很常用的机器学习算法,用来解决一类非常特殊的问题. 而其它的一些问题则非常开放,可能需要一种试错方法(例如:强化学习).

Facebook 扩大内容核查范围,机器学习+全方位审核打击假新闻

于06-24 17:47 - -
6 月 22 日早晨,Facebook 宣布将扩大其内容核查范围,以打击社交网络上面的虚假新闻和恶作剧消息,并通过相应的打击措施和技术手段,尽量减少虚假新闻带来的恶劣影响. Facebook 在博文中透露,虚假新闻以及恶意篡改内容在一些国家已经成为常态,这使得读者难以判别信息的真假,甚至难以判别与新闻事件相关的图片或视频是否真实.

随机加权平均 -- 在深度学习中获得最优结果的新方法

于06-21 16:06 - - AI开发
本文为雷锋网字幕组编译的技术博客 A Simple Guide to the Versions of the Inception Network,原标题,作者为 Bharath Raj. 翻译 | 龙翔    整理 |  孔令双. 雷锋网 AI 研习社:在这篇文章中,我将讨论最近两篇有趣的论文. 它们提供了一种简单的方式,通过使用一种巧妙的集成方法提升神经网络的性能.

机器学习项目如何管理:看板

于06-13 04:53 - -
在前面的文章中我们看到,涉及机器学习、人工智能的项目,普遍地存在 项目管理的困难. 然后我介绍了针对这类项目 如何设置合理的期望,并且深入分析了 机器学习项目的工作内容. 既然已经知道如何设置客户的期望、又知道可以做哪些事来逼近这个期望,那么围绕期望和动作进行任务的拆解、管理和可视化应该是顺理成章的.

[原]快速学习COSMIC方法之十七:如何寻找更简单有效的规模度量方法?

于05-24 15:52 - dylanren -
  很多企业都在探索合理估算工作量的方法,而工作量的多少主要取决于软件规模的大小,因此在估算软件工作量之前需要先估算其规模. 传统的规模估算方法是进行代码行的估算,但是对于同一个需求,不同经验的人员去估算,结果差别很大,不同的实现语言,估算结果差别也很大,即使不同经验的人员针对同一种需求去实现,实际的代码行数也差别很大,并且实际情况中,往往一个需求可能需要多种语言结合才能实现.

Spark2.x学习笔记:11、RDD依赖关系与stage划分 - CSDN博客

于05-23 17:39 - -
11、 RDD依赖关系与stage划分. Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系. 针对不同的转换函数,RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency).