更新于:05-20 15:59

有关[学习]标签推荐

Nimbus: Hulu的深度学习平台

于04-03 23:37 - Dong - 人工智能 AI 深度学习
Hulu是美国领先的互联网专业视频服务平台,目前在美国拥有超过2500万付费用户. Hulu的目标是帮助用户在任意时刻、任何地点、以任何方式查找并欣赏到高质量的电视剧、电影和电视直播. 实现这一目标离不开各个团队的努力,而AI在其中扮演者越来越重要的角色. 在Hulu, 我们拥有诸多的researcher团队,如广告团队,推荐团队,视频理解团队等ji等.

分享:个人是怎么学习新知识的

于04-09 22:09 - - 其他 工作 学习
挺多童鞋问我是怎么学习新知识的,干脆写篇文章总结一下,希望对大家有所帮助. 对照书、技术博客、极客时间等学习的方式我就不说了. 在15年及更早,由于知识储备少,基础偏弱,大致采取了如下的步骤:. 了解xx是什么,能解决什么问题. 例如个人学习Spring、Struts、Hibernate时,就是找了 马士兵 老师的视频.

机器学习的流程是怎样的呢?如何应用到实践中去呢?

于03-01 08:13 - 梦想在起飞 - AI人工智能 3年 中级 机器学习
机器学习是一种能够实现人工智能的技术,可以通过大量的数据,训练出来一个处理数据的模型. 本文笔者将与大家分享:机器学习的相关实践应用. 我所理解的机器学习是一种能够实现人工智能的技术,建立能从经验(数据)中进行学习的模型,从而使这个模型可以达到自行处理此类数据的能力. 也可以理解为:通过大量的数据,训练出一个能处理此类数据的模型.

KNN算法实战:验证码的识别

于02-15 12:25 - 标点符 - 数据 机器学习 算法
识别验证码的方式很多,如tesseract、SVM等. 前面的几篇文章介绍了 KNN算法,今天主要学习的是如何使用KNN进行验证码的识别. 本次实验采用的是CSDN的验证码做演练,相关的接口:https://download.csdn.net/index.php/rest/tools/validcode/source_ip_validate/10.5711163911089325.

文本分类中的一些经验和 tricks

于01-26 17:01 - - NLP 深度学习 NLP
最近在总结之前做的文本分类实验的一些经验和 tricks,同时也参考了网上的一些相关资料(见文末),其中有些 tricks 没尝试过,先在这里记下,或者日后能用上. 这里的经验和 tricks 大概可分为两部分:预处理部分和模型部分,下面分别介绍. 文本更正,一些基本的操作包括:繁体转简体,全角转半角,拼音纠错等.

机器学习算法Boosting

于01-11 17:59 - 标点符 - 数据 机器学习 算法
机器学习通常会被分为2大类:监督学习和非监督学习. 在监督学习中,训练数据由输入和期望的输出组成,然后对非训练数据进行预测输出,也就是找出输入x与输出y之间的函数关系F:y = F(x). 根据输出的精确特性又可以分为分类和回归. 分类和回归的区别在于输出变量的类型. 定量输出称为回归,或者说是连续变量预测.

使用 Scikit-learn 的进行 KNN 分类

于12-19 09:59 - 标点符 - 数据 Python 机器学习
最近邻(KNN)是一种非常简单、易于理解、通用性强的机器学习算法,广泛应用于金融、医疗、政治、手写检测、图像识别、视频识别等领域. 在信用评级中,金融机构会预测客户的信用评级. 在贷款支付中,银行机构将预测贷款是否安全或有风险. 在政治学中,将潜在选民分为两类,要么投票,要么不投票. 上一篇《 K-近邻算法KNN学习笔记》主要讲解的是KNN的理论内容,今天主要学习怎么用KNN进行实战.

表面繁荣之下,人工智能的发展已陷入困境

于11-28 02:36 - DinK - 人工智能 深度学习
《连线》杂志在其最近发布的12月刊上,以封面故事的形式报道了人工智能的发展状况. 现在,深度学习面临着无法进行推理的困境,这也就意味着,它无法让机器具备像人一样的智能. 但是真正的推理在机器中是什么样子的呢. 如果深度学习不能帮助我们达到目的,那什么可以呢. 文章作者为克莱夫·汤普森(@pomeranian99),原标题为“How to Teach Artificial Intelligence Some Common Sense”.

CTR 预估模型简介--非深度学习篇

于07-15 21:53 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中常用的一些模型,主要是非深度学习模型,包括 LR、GBDT+LR、FM/FFM、MLR. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. LR + 海量人工特征 是业界流传已久的做法,这个方法由于简单、可解释性强,因此在工业界得到广泛应用,但是这种做法依赖于特征工程的有效性,也就是需要对具体的业务场景有深刻的认识才能提取出好的特征.

CTR 预估模型简介--深度学习篇

于07-16 22:36 - - 机器学习 机器学习 计算广告
本文主要介绍 CTR 预估中一些深度学习模型,包括 FNN、Wide&Deep、PNN、DIN、 Deep&Cross等. 每个模型会简单介绍其原理、论文出处以及其一些开源实现. FNN 是伦敦大学于 2016 在一篇论文中发表的,模型的结构如下. FNN 假设输入数据的格式是离散的类别特征(表示为 one-hot 编码),且每个特征属于一个 field,通过 embedding 层将高纬稀疏特征映射成低维稠密特征后,再作为多层感知机(MLP)的输入.

大规模机器学习框架的四重境界

于03-10 12:00 - - 机器学习 分布式 机器学习
文章为转载,原文链接见 这里,作者是 carbon zhang. 这篇文章主要介绍了分布式机器学习中的若干重点概念和经典论文,包括数据并行和模型并行、分布式框架的流派、参数服务器以及同步协议的演进等,非常值得一看. 自从google发表著名的 GFS、MapReduce、BigTable 三篇paper以后,互联网正式迎来了大数据时代.

如何实现一个基本的微信文章分类器

于03-01 16:25 - fullstackyang - 朴素贝叶斯 文本分类 机器学习 java
本文源地址: http://www.fullstackyang.com/...,转发请注明该地址或segmentfault地址,谢谢. 微信公众号发布的文章和一般门户网站的新闻文本类型有所不同,通常不能用现有的文本分类器直接对这些文章进行分类,不过文本分类的原理是相通的,本文以微信公众号文章为对象,介绍朴素贝叶斯分类器的实现过程.

做 ML 有关的工作,需要哪些技能?

于01-30 23:08 - Agatha - IT技术 机器学习
【导读】:有位网友在 Quora 上提问:做与机器学习有关的工作,需要些什么技能呢. 我是一个自学者,现在家中自学线性代数. 希望有天能在机器学习领域工作,但是我不太确定:. a) 这种工作/面试需要什么技术上的技能. b) 有没有什么(做这种工作)必须的相关工作经历. 比起空想,我至少开始行动了.

构建基于Spark的推荐引擎(Python)

于12-19 18:29 - NULL - 机器学习 大数据 python spark
构建基于Spark的推荐引擎(Python). 推荐引擎背后的想法是预测人们可能喜好的物品并通过探寻物品之间的联系来辅助这个过程. 在学习Spark机器学习这本书时,书上用scala完成,自己不熟悉遂用pyshark完成,更深入的理解了spark对协同过滤的实现. 在这里我们的推荐模型选用协同过滤这种类型,使用Spark的MLlib中推荐模型库中基于矩阵分解(matrix factorization)的实现.

Java使用google的thumbnailator工具对图片压缩水印等做处理

于11-07 16:37 - - Oracle学习总结
今天给大家分享一个非常好用的工具thumbnailator. Thumbnailator是一个非常好的图片开源工具. net.coobird thumbnailator 0.4.8 .

一个完整推荐系统的设计实现-以百度关键词搜索推荐为例

于09-17 22:42 - admin - 产品 推荐系统 搜索引擎 数据挖掘 机器学习
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门,热门关键词的问题. 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别. 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计. 结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求.

用神经网络训练一个文本分类器

于08-10 21:05 - Anne90 - IT技术 机器学习
理解聊天机器人的工作原理是非常重要的. 聊天机器人内部一个非常重要的组件就是文本分类器. 我们看一下文本分类器的神经网络(ANN)的内部工作原理. 我们将会使用2层网络(1个隐层)和一个“词包”的方法来组织我们的训练数据. 文本分类有3个特点:模式匹配、算法、神经网络. 虽然使用多项朴素贝叶斯算法的方法非常有效,但是它有3个致命的缺陷:.

人工智能复杂的商业需求,正促使博弈 AI 的崛起 | AI大师圆桌会

于07-29 10:20 - 吴宁川 - 钛媒体·国际AI大师圆桌会 人工智能 头条 机器学习
卡耐基梅隆大学计算机系教授、德扑AI之父 Tuomas Sandholm. “人工智能时代,针对机器的算法是机器学习,针对人类的算法是博弈论. ”这是清华大学交叉信息研究院青年千人助理教授、博士生导师、计算经济学研究室主任唐平中,在2017年7月20日钛媒体与杉数科技联合举办的 “AI大师圆桌会之AI时代的博弈与行为分析”活动上提出的观点.

深度学习二三事

于11-30 08:00 - 饭团君 - 专栏 深度学习
我知道博客标题中使用否定词很奇怪,但是前几天有一波讨论正好相应于我正在思考的一些问题. 这一切开始于 Jeff Leek 发表的 一篇有关说明在小样本范围内使用深度学习的文章. 要言之,他认为当样本较小时(生物领域中属于常见现象),带有少许参数的线性模型甚至比带有少量层和隐藏单元的深度网络性能更优.

docker挂载本地目录,实现文件共享

于07-18 16:57 - - Docker学习
Docker可以支持把一个宿主机上的目录挂载到镜像里. 通过-v参数,冒号前为宿主机目录,必须为绝对路径,冒号后为镜像内挂载的路径. 现在镜像内就可以共享宿主机里的文件了. 默认挂载的路径权限为读写. 数据卷:“其实就是一个正常的容器,专门用来提供数据卷供其它容器挂载的”. 感觉像是由一个容器定义的一个数据挂载信息.

深度学习利器:TensorFlow实战

于07-17 17:03 - - 机器学习
深度学习及TensorFlow简介. 深度学习目前已经被应用到图像识别,语音识别,自然语言处理,机器翻译等场景并取得了很好的行业应用效果. 至今已有数种深度学习框架,如TensorFlow、Caffe、Theano、Torch、MXNet,这些框架都能够支持深度神经网络、卷积神经网络、深度信念网络和递归神经网络等模型.

从零开始使用TensorFlow建立简单的逻辑回归模型

于06-27 21:23 - dyzdyz010 - tensorflow python 机器学习
TensorFlow 是一个基于 python 的机器学习框架. 在 Coursera 上学习了逻辑回归的课程内容后,想把在 MATLAB 中实现了的内容用 TensorFlow 重新实现一遍,当做学习 Python 和框架的敲门砖. 知道逻辑回归是什么,懂一点 Python,听说过 TensorFlow.

自然语言处理第一番之文本分类器

于06-18 14:05 - burness - 机器学习 NLP 深度学习 machine learning tensorflow
文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下我们如何做一个文本分类器. 传统的文本方法的主要流程是人工设计一些特征,从原始文档中提取特征,然后指定分类器如LR、SVM,训练模型对文章进行分类,比较经典的特征提取方法如频次法、tf-idf、互信息方法、N-Gram.

机器学习和深度学习的最佳框架大比拼

于02-09 14:35 - 伯小乐 - 工具与资源 机器学习 深度学习
在过去的一年里,咱们讨论了六个开源机器学习和/或深度学习框架:Caffe,Microsoft Cognitive Toolkit(又名CNTK 2),MXNet,Scikit-learn,Spark MLlib和TensorFlow. 如果把网撒得大些,可能还会覆盖其他几个流行的框架,包括Theano(一个10年之久的Python深度学习和机器学习框架),Keras(一个Theano和TensorFlow深度学习的前端),DeepLearning4j(Java和Scala在Hadoop和Spark之上的深度学习软件).

jmeter的两种参数化方法

于04-08 09:47 - - Jmeter源码学习
JMeter也有像LR中的参数化,本篇就来介绍下JMeter的参数化如何去实现. 参数化:录制脚本中有登录操作,需要输入用户名和密码,假如系统不允许相同的用户名和密码同时登录,或者想更好的模拟多个用户来登录系统. 这个时候就需要对用户名和密码进行参数化,使每个虚拟用户都使用不同的用户名和密码进行访问.

基于KNN的文本分类实战

于04-03 10:39 - - 机器学习
本文讲述如何使用scikit-learn的KNN工具对文本进行分类. K-近邻算法,简称KNN(k-Nearest Neighbor),是一个相当简单的分类/预测算法. 其主要思想就是,选取与待分类/预测数据的最相似的K个训练数据,通过对这K个数据的结果或者分类标号取平均、取众数等方法得到待分类/预测数据的结果或者分类标号.

关于Uber机制的思考

于09-20 00:08 - Kant - 学习笔记 所有文章 Uber 产品设计
昨天写了一篇关于滴滴打车改版的文章(文章链接),引发了一些关于Uber和滴滴的对比讨论. 质疑明显歪了楼,大家主要讨论的是,Uber忽略目的地的问题和它的派单机制,而我在昨天文章中说的是Uber的首页设计的一些问题,具体来说,是它的出发地和开始用车的按钮不在一起的问题,以及出发地带搜索icon带来误解的问题.

十大特征暗示你异常聪明

于02-11 20:21 - zxfclz - 励志 学习 成长 技巧
我们通常通过一个人的外貌、社会地位来判断一个人,这种判断还包含着我们自己的认为倾向. 如果一个人打着领结,戴着厚厚的眼镜,穿着短裤,那他多半是一个软件奇才或者象棋大师,更或者是九宫格游戏高手. 无论他是干什么的,我们都自然而然的觉得这样打扮的人更聪明. 然而,除了上面提到的老一套认知观念,还有很多聪明的人,他们有着与我们所认为的完全不同的兴趣爱好.

115本值得一读再读的书,值得收藏!

于02-09 20:10 - zxfclz - 趣事 学习 资料 阅读
你在阅读上花的每一秒,都会沉淀成更好的你. 12类,115本值得一读再读的好书. 20年来迪士尼动画和对手们的成绩对比. 经典台词:我的爱,不会让我成为永远的孤魂. 十分钟读完春秋史:假如中原是一个村.

如何突破学习障碍成就专家级的人才

于03-11 00:24 - 左岸 - 思维乐趣 学习 思考 技巧 能力
互联网时代,即使是非常渺小的个体,你也有可能通过单点突破,成就为自己擅长领域的专家. 至于我们经历耳濡目染的通才教育,也在这个日新月异的互联网时代而被摒弃. 互联网就是一个展示自我的平台,在这个平台,你不再被时代限制,不再被环境淹没,你只要习得拥有超越常人的技能,你就可以在你的领域发声. 学习与成长从来就不是一蹴而就.