更新于:12-15 23:30

有关[学习]分类推荐

Word2vec之情感语义分析实战(part3)--利用分布式词向量完成监督学习任务

于12-16 10:55 - u010665216 -
这篇博客将基于前面一篇博客 Part2做进一步的探索与实战. demo代码与数据: 传送门. 前面我们训练了单词的语义理解模型. 如果我们深入研究就会发现,Part2中训练好的模型是由词汇表中单词的特征向量所组成的. 这些特征向量存储在叫做syn0的numpy数组中:. 很明显这个numpy数组大小为(16490,300)分别代表词汇表单词数目及每个单词对应的特征数.

机器学习项目如何管理:现状

于12-08 21:35 - -
Atlassian今年4月的一篇博客提出,到2020年有87%的Jira用户认为他们的工作会被AI改变. 具体到项目管理上,Atlassian的观点是,AI首先会作为项目管理助手进入我们的视野,然后透过数据拓展我们对项目的理解,更进一步还能通过主动猜测、倡导优秀实践、创造新的元数据层等方式弥补数据的缺失,最终对项目提出有益的建议.

基于机器学习方法的POI品类推荐算法 -

于12-06 09:07 - -
在美团商家数据中心(MDC),有超过100w的已校准审核的POI数据(我们一般将商家标示为POI,POI基础信息包括:门店名称、品类、电话、地址、坐标等). 如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行了一些尝试:利用机器学习方法,自动标注缺失品类的POI数据. 例如,门店名称为“好再来牛肉拉面馆”的POI将自动标注“小吃”品类.

xLearn:专门针对大规模稀疏数据的机器学习库

于11-25 00:00 - - dev
xLearn does not rely on any third-party library, and hence users can just clone the code and compile it by using cmake. Apart from this, xLearn supports many useful features that has been widely used in the machine learning competitions like cross-validation, early-stop, etc..

Raúl Garreta大神教你5步搭建机器学习文本分类器:MonkeyLearn

于11-24 08:20 - shendao - 极客互联
摘要:Raúl Garreta,《Learning scikit-learn: Machine Learning in Python》一书作者,手把手教你5步搭建机器学习文本分类器:1.定义类别树;2.数据收集;3.数据标记;4.训练分类器;5.测试&提升分类器. 用机器学习构建一个好的文本分类器是一项很有挑战性的工作.

机器学习算法 Java 库 Smile 1.5.0 发布,引入新特性

于11-22 22:46 - - 软件更新新闻
机器学习算法 Java 库 Smile 1.5.0 已发布. 该版本引入了新特性和修复 bug,改进了对 Windows 的支持,具体如下:. SmileMiner是一个包含各种现有的机器学习算法的Java库. mile 机器学习的核心库. SmileMath 数学函数、排序、随机数生成器、最优化、线性代数、统计分布、假设检验.

想学习推荐系统,如何从小白成为高手? - 知乎

于11-16 01:35 - -
同在学习推荐算法,大概介绍一下我自己规划的推荐算法学习轨迹(还在慢慢实践中,好长时间了,捂脸...). 首先,看完了推荐系统实战的话,应该大概了解了大部分的推荐算法. 那我觉得看完了书,应该有必要再从宏观上再来了解一下推荐系统这个研究领域的研究现状,包括研究领域目前有的挑战,比如冷启动问题,大规模矩阵分解问题,增量模型计算问题等等,包括目前热门的研究方向,比如基于LBS、社交网络等等的推荐.

从逻辑回归到深度学习,点击率预测技术面面观

于11-16 01:12 - -
预测物品的点击率在计算广告、推荐系统等不同业务系统中都有一定需求,因此业界在这方面进行了不少研究. 然而在机器学习领域,书籍出版远远落后于业界知识更新,这就要求每个从业者阅读大量资料和论文才能跟上知识更新的步伐,而这又需要耗费大量的时间和精力. 本文是作者对阅读过的大量相关研究文献的小结,作者尝试结合文献与工作实践梳理广告点击率预测、推荐方面相关的技术脉络,希望能对大家有所帮助.

可汗学院的数学从零开始学习顺序? - 知乎

于11-10 02:25 - -
我按照英文官网的顺序整理了一下,但因为早期视频比较零散也有重复的地方,有些排序不知道对不对,可以提出修改建议:. 算术与代数预备课程:加法与减法(19集). 可汗学院公开课:算术与代数预备课程:加法与减法. 算术与代数预备课程:乘法与除法(26集). 可汗学院公开课:算术与代数预备课程:乘法与除法.

聊天机器人学习 | 李强的博客

于10-26 04:01 - -
人工智能一直以来是人类的梦想,造一台可以为你做一切事情并且有情感的机器人,像哆啦A梦一样,现在这已经不是一个梦了:iPhone里会说话的siri、会下棋的阿法狗、小度机器人、大白……,他们都能够具有智能,和人类交互,帮人类解决问题,这听起来非常神奇,实际上我们自己也可以做一个这样的机器人,从今天开始分享我将我学习和制作的过程.

干货 | 精选《SQL注入、渗透、反病毒》学习总结集锦给你们~

于11-30 00:00 - i春秋学院 - 专栏 SQL注入 反病毒 渗透
本次 “开学季拜师活动”的徒弟们在师父的精心指导下,在短短5天内得到了迅速地成长,以前或当时遇到的问题都能够柳暗花明,技能稳步加血. 虽不能说都是技术大作但都是认真学习的经验心得总结,字字真心,发自肺腑. 他们遇到的坑可能你曾经或现在也在纠结中,不妨学习学,生活可能会欺骗你,但是你吃过的饭和你看过的书挖过的洞一定不会骗你.

机器学习实战 MachineLearning/README.md at master · apachecn/MachineLearning · GitHub

于10-23 04:20 - -
ApacheCN - 学习机器学习群【629470233】. Machine Learning in Action (机器学习实战) |ApacheCN(apache中文网). 电子版书籍:【机器学习实战-中文版-带目录版.pdf】. 视频每周更新:如果你觉得有价值,请帮忙点 Star【后续组织学习活动:sklearn + tensorflow】.

关键词抽取算法的研究 | 吴良超的学习笔记

于10-21 08:24 - -
分词–>过滤停止词,得到候选关键词–>从候选关键词中选出文章的关键词. 从候选关键词中选出文章的关键词需要通过关键词抽取算法实现,而关键词抽取算法可以根据是否需要人工标注的语料进行训练而分为有监督的提取和无监督的提取. 有监督的提取需要人工标注的语料进行训练,人工预处理的代价较高. 而无监督的抽取算法直接利用需要提取关键词的文本即可进行关键词的提取,因此适用性较强.

从零开始掌握Python机器学习:十四步教程 - 知乎专栏

于10-20 08:11 - -
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源. 你现在也在考虑从 Python 入门机器学习吗. 本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了. 本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:7 Steps to Mastering Machine Learning With Python 和 7 More Steps to Mastering Machine Learning With Python.

机器学习中Bagging和Boosting的区别

于09-20 08:44 - jzy996492849 -
摘要:        Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法. 即将弱分类器组装成强分类器的方法.         首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本).

我是如何学习区块链的

于09-20 00:00 - - dev
原创文章,转载请注明:转载自 Keegan小钢. 微信订阅号: keeganlee_me. 专栏地址: https://xiaozhuanlan.com/fullstack. 前几天我们已经学了如何学习的“道”和“术”,学完之后就应该落地到实践上,通过不断地实践练习,才能将这些 知识资源转化为我们的 知识资本.

深度学习时代,海康威视是如何成为“学霸”的

于08-28 09:03 - 奇评测 - 界内 .慧聪安防网 海康威视
近年来全球高新技术发展迅猛,深度学习、 物联网等产业纷纷兴起. 我国向来重视科学技术,针对当前国际局势及国内需求,出台了大量相关优厚政策. 同时,人们对于高科技所带来的便捷越来越期待,对新兴事物的兴趣也越来越浓厚. 在此背景下,无数资本纷纷入局,希望能在人工智能、深度学习等新一波的浪潮中崭露头角.

机器学习原来如此有趣!全世界最简单的机器学习入门指南 | 人人都是互联网创意G客

于08-26 23:45 - -
图片来自dribbble.com by Justin Mezzell. 你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢. 你是否已经厌倦了在和同事对话时只能点头呢. 现在,让我们一起来改变这个现状吧. 这篇文章是为那些对机器学习感兴趣却不知道如何开始的人而写的. 我估计有很多人尝试过阅读维基百科上面关于机器学习的文章,结果越读越受挫,后面干脆直接放弃,同时希望有人能够给出一个高质量的解释,那太棒了,这篇文章就是在干这件事.

[推荐算法]ItemCF,基于物品的协同过滤算法 - 在路上的学习者 - CSDN博客

于08-21 05:58 - -
ItemCF:ItemCollaborationFilter,基于物品的协同过滤. 算法核心思想:给用户推荐那些和他们之前喜欢的物品相似的物品. 比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度.

Android内存泄漏思考 - 编程学习网

于08-20 08:19 - -
Android内存泄漏是一个经常要遇到的问题,程序在内存泄漏的时候很容易导致OOM的发生. 那么如何查找内存泄漏和避免内存泄漏就是需要知晓的一个问题,首先我们需要知道一些基础知识. 强引用: 强引用是Java中最普通的引用,随意创建一个对象然后在其他的地方引用一下,就是强引用,强引用的对象Java宁愿OOM也不会回收他.

吴恩达神秘新项目揭晓:迄今最全面的深度学习在线课程!

于08-08 16:24 - 光谱 - 公司 Andrew Ng Coursera deeplearning.ai 吴恩达
吴恩达 (Andrew Ng) 拥有多个令人仰慕的头衔:斯坦福机器学习教授、大规模开放在线课程 (MOOC) 早期提出人之一、Coursera 创始人、Google 大脑创始人、百度前首席科学家……. 在离开百度后,今年 6 月底,吴恩达已经将自己的新项目 deeplearning.ai 上线,网站颇为神秘,配有他本人的照片和一行字“探索人工智能的前沿”(Explore the frontier of AI).

颠覆传统的13条高效学习技巧

于07-30 15:35 - -
《如何学习》这本书是本月出版的,给这本书写过推荐语:. 读过很多学习方法的书籍,发现很多书籍中提到的方法或理论纯属主观臆断,能把每条建议背后的研究历史和科学原理阐述清晰的书籍极少,而这本书刚才符合要求. 书中提到的学习建议实用性和针对性都非常不错,只要做少许改变就能提升原有的学习效果和成绩. 期待阅读这本书之后,能让你对学习奥秘认知更近一步.

深度学习在美团点评推荐平台排序中的运用

于07-28 14:33 - 美团点评技术团队 -
美团点评作为国内最大的生活服务平台,业务种类涉及食、住、行、玩、乐等领域,致力于让大家吃得更好,活得更好,有数亿用户以及丰富的用户行为. 随着业务的飞速发展,美团点评的用户和商户数在快速增长. 在这样的背景下,通过对推荐算法的优化,可以更好的给用户提供感兴趣的内容,帮用户更快速方便的找到所求. 我们目标是根据用户的兴趣及行为,向用户推荐感兴趣的内容,打造一个高精准性、高丰富度且让用户感到欣喜的推荐系统.

[译] 理解机器学习技术

于07-28 00:00 - - dev
第1讲 理解机器学习技术. 学完本模块的内容,读者将能够:. 讨论机器学习的技术和商业应用. 学完本讲的内容,读者将能够:. 解释各类机器学习方法和算法. “机器学习领域的突破,其价值10倍于微软. 你是否曾经为计算机能够下象棋或者机器人能够完成复杂任务而感到惊奇. 一旦你理解了机器如何学习和适应各种问题、提供合适的解决方案时,这些看上去很复杂的问题实际上相当简单.

如何用深度学习做自然语言处理?这里有份最佳实践清单

于07-26 06:16 - 机器之心 -
对于如何使用深度学习进行自然语言处理,本文作者 Sebastian Ruder 给出了一份详细的最佳实践清单,不仅包括与大多数 NLP 任务相关的最佳实践,还有最常见任务的最佳实践,尤其是分类、序列标注、自然语言生成和神经机器翻译. 作者对最佳实践的选择很严格,只有被证明在至少两个独立的群体中有益的实践才会入选,并且每个最佳实践作者至少给出两个参引.

机器学习该如何入门

于07-25 10:43 - u013709270 -
  对于这个问题的解释,说实话我很有压力,因为在分享篇文章之前就有朋友告诉我,这个百度上一搜一大片,还需要你讲吗. 正如同一千个读者眼里有一千个林黛玉一样,我解释的当然是我个人自从读研到工作这么多年对机器学习的学习到应用过程的独特见解.   首先我们看下图了解一下机器学习在AI(Artificial Intelligence 人工智能)领域的地位.

寻觅了四年,我找到这六款真正能激励孩子持续自主学习的App

于07-25 14:57 - -
如果我的孩子能自己快乐地学习,我该多轻松啊. 为了这个梦想,我一直在努力尝试各种方式,让孩子爱上学习. 在过去的四年里,我尝试了数十个适合2岁半到6岁小朋友的App,试图找到最有效的一个. 人的时间是有限的,而小朋友更需要控制使用iPad的时间. 选择App的标准有两点:一是寓教于乐,孩子能够从玩中有所收获;二是能够让孩子持续感到有兴趣.

深度学习二三事

于11-30 00:00 - 饭团君 - 专栏 深度学习
我知道博客标题中使用否定词很奇怪,但是前几天有一波讨论正好相应于我正在思考的一些问题. 这一切开始于 Jeff Leek 发表的 一篇有关说明在小样本范围内使用深度学习的文章. 要言之,他认为当样本较小时(生物领域中属于常见现象),带有少许参数的线性模型甚至比带有少量层和隐藏单元的深度网络性能更优.

Google 开源机器学习数据集可视化工具 Facets

于07-18 09:10 - - 综合新闻
ML 数据集可以包含数亿个数据点,每个数据点由数百(甚至数千)的特征组成,几乎不可能以直观的方式了解整个数据集. 为帮助理解、分析和调试 ML 数据集,谷歌开源了 Facets,一款可视化工具. Facets 包含两个部分 —— Facets Overview 和 Facets Dive ,允许用户以不同的粒度查看其数据的整体图像.

深度学习利器:TensorFlow实战

于07-17 09:03 - - 机器学习
深度学习及TensorFlow简介. 深度学习目前已经被应用到图像识别,语音识别,自然语言处理,机器翻译等场景并取得了很好的行业应用效果. 至今已有数种深度学习框架,如TensorFlow、Caffe、Theano、Torch、MXNet,这些框架都能够支持深度神经网络、卷积神经网络、深度信念网络和递归神经网络等模型.