更新于:10-15 14:13

最新推荐

开源数据平台Kafka落选!InfoWorld最佳开源数据平台奖公布

于10-15 16:27 - -
AI前线导读:一年一度由世界知名科技媒体InfoWorld评选的Bossie Awards于9月26日公布,本次Bossie Awards评选出了最佳数据库与数据分析平台奖、最佳软件开发工具奖、最佳机器学习项目奖等多个奖项. 在最佳开源数据库与数据分析平台奖中,Spark和Beam再次入选,连续两年入选的Kafka这次意外滑铁卢,取而代之的是新兴项目Pulsar;开源数据库入选的还有PingCAP的TiDB.

基于深度学习的智能问答-博客-云栖社区-阿里云

于10-15 13:48 - -
纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史. 但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应. 自此,自动问答系统较以往任何时候都显得离实际应用更近. 这一方面归功于机器学习与自然语言处理技术的长足进步,另一方面得益于维基百科等大规模知识库以及海量网络信息的出现.

你是怎么变自律的? - 知乎

于10-14 23:01 - -
有的时候,我们明知道某些东西在长远来说对我们是有益的,. 自律确实是很难的,是一种需要长时间训练自己、刻意要求自己才能得到的品质. 然而,这并不是说我们完全做不到. 在学会自律的办法之前,我们首先要明白自律的意义. 有一个心理学上的实验,也许能够让我们更明白自律到底包含了什么能力. 棉花糖实验(The Marshmallow Study).

图像鉴黄做得好,健康上网少烦恼

于10-14 12:40 - 机器之心 -
根据中国互联网络信息中心发布第 42 次《中国互联网络发展状况统计报告》,截至 2018 年 6 月底,中国网民数量已达 8.02 亿. 平均每周上网 27.7 小时,出去每周睡眠时间(以 8 小时 / 天为例),现代人每天有近 1/4 的时间在拥抱网络. 随着科技的发展进步,互联网也成为人们日常生活和工作中离不开的工具,它在给人们带来生活方便、处理事务高效的同时,也会成为一些不法分子的有利工具,利用其传播和散延一些不良信息,如黄色图片、影视等,涉黄案件接踵而来,由此一来,「打黄」也显得尤为重要.

基于 TensorFlow Serving 的深度学习在线预估

于10-13 00:00 - - dev
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

NLP历史突破!谷歌BERT模型狂破11项纪录,全面超越人类!

于10-13 17:29 - -
来源:新智元(AI_era). (来源:arXiv、知乎;编辑:新智元编辑部). 今天,NLP 领域取得最重大突破. 谷歌 AI 团队新发布的 BERT 模型,在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且还在 11 种不同 NLP 测试中创出最佳成绩.

如何快速读Paper – ThoughtWorks洞见

于10-13 15:20 - -
去哪里找paper之后,大家问我的问题就常常变成了:. 如何快速阅读一篇paper并准确的提取其中有用的信息. 在本文中,我将试图为大家简要解答这个问题,争取告诉大家如何在短时间内通过阅读文献的方式了解一个新的领域. 阅读一篇paper通常见的目的有四种:. 面对一个新的领域,我要快速把握这个领域的研究方向和state-of-the-art方法,来给自己或者团队设计一个大致的技术方案.

关于机器学习,你应该知道的 3 个热门专业术语

于10-13 00:00 - - dev
编者按:如果你是刚入门机器学习的AI探索者,你知道什么是胶囊网络吗. 为了帮大家节省查阅晦涩难懂的论文的时间,我们邀请微软亚洲研究院机器学习组实习生吴郦军、罗人千帮大家用最通俗的语言解释了这三个机器学习领域的热门词汇,赶紧收藏吧. 胶囊网络Capsule Networks 胶囊网络(Capsule Networks)是深度学习三巨头之一的Geoffrey Hinton提出的一种全新的神经网络.

在微服务领域Spring Boot自动伸缩如何实现

于10-13 00:00 - - tuicool
自动伸缩是每个人都想要的,尤其是在微服务领域. 让我们看看如何在基于Spring Boot的应用程序中实现. 我们决定使用 Kubernetes、 Pivotal Cloud Foundry或 HashiCorp's Nomad等工具的一个更重要的原因是为了让系统可以自动伸缩. 当然,这些工具也提供了许多其他有用的功能,在这里,我们只是用它们来实现系统的自动伸缩.

[分享创造] 可能是 iOS 上最好用的电视直播软件

于10-13 05:50 - conchplayer -
因为平时喜欢看电视,在 app store 上又找不到适合的,就想着自己造个轮子,临时抱佛脚学了三天 iOS 开发,写了个 app. 1.自己添加管理 m3u8 直播源,这个没什么好说的,适合动手能力强的. 2.订阅列表,订阅后,只要负责维护列表的大神列表更新,用户的列表就会自动更新. 目前我自己维护了 4 个列表,加起来频道大概六七十个.

建立一个高可用的MQTT物联网集群How to Build an High Availability MQTT Cluster for the Internet of Things

于10-12 18:01 - -
建立一个高可用的MQTT物联网集群. We were searching for a secure (auth based), customisable (communicating with our REST API) and easy to use solution (we knew Node.js).

Fast Near-Duplicate Image Search using Locality Sensitive Hashing

于10-12 17:57 - -
使用LSH快速搜索相似图片,使用LSH的ANN查询按如下方式执行:1)查找查询项的“桶”(哈希值)2)与桶中的每个其他项进行比较. Locality Sensitive Hashing(LSH)是一种有用的工具,即使对于非常大的数据集也可以很好地扩展执行近似最近邻居查询. 深度学习的时代为我们复活了在向量上相似的图像,文本和音频(简单的欧几里得距离)在原始语义内容上也相似(图像的VGG特征向量,文本的Word2Vec).

tensorflow提取VGG特征 - weixin_38208741的博客 - CSDN博客

于10-12 15:34 - -
vgg-16一种深度卷积神经网络模型,16表示其深度. 模型可以达到92.7%的测试准确度. 它的数据集包括1400万张图像,1000个类别. 一个简单的演示,提取VGG的pool5层特征,存储为.mat文件. 在我们的实际项目中,一般不会直接从第一层直接开始训练,而是通过在大的数据集上(如ImageNet)训练好的模型,把前面那些层的参数固定,在运用到我们新的问题上,修改最后一到两层,用自己的数据去微调(finetuning),一般效果也很好.

ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构

于10-12 15:10 - -
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110). 卷积神经网络在视觉识别任务上的表现令人称奇. 好的CNN网络是带有上百万参数和许多隐含层的“庞然怪物”. 事实上,一个不好的经验规则是:网络越深,效果越好. AlexNet,VGG,Inception和ResNet是最近一些流行的CNN网络.

图像处理之特征提取 - 简书

于10-12 15:03 - -
目前火热的 Deep Learning 会灭绝传统的 SIFT / SURF 特征提取方法吗. 由于之前研究过SIFT和HOG这两种传统的特征提取方法,故本篇文章先对SIFT和HOG作一综述,并比较二者优缺点. 之后,将SIFT和HOG同神经网络特征提取做一对比,浅谈对上述问题的看法. 如果能写得快一些,再简单介绍其他几种传统的特征提取的方法——SURF、ORB、LBP、HAAR等等.

faiss相似性搜索和向量聚类库 faiss: A library for efficient similarity search and clustering of dense vectors.

于10-12 11:31 - -
Faiss是一个有效的相似性搜索和密集向量聚类的库. 它包含搜索任意大小的向量集的算法,包括不适合放入RAM的数据集. 它还包含用于评估和参数调整的支持代码. Faiss是用C ++编写的,包含Python / numpy的完整包装. 一些最有用的算法是在GPU上实现的. 它由 Facebook AI Research开发.

特征向量内存快速查找库 GitHub - spotify/annoy: Approximate Nearest Neighbors in C++/Python optimized for memory usage and loading/saving to disk

于10-12 11:20 - -
还有一些其他库可以进行最近邻搜索. Annoy几乎和最快的库一样快(见下文),但实际上还有另一个功能让Annoy与众不同:它能够将静态文件用作索引. 特别是,这意味着您可以跨进程共享索引. Annoy还将创建索引与加载它们分离,因此您可以将索引作为文件传递并快速映射到内存中. Annoy的另一个好处是它试图最小化内存占用,因此索引非常小.

facebook-faiss库 - YiLiang - CSDN博客

于10-12 10:59 - -
三月初,Facebook AI Research(FAIR)开源了一个名为 Faiss 的库,Faiss 主要用于有效的相似性搜索(Similarity Search)和稠密矢量聚类(Clustering of dense vectors),包含了在任何大小的矢量集合里进行搜索的算法. Faiss 上矢量集合的大小甚至可以大到装不进 RAM.

[译] 谷歌团队的容器运维最佳实践

于10-11 08:00 - -
谷歌大神们带你进行容器运维最佳实践. 本文介绍了一组使容器更易于运维的最佳实践. 这些实践涉及安全性、监控和日志记录等广泛的主题,旨在使应用程序更容易在 Kubernetes Engine 和一般的容器中运行. 这里讨论的许多实践都受到 12 因素方法的启发 ,12 因素方法是一个构建云原生应用程序的优质资源.

基于电影知识图谱的智能问答系统(八) -- 终极完结篇 - Appleyk的专栏 - CSDN博客

于10-11 22:30 - -
基于电影知识图谱的智能问答系统系列章节传送门:. 基于电影知识图谱的智能问答系统(一) -- Mysql数据准备. 基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件. 基于电影知识图谱的智能问答系统(三) -- Spark环境搭建. 基于电影知识图谱的智能问答系统(四) -- HanLP分词器.

好未来励步英语发布3.0完整学习产品,推出AI智能学习机器人

于10-11 17:06 - - 业界
雷锋网消息,10月10日,好未来旗下英语品牌励步英语在北京举行“用ai驱动完整学习——励步英语新十年•新产品发布会”. 会上,励步英语正式推出3.0完整学习产品,提出“用ai驱动完整学习”的理念. 发布3.0完整学习产品,形成线上+线下学习闭环. 雷锋网注:励步英语总经理曹伟. 励步英语总经理曹伟在题为“励步新十年,用ai驱动”的演讲中介绍了励步3.0教育公式:(有爱的老师+有爱的内容)*科技智能=孩子完整的学习体验.

基于TensorFlow Serving的深度学习在线预估

于10-11 21:30 - 美团点评技术团队 -
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

人脸识别模型和源代码 Welcome to Yu Qiao's homepage!

于10-11 21:16 - -

Python 3 利用 Dlib 实现摄像头实时人脸识别 - coneypo - 博客园

于10-10 09:11 - -
  利用 Python 开发,借助 Dlib 库捕获摄像头中的人脸,提取人脸特征,通过计算特征值之间的欧氏距离,来和预存的人脸特征进行对比,判断是否匹配,达到人脸识别的目的;.   可以从摄像头中抠取人脸图片存储到本地,然后提取构建预设人脸特征;.   根据抠取的 / 已有的同一个人多张人脸图片提取 128D 特征值,然后计算该人的 128D 特征均值;.

使用 Spark, LSH 和 TensorFlow 检测图片相似性 | 雷锋网

于10-10 08:53 - -
雷锋网(公众号:雷锋网)按:本文为 AI 研习社编译的技术博客,原标题 Detecting image similarity using Spark, LSH and TensorFlow,作者为 Andrey Gusev(Pinterest 工程师,内容质量分析师). 翻译 | 沈波  张天航    校对 |  余杭    整理 |  凡江.

使用dlib中的深度残差网络(ResNet)实现实时人脸识别 - supersayajin - 博客园

于10-09 11:05 - -
opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好,本文使用dlib中提供的人脸检测方法(使用HOG特征或卷积神经网方法),并使用提供的深度残差网络(ResNet)实现实时人脸识别,不过本文的目的不是构建深度残差网络,而是利用已经训练好的模型进行实时人脸识别,实时性要求一秒钟达到10帧以上的速率,并且保证不错的精度.

App Store Top 1000 关键词分析

于10-08 09:20 - 标点符 - 网络营销 应用市场
做这个分析的主要目的是分析用户的搜索习惯及用户的需求方向,寻找可能的机会. 以下分析是7月初进行的,数据比较老,供参考. 在Top 1000的关键词中,82% 是品牌词,足见品牌(口碑)对应App的下载量还是非常的重要. 而另外18%的非品牌词也展现了一些打造品牌的机会(用户在该品类下还没有产生思维定势,新的App还存在一定的机会),以下为另外18%的非品牌关键词:.

深入浅出人脸识别原理 · Martin's Blog

于10-08 11:12 - -
Iphone X发布,革命性的取消了. TouchID(指纹识别),而添加了更酷的. FaceID(人脸识别)模块,. FaceID不简单的运用在解锁上,还可以在支付,表情等场景中应用,给开发者带来更酷更丰富的应用,. Iphone X在多个硬件传感器的加持下,可以采集3万个点来感知用户的面部特征.

faceai: 一款入门级的人脸、视频、文字检测以及识别的项目.

于10-08 10:29 - -
人脸检测、识别(图片、视频). 数字化妆(画口红、眉毛、眼睛等). 表情识别(生气、厌恶、恐惧、开心、难过、惊喜、平静等七种情绪). Tesseract OCR文字识别. 图片人脸检测(OpenCV版). 图片人脸检测(Dlib版). 视频人脸检测(OpenCV版). 视频人脸检测(Dlib版). Ubuntu apt-get和pip源更换.

墙裂推荐:中国改革四君子朱嘉明最新区块链演讲

于10-07 18:45 - 《商业不靠谱》编辑 - 区块链 大师智慧
导读:朱嘉明老师是中国改革四君子(王岐山、朱嘉明、黄江南、翁永曦)之一,著名经济学家. 朱嘉明老师是区块链思想的积极支持者和布道者,对全球金融和经济趋势颇有远见,正是这位老师在5年前给一本叫《比特币》的书作序时,其所作的预言,都在2017年、2018年得到了印证,真得感謝这位预言者所作的探索与研究.