更新于:10-17 23:48

最新推荐

Redis基础、高级特性与性能调优

于10-16 15:52 - (●'◡'●) - IT技术 Redis
本文将从Redis的基本特性入手,通过讲述Redis的数据结构和主要命令对Redis的基本能力进行直观介绍. 之后概览Redis提供的高级能力,并在部署、维护、性能调优等多个方面进行更深入的介绍和指导. 本文适合使用Redis的普通开发人员,以及对Redis进行选型、架构设计和性能调优的架构设计人员.

人人恐惧AI寒冬,他却希望泡沫再破裂一次

于10-17 07:16 - -
AI应用落地,核心是工程问题,不是算法问题,更不是“哲学”问题. 一定要特别特别“土”,踏踏实实从朴素的运维、数据库、数据清洗做起,从实际的工程中逐步演化. 只有扎扎实实从工程出发,才能实事求是地发展出低成本的、有生命力的AI系统. 都是扎扎实实的工程,多年细节的打磨才能解决一点小事. 也从来没有一个所谓的伟大的想法,能跳过工程的考验就成功的.

seq2seq 模型实现聊天机器人

于01-03 01:18 - Jack - EasyApps Chatbot Easybot Python seq2seq
这是一个用Python+Tensorflow实现的聊天机器人程序,使用seq2seq模型训练. 示例所用训练数据集是IMDB600多部电影中的英文台词对话部分,训练时间为3天左右(2012款MacBook Pro i7),目前仅支持英文. 另外程序包含一个简单的Python+Flask WebUI,并实现了微信公众号对接功能.

Python日志库logging总结

于10-16 00:00 - - tuicool
在部署项目时,不可能直接将所有的信息都输出到控制台中,我们可以将这些信息记录到日志文件中,这样不仅方便我们查看程序运行时的情况,也可以在项目出现故障时根据运行时产生的日志快速定位问题出现的位置. Python 标准库 logging 用作记录日志,默认分为六种日志级别(括号为级别对应的数值),NOTSET(0)、DEBUG(10)、INFO(20)、WARNING(30)、ERROR(40)、CRITICAL(50).

Adrian小哥教程:如何使用Tesseract和OpenCV执行OCR和文本识别

于10-16 00:29 - 机器之心 -
近期,Adrian Rosebrock 发布一篇教程,介绍了如何使用 OpenCV、Python 和 Tesseract 执行文本检测和文本识别. 从安装软件和环境、项目流程、review 代码、实验结果,到展示局限、提出建议,这篇教程可以说十分详细了. 机器之心对该教程进行了摘要编译介绍. 本教程将介绍如何使用 OpenCV OCR.

开源数据平台Kafka落选!InfoWorld最佳开源数据平台奖公布

于10-15 16:27 - -
AI前线导读:一年一度由世界知名科技媒体InfoWorld评选的Bossie Awards于9月26日公布,本次Bossie Awards评选出了最佳数据库与数据分析平台奖、最佳软件开发工具奖、最佳机器学习项目奖等多个奖项. 在最佳开源数据库与数据分析平台奖中,Spark和Beam再次入选,连续两年入选的Kafka这次意外滑铁卢,取而代之的是新兴项目Pulsar;开源数据库入选的还有PingCAP的TiDB.

基于深度学习的智能问答-博客-云栖社区-阿里云

于10-15 13:48 - -
纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史. 但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应. 自此,自动问答系统较以往任何时候都显得离实际应用更近. 这一方面归功于机器学习与自然语言处理技术的长足进步,另一方面得益于维基百科等大规模知识库以及海量网络信息的出现.

你是怎么变自律的? - 知乎

于10-14 23:01 - -
有的时候,我们明知道某些东西在长远来说对我们是有益的,. 自律确实是很难的,是一种需要长时间训练自己、刻意要求自己才能得到的品质. 然而,这并不是说我们完全做不到. 在学会自律的办法之前,我们首先要明白自律的意义. 有一个心理学上的实验,也许能够让我们更明白自律到底包含了什么能力. 棉花糖实验(The Marshmallow Study).

图像鉴黄做得好,健康上网少烦恼

于10-14 12:40 - 机器之心 -
根据中国互联网络信息中心发布第 42 次《中国互联网络发展状况统计报告》,截至 2018 年 6 月底,中国网民数量已达 8.02 亿. 平均每周上网 27.7 小时,出去每周睡眠时间(以 8 小时 / 天为例),现代人每天有近 1/4 的时间在拥抱网络. 随着科技的发展进步,互联网也成为人们日常生活和工作中离不开的工具,它在给人们带来生活方便、处理事务高效的同时,也会成为一些不法分子的有利工具,利用其传播和散延一些不良信息,如黄色图片、影视等,涉黄案件接踵而来,由此一来,「打黄」也显得尤为重要.

基于 TensorFlow Serving 的深度学习在线预估

于10-13 00:00 - - dev
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

NLP历史突破!谷歌BERT模型狂破11项纪录,全面超越人类!

于10-13 17:29 - -
来源:新智元(AI_era). (来源:arXiv、知乎;编辑:新智元编辑部). 今天,NLP 领域取得最重大突破. 谷歌 AI 团队新发布的 BERT 模型,在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且还在 11 种不同 NLP 测试中创出最佳成绩.

如何快速读Paper – ThoughtWorks洞见

于10-13 15:20 - -
去哪里找paper之后,大家问我的问题就常常变成了:. 如何快速阅读一篇paper并准确的提取其中有用的信息. 在本文中,我将试图为大家简要解答这个问题,争取告诉大家如何在短时间内通过阅读文献的方式了解一个新的领域. 阅读一篇paper通常见的目的有四种:. 面对一个新的领域,我要快速把握这个领域的研究方向和state-of-the-art方法,来给自己或者团队设计一个大致的技术方案.

关于机器学习,你应该知道的 3 个热门专业术语

于10-13 00:00 - - dev
编者按:如果你是刚入门机器学习的AI探索者,你知道什么是胶囊网络吗. 为了帮大家节省查阅晦涩难懂的论文的时间,我们邀请微软亚洲研究院机器学习组实习生吴郦军、罗人千帮大家用最通俗的语言解释了这三个机器学习领域的热门词汇,赶紧收藏吧. 胶囊网络Capsule Networks 胶囊网络(Capsule Networks)是深度学习三巨头之一的Geoffrey Hinton提出的一种全新的神经网络.

在微服务领域Spring Boot自动伸缩如何实现

于10-13 00:00 - - tuicool
自动伸缩是每个人都想要的,尤其是在微服务领域. 让我们看看如何在基于Spring Boot的应用程序中实现. 我们决定使用 Kubernetes、 Pivotal Cloud Foundry或 HashiCorp's Nomad等工具的一个更重要的原因是为了让系统可以自动伸缩. 当然,这些工具也提供了许多其他有用的功能,在这里,我们只是用它们来实现系统的自动伸缩.

[分享创造] 可能是 iOS 上最好用的电视直播软件

于10-13 05:50 - conchplayer -
因为平时喜欢看电视,在 app store 上又找不到适合的,就想着自己造个轮子,临时抱佛脚学了三天 iOS 开发,写了个 app. 1.自己添加管理 m3u8 直播源,这个没什么好说的,适合动手能力强的. 2.订阅列表,订阅后,只要负责维护列表的大神列表更新,用户的列表就会自动更新. 目前我自己维护了 4 个列表,加起来频道大概六七十个.

建立一个高可用的MQTT物联网集群How to Build an High Availability MQTT Cluster for the Internet of Things

于10-12 18:01 - -
建立一个高可用的MQTT物联网集群. We were searching for a secure (auth based), customisable (communicating with our REST API) and easy to use solution (we knew Node.js).

Fast Near-Duplicate Image Search using Locality Sensitive Hashing

于10-12 17:57 - -
使用LSH快速搜索相似图片,使用LSH的ANN查询按如下方式执行:1)查找查询项的“桶”(哈希值)2)与桶中的每个其他项进行比较. Locality Sensitive Hashing(LSH)是一种有用的工具,即使对于非常大的数据集也可以很好地扩展执行近似最近邻居查询. 深度学习的时代为我们复活了在向量上相似的图像,文本和音频(简单的欧几里得距离)在原始语义内容上也相似(图像的VGG特征向量,文本的Word2Vec).

tensorflow提取VGG特征 - weixin_38208741的博客 - CSDN博客

于10-12 15:34 - -
vgg-16一种深度卷积神经网络模型,16表示其深度. 模型可以达到92.7%的测试准确度. 它的数据集包括1400万张图像,1000个类别. 一个简单的演示,提取VGG的pool5层特征,存储为.mat文件. 在我们的实际项目中,一般不会直接从第一层直接开始训练,而是通过在大的数据集上(如ImageNet)训练好的模型,把前面那些层的参数固定,在运用到我们新的问题上,修改最后一到两层,用自己的数据去微调(finetuning),一般效果也很好.

ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构

于10-12 15:10 - -
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110). 卷积神经网络在视觉识别任务上的表现令人称奇. 好的CNN网络是带有上百万参数和许多隐含层的“庞然怪物”. 事实上,一个不好的经验规则是:网络越深,效果越好. AlexNet,VGG,Inception和ResNet是最近一些流行的CNN网络.

图像处理之特征提取 - 简书

于10-12 15:03 - -
目前火热的 Deep Learning 会灭绝传统的 SIFT / SURF 特征提取方法吗. 由于之前研究过SIFT和HOG这两种传统的特征提取方法,故本篇文章先对SIFT和HOG作一综述,并比较二者优缺点. 之后,将SIFT和HOG同神经网络特征提取做一对比,浅谈对上述问题的看法. 如果能写得快一些,再简单介绍其他几种传统的特征提取的方法——SURF、ORB、LBP、HAAR等等.

faiss相似性搜索和向量聚类库 faiss: A library for efficient similarity search and clustering of dense vectors.

于10-12 11:31 - -
Faiss是一个有效的相似性搜索和密集向量聚类的库. 它包含搜索任意大小的向量集的算法,包括不适合放入RAM的数据集. 它还包含用于评估和参数调整的支持代码. Faiss是用C ++编写的,包含Python / numpy的完整包装. 一些最有用的算法是在GPU上实现的. 它由 Facebook AI Research开发.

特征向量内存快速查找库 GitHub - spotify/annoy: Approximate Nearest Neighbors in C++/Python optimized for memory usage and loading/saving to disk

于10-12 11:20 - -
还有一些其他库可以进行最近邻搜索. Annoy几乎和最快的库一样快(见下文),但实际上还有另一个功能让Annoy与众不同:它能够将静态文件用作索引. 特别是,这意味着您可以跨进程共享索引. Annoy还将创建索引与加载它们分离,因此您可以将索引作为文件传递并快速映射到内存中. Annoy的另一个好处是它试图最小化内存占用,因此索引非常小.

facebook-faiss库 - YiLiang - CSDN博客

于10-12 10:59 - -
三月初,Facebook AI Research(FAIR)开源了一个名为 Faiss 的库,Faiss 主要用于有效的相似性搜索(Similarity Search)和稠密矢量聚类(Clustering of dense vectors),包含了在任何大小的矢量集合里进行搜索的算法. Faiss 上矢量集合的大小甚至可以大到装不进 RAM.

[译] 谷歌团队的容器运维最佳实践

于10-11 08:00 - -
谷歌大神们带你进行容器运维最佳实践. 本文介绍了一组使容器更易于运维的最佳实践. 这些实践涉及安全性、监控和日志记录等广泛的主题,旨在使应用程序更容易在 Kubernetes Engine 和一般的容器中运行. 这里讨论的许多实践都受到 12 因素方法的启发 ,12 因素方法是一个构建云原生应用程序的优质资源.

基于电影知识图谱的智能问答系统(八) -- 终极完结篇 - Appleyk的专栏 - CSDN博客

于10-11 22:30 - -
基于电影知识图谱的智能问答系统系列章节传送门:. 基于电影知识图谱的智能问答系统(一) -- Mysql数据准备. 基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件. 基于电影知识图谱的智能问答系统(三) -- Spark环境搭建. 基于电影知识图谱的智能问答系统(四) -- HanLP分词器.

好未来励步英语发布3.0完整学习产品,推出AI智能学习机器人

于10-11 17:06 - - 业界
雷锋网消息,10月10日,好未来旗下英语品牌励步英语在北京举行“用ai驱动完整学习——励步英语新十年•新产品发布会”. 会上,励步英语正式推出3.0完整学习产品,提出“用ai驱动完整学习”的理念. 发布3.0完整学习产品,形成线上+线下学习闭环. 雷锋网注:励步英语总经理曹伟. 励步英语总经理曹伟在题为“励步新十年,用ai驱动”的演讲中介绍了励步3.0教育公式:(有爱的老师+有爱的内容)*科技智能=孩子完整的学习体验.

基于TensorFlow Serving的深度学习在线预估

于10-11 21:30 - 美团点评技术团队 -
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用. 而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍.

人脸识别模型和源代码 Welcome to Yu Qiao's homepage!

于10-11 21:16 - -

Python 3 利用 Dlib 实现摄像头实时人脸识别 - coneypo - 博客园

于10-10 09:11 - -
  利用 Python 开发,借助 Dlib 库捕获摄像头中的人脸,提取人脸特征,通过计算特征值之间的欧氏距离,来和预存的人脸特征进行对比,判断是否匹配,达到人脸识别的目的;.   可以从摄像头中抠取人脸图片存储到本地,然后提取构建预设人脸特征;.   根据抠取的 / 已有的同一个人多张人脸图片提取 128D 特征值,然后计算该人的 128D 特征均值;.

使用 Spark, LSH 和 TensorFlow 检测图片相似性 | 雷锋网

于10-10 08:53 - -
雷锋网(公众号:雷锋网)按:本文为 AI 研习社编译的技术博客,原标题 Detecting image similarity using Spark, LSH and TensorFlow,作者为 Andrey Gusev(Pinterest 工程师,内容质量分析师). 翻译 | 沈波  张天航    校对 |  余杭    整理 |  凡江.