五大可识别图片的人工智能技术

标签: 图片 人工智能 技术 | 发表时间:2015-11-24 11:28 | 作者:
出处:http://www.iteye.com
很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题。

而如果让机器变得更聪明,仅仅处理文字显然是不够的。事实上,人类心智非常善于视觉处理。从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的本质特征。

不过直到最近,计算机都对图片束手无策。比如,除非人为添加一些标签和注释,否则机器就无法理解图片,图片也就是成了无用的文件。

但是,这种尴尬的情况正在发生变化。一大批能看懂图片的人工智能技术已经来到人间,下面不妨来看看机器之心的盘点:

谷歌 TensorFlow

5月份谷歌推出 Google Photos时,媒体关注的焦点是:人工智能和图片搜索结合后所产生的强大功能。谷歌声称(并且用户也很快确认),搜寻特定某人,你会找到对方从现在到婴儿时期的照片。搜索品种名,你就能找到相应品种狗的照片。把名字和食品类别结合起来,比如输入「最大披萨」,就能锁定特定图片。



这款应用发布之初,媒体无从得知谷歌究竟研发了多长时间。不过,一些搜索功能在Google+上出现一年多了。

两周前,谷歌以TensorFlow平台形式开源了它的人工智能主体部分。

尽管TensorFlow并不是第一个开源人工智能平台,但是,它是与谷歌强大图片搜索关系最为密切一个。

开源TensorFlow意味着,包括初创公司在内的其他公司,能够利用谷歌的这个开源平台,快速将人工智能和图片结合起来。尽管谷歌并未开放人工智能关键技术,包括在众多服务器上运行的能力。谷歌也没有开放让其如此强大的用户数据库。但是,谷歌的此举毫无疑问将刺激整个机器学习和人工智能创业生态的发展。

我们也期待着基于TensorFlow的各种震撼新应用能于明年进入市场。

Facebook Photo Magic

Facebook近期开始在Messenger应用上测试一项新功能——Facebook Photo Magic。这是一个可选应用,它会扫描手机相册照片并对它们进行面部识别处理。Photo Magic会识别照片中的人物(他们也是你的Facebook好友),建议你和他们一起分享这些照片。



毫无疑问,这项功能给Facebook带来了双重优势。首先,它鼓励用户更多在Messenger上分享。其次,它改善了识别。但是,仅仅这项便利功能是不够的,用户实际上可以赞成或拒绝在任意灯光条件、角度和其他参数条件下,Facebook使用人工智能对面部和名字进行匹配。Facebook人工智能掌握的照片越多,识别效果也越好。

令人吃惊的是,即使遮住了脸部,Facebook的「面部识别」一样能能识别出你的脸部。这个系统也关注发型、姿势、衣着和身材。(请注意,我们并不清楚Facebook是否已经实现了这种先进系统,但很明显的是,它从用户照片中收集数据。)

Facebook 的Photo Magic拓展了图片库来源,它不仅收集Facebook(社交网站),还收集Messenger(聊天应用)的数据,扩充了数据量。Photo Magic还鼓励赞成或否定匹配结果,提高数据质量。

很明显,Facebook最终目标是识别任意场景中的任何人,即使在看不清脸部的恶劣灯光条件下。毫无疑问,未来Facebook的人工智能会扫描和分析环境,发现可市场化的线索——比如,如果某人在照片里经常打棒球,广告商就可以利用这个信息锁定棒球迷,尽管他在上传照片的文字里并没有表露出这种兴趣。

毫无疑问,他们也打算通过观察图片中一起出现的人,进一步建立社交图谱。

微软牛津项目(Project Oxford)

微软日前也更新它的牛津项目,这是一个工具包,让开发者通过旗下的Azure云平台,使用微软的人工智能系统。

这个工具包支持人工智能各个方面的应用,包括口语,视频和其他媒体。但是,最震撼和最强大的功能莫过于牛津项目现在支持开发者通过牛津人脸应用平台接口项目( Project Oxford Face API)检测图片中的人物表情。



譬如,用牛津项目处理一张包含5个人的照片,识别照片中的脸以及每个人的表情——快乐,愤怒或恶心。

这项功能在新的高度,像人类一样「理解」图片质量。观看他人照片时,人们关注的最重要特征就是个人或群体的情感状况。

Pinterest Visual Search

Pinterest日前发布了全新的图片搜索功能,它能帮助用户发现更多的信息甚至帮助购买他们在固定照片里看到的产品。



首先,在 Pinterest的图片中选中任一物体(来回拖动一个盒状标识)。然后,搜索工具会找到具有相似图案和颜色的相似物,系统会将最匹配的结果链接到购买按钮上,点击这里就能购买该产品。

这个功能是以伯克利视觉和学习中心(Berkeley Vision and Learning Center)的深度学习人工智能为基础的。

这种照片人工智能应用可以说是万维网照片的雏形,在这个万维网中,每张图片中的每个物体都与等同物或者相似物、相关物彼此关联。

CloudSight

一家名为CamFind的图片识别和视觉搜索公司,今年推出了一个「云视觉」(CloudSight)的公共应用平台接口。



这个API支持开发者使用CamFind的人工智能分析图片内容。这样的扫描大多数情况下具有高度特定性,比如,能识别汽车的制造和模型,或者狗的品种以及食品的具体类型。一旦分析出图片中的物品,开发者就可以使用这些信息来获取网络上的文字信息。

Deepomatic

Deepomatic开发了一种服务型软件智能搜索引擎,它能识别图片中各种各样的数据。Deepomatic热衷时尚。它不仅匹配颜色,图案和其他数据,还能识别图片中的物品,并将它与一个全面的时尚产品数据库进行匹配。



Deepomatic网站声称,其技术模拟了人类大脑接收视觉信息的方式并用这种方式来理解各种概念。

远大前景

每当想到这样一个令人惊喜的新世界:能够理解照片内容的人工智能将无处不在,具有强大扩展潜力且唾手可得时,这些无限可能性就会令人叹为观止。

而且,这仅仅是一个开始。在绝大多数情况下,这项技术几乎都能通过API,开源程序或服务化处理得以应用实现,因此,我们已经站在了未来世界的入口:图像AI将和网络搜索一样普及,成为这个世界的一个基本特征。为了真正模拟人工智能,计算机必须有视觉,现在它们有了。

机器之心编译出品,参与成员:Sane、微胖

感谢 mengyidan1988 投递这篇资讯

资讯来源: 机器之心

已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [图片 人工智能 技术] 推荐:

五大可识别图片的人工智能技术

- - ITeye资讯频道
很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题. 而如果让机器变得更聪明,仅仅处理文字显然是不够的. 事实上,人类心智非常善于视觉处理. 从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的本质特征.

人工智能技术新进展

- - 生命奥秘
新的计算机人脑模型可以模拟更加复杂的人类行为. 人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作. 这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果.

利用人工智能检测色情图片 - CSDN博客

- -
色情内容在中国一直处于严格的监管,即使这样,互联网上还是很容易就能访问到色情内容. 还记得曾经的“绿坝-花季护航”软件么. 由于其识别效果差、软件不稳定,最后不了了之,浪费了大量的人力和金钱. 随着计算机视觉和深度学习的发展,算法已经成熟,利用人工智能,我们能够更加精确的识别色情内容. 现在有很多云服务商提供鉴黄服务,通过集成鉴黄API到产品中,就可以给产品增加色情过滤功能.

亚马逊将使用人工智能技术来总结用户评论

- - TechWeb 今日焦点 RSS阅读
【TechWeb】6月13日消息,据外媒报道,亚马逊将使用人工智能(AI)技术来总结用户评论,以快速概述消费者对特定产品的看法. 外媒称,这种创新方法不仅简化了购买过程,而且使客户对他们正在考虑的产品有了宝贵的了解,最终提高了整体客户体验. 不过,据外媒报道,AI生成的总结是基本的,并没有捕捉到评论中表达的全部意见.

微软对话语音识别技术达至人类专业水平,开启人工智能新征程

- - 微软亚洲研究院
一个月前,2016年9月14日,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率(word error rate, 简称WER) 低至6.3%的突破 ,创造当时该领域内错误率最低纪录. 一个月后,10月18日,微软进一步将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现:上周末,微软人工智能与研究部门的研究员和工程师在论文中展示了他们这一创纪录的语音识别系统.

凯文·凯利来华再谈人工智能,并预测未来 25 年的技术发展趋势

- - 雷锋网
近日,凯文·凯利在成都进行了一个名为《回到未来》的 主题演讲. 主要分享了对 AI 等前沿科技的看法. KK 提到:“要预测未来是非常困难的. 但是我们有我们的优势,因为技术都是有偏见的. 通过技术的物理的特性,我们能够预见、能了解未来技术会到哪里去,未来技术很长一段时间会是怎样……”. 以下是凯文·凯利的演讲内容:.

腾讯发布战略产品“智能云” 向外界开放人工智能技术平台

- - 穿过记忆的河流
腾讯发布战略产品“智能云” 向外界开放人工智能技术平台. 澎湃新闻2017-06-21 . 在BAT(百度、阿里巴巴、腾讯)互联网三巨头中,腾讯是最后一家向外界开放人工智能技术平台的公司. 6月21日,腾讯(00700.HK)旗下的云计算公司腾讯云在深圳举行腾讯云 未来峰会上,发布战略产品“智能云”,宣布开放腾讯在计算机视觉、智能语音识别、自然语言处理的三大核心能力.

Gartner发布物联网技术十大趋势,人工智能的最后一公里是边缘计算

- -
【新智元导读】边缘计算将为未来的百亿终端提供AI能力,形成万物感知、万物互联、 万物智能的智能世界,打通AI的最后一公里. 另外,“边缘将吃掉云”的趋势不断显现,具备设备、芯片和算法能力的企业将成为边缘智能的终极玩家. 11月7日,在巴塞罗那举行的研讨会和IT展览会上,IT研究兼市场分析机构Gartner宣布了它认为未来最重要的战略——物联网(IoT)的技术趋势.

由人工智能管理的港铁

- - Solidot
港铁公司运营香港地铁跻身全世界最出色地铁系统之列,它的准时抵达记录高达99.9%,超过了伦敦和纽约地铁. 数百公里长的繁忙地铁系统需要大量人力维护,港铁公司平均每周有多达1万人执行2600项维护工作,工人们工作都是提前规划好的,由人工智能进行管理. 港铁公司计划将人工智能推广到它在其它城市运营的地铁系统,其中北京有可能第一个采用.

[微言]人工智能有多可怕?

- - 海德沙龙(HeadSalon)
@whigzhou: 花了两个多小时思考强人工智能引出的问题,得出的结论是:相信陪审团. 然后发现,这不就是 我去年得出过的结论嘛~哈. 不过,其间经历的逻辑链条那是相当漫长,而且有了一些新想法,容我慢慢道来. @whigzhou: 1)强人工智能很快(也就是几十年内)会出现;2)强AI的出现会让世界很不一样,但并不像有些人所想象的#那么#不一样;3)其实,“只有一小撮人(或组织)有能力做一些绝大多数人做不到、甚至完全无法理解的事情”——这早就不是什么新鲜事了.