深度学习技术可以给你带来第三只眼
智能手机已经采用了多种技术,使得日常任务更易于完成。不知道自己该往哪走?打开谷歌地图或其他使用手机GPS传感器的导航应用。想尽快知道一个问题的答案?拿出手机问问谷歌或者Siri。
但是美国普渡大学一位教授认为,当前的技术只能做到这些。普渡大学研究员们正在研发一种技术,可以从根本上将智能手机转化成人的第三只眼睛。这项技术使用一种被称为深度学习(deep learning)的算法系统,使智能手机摄像头立即辨识它看到的物体。
普渡大学威尔顿生物医学工程院副教授尤金尼奥•库鲁尔塞罗(Eugenio Culurciello)参与了这个项目,他表示这项技术的运行将类似于电影《Her》中的场景。
“它可以使智能手机具备这种能力,”库鲁尔塞罗对Business Insider表示,并具体提到了这样一个场景,杰昆•菲尼克斯(Joaquin Phoenix)主演的人物拿出自己的手机,展示自己周围的世界。“这款手机可以像菲尼克斯一样看到周围,这正是我们努力的方向。”
库鲁尔塞罗表示,这项技术将更加深入地发掘现有的增强实境和文本计算潜力。例如,诺基亚城市万花筒(City Lens)应用可以利用智能手机摄像头的扩展功能,向你展示眼前是哪座建筑物、附近有哪些餐馆等信息。城市万花筒应用从诺基亚地图抓取信息,并将这些信息覆盖到周围环境的地图上。不过库鲁尔塞罗表示,普渡大学正在研究的这项技术不需要服务器通信,手机就可以理解看到的图像,就像人类一样。
这项技术将通过深度学习算法实现这一功能,它把图片分成多层来理解其内容。正如库鲁尔塞罗介绍说,这项技术可以用一个层级来认识照片中某人的眼睛,另一个层级用来认识鼻子,等等。
它的目的是使智能手机成为更加智能的虚拟助手,可以像人类自己一样清楚,甚至更加清楚地了解周围的环境。例如,如果你去商场寻找一双已经在网上看好的鞋,你的手机可能会为你指出正确的方向。如果你在商场里把手机拿出来,在你看到这双鞋之前,它就可以远距离地读取到鞋发出的信号。
另外,由于这项技术能够认识图片里的人和物体,因此它可以用于给图片添加标签。例如,如果你想找出去年秋天自己和好友在树下拍摄的一张照片,你只需在手机搜索框里输入“树”,而不必在数千张照片里到处寻找。
库鲁尔塞罗表示,到目前为止,这项技术应用于移动设备还有一些挑战,因需要强大的处理功能。不过普渡大学的这个研究团体表示,他们已经开发出相应的软件和硬件,可以在传统智能手机处理器里兼容深度学习算法。而且库鲁尔塞罗解释说,这项技术不会局限于智能手机,还可以应用于谷歌眼镜之类的可穿戴设备。
这种功能距离我们日常使用的移动设备已经不远。“通过恰当的合作伙伴关系,我们可以在一年内做到这一点。”库鲁尔塞罗说。他表示,研究人员目前正在与三星和索尼等设备生产商谈判,商讨潜在的合作事宜。