传说中的新版Google翻译到底有多厉害?

标签: 酷玩 Google Google翻译 NLP 机器学习 | 发表时间:2015-01-14 00:50 | 作者:光谱
出处:http://www.pingwest.com

上周末, 纽约时报的一篇有关于语言翻译技术进步的报道,让许多人为科技发展的速度之快所震撼:该报道指出, Google多年没有过大变化的翻译(Google Translate)服务,即将迎来一次大功能更新,将可以聆听并识别用户所讲的语言,然后几乎实时地将语音翻译为目标语言的文字。这个功能听上去十分强大,看起来Google的自然语言处理技术已经发展的足够好,估计可以让不少翻译和同声传译员工丢掉工作了。

Google翻译是目前全世界最多人使用的翻译产品,支持90种语言之间的互相翻译,包括了阿拉伯语、英语、法语、德语、汉语、西班牙语等在内的所有热门语种。纽约时报的报道显示,web、iOS和Android等各平台上的月活跃用户已经超过了5亿,仅Android版Google翻译应用的下载安装量(这是一款非预装应用)就已经高达1亿。

在机器翻译的领域内主要由三种大层面上的翻译技术门类,分别为“基于规则”(rule-based)、“基于统计”(statistical-based)和混合。其中,Google属于“基于统计”,可以通过用户直接搜索的翻译结果、对网页内容的抓取翻译等多种不同的渠道获取大量的语料资源用于深度学习,从而逐渐获得一种明白两种语言的文字之间如何匹配的能力,并且将这种能力作为服务提供给用户。

显然,这次Google翻译的服务水平又上了一个等级。如果你把你已经安装了Google翻译的手机看做是一个人的话,其实ta已经变成一个翻译效率相当高的电子翻译官了。不过,Google翻译给很多人的印象之前一直不怎么好,比如那些出现在交通标志上、超市甚至厕所里的令人啼笑皆非的翻译,就经常被吐槽为“Google机翻”的结果。人们不由得感叹:Google这么厉害的一家公司,连个机翻都搞不好吗?

fuckgood

一位前Google翻译团队科学家告诉 PingWest品玩,Google这个即将发布的新版翻译产品,其背后所需要的研发远比想象的复杂。

过去的Google翻译的功能背后的主要技术是机器翻译(Machine Translation),后来随着Android以及iOS操作系统功能的进步,在移动端支持了语音输入,这又引入了语音识别(Speech Recognition)。“机器翻译和语音识别从技术层面上是单独的产品,背后都会用到很多自然语言处理(Natural Language Processing,NLP),‘深度学习’的基本技术。”这位专家表示。

专家认为,从目前媒体报道和行业了解的信息来看,新的Google翻译是一个将机器翻译和语音识别整合起来的产品,“从技术层面,Google应该早就有能力推出这种功能了(编者注:指语音识别并实时翻译),但是拖到现在才出来,可能会有一些其他的考虑。总的来说,两大技术集成起来需要做大量的优化,而不是简单地拼凑起来。”

也即意味着,新版Google翻译是Google的机器翻译技术和语音识别技术进行了系统性的整合之后投产的结果,将能够代表Google在自然语言处理方面的深度学习所取得的进展,以及其商业化能力。前述的前Google科学家指出,Google的翻译技术在他在职期间(两年前)就已经处在业界领先水平。而这两年以来Google在深度学习方面的进展一直十分突出,因此有理由(比较稳妥地)相信,Google基于深度学习提供的翻译服务,其背后的技术依然可以代表业界的最高水准。

当然,人们对于Google翻译的技术到底有多厉害可能并没有多少感知——他们能够感知到的,其实是不要把干货翻译成f**k good就好。

相关阅读:

     移动应用开发者的末世之舞

     4个月,从Google的Moto到联想的Moto

     【第2编辑室】世界上最遥远的距离

     在Gmail越来越“难用”的表象下,Google在中国的动作远比外界看到的要多

关注 PingWest 微信

相关 [传说 google 翻译] 推荐:

传说中的新版Google翻译到底有多厉害?

- - PingWest品玩
上周末, 纽约时报的一篇有关于语言翻译技术进步的报道,让许多人为科技发展的速度之快所震撼:该报道指出, Google多年没有过大变化的翻译(Google Translate)服务,即将迎来一次大功能更新,将可以聆听并识别用户所讲的语言,然后几乎实时地将语音翻译为目标语言的文字. 这个功能听上去十分强大,看起来Google的自然语言处理技术已经发展的足够好,估计可以让不少翻译和同声传译员工丢掉工作了.

Google翻译的内涵

- hahahaha哈 - 大家都是中国人
非PS图,可以自行前往http://translate.google.com/验证.

用安卓的Google翻译来聊天

- 安得米 - 谷奥——探寻谷歌的奥秘
在移动技术及网络的帮助下人们能够更轻松地获取想要的信息及和其他人沟通,但是语言不通成了一个很大的障碍. Google就一直在努力解决这个问题,希望大家能更轻松地交流沟通. 今年年初,Google在安卓版的Google翻译上添加了一个叫对话模式的实验版功能,它能让你将对话在不同语言之间来回转换. 最初只有英语和西班牙语,但从今天起它将开始支持14种语言,包括巴西葡萄牙语,捷克语,荷兰语,法语,德语,意大利语,日语,朝鲜语,国语(普通话),波兰语,俄语和土耳其语.

Google 发布 JavaScript 到 Dart 翻译器

- - 谷奥——探寻谷歌的奥秘
由于嫌JavaScript太烂,所以 Google之前发布了自己的Dart语言. 这个新的平台可适合开发简单、高效而具有可扩展的网页应用,整合了强大的全新的编程特色,但却同时具备你熟悉的语言语法结构. 今天Google则发布了 JavaScript 到 Dart 翻译器,这个应用可以告诉你Javascript和jQuery的变量、函数、类库、DOM操作、数组等等,转换成Dart版本之后语法应该怎么写.

Google Chrome扩展开发指南全部翻译工作完成

- beralee - cnBeta.COM
感谢金山说下次我们翻译啥?的投递. 360极速浏览器一批工程师用业余时间完成了Chrome extension developer's guide全部翻译工作,放在360极速浏览器应用开放平台的开发文档里供大家参考学习.

Google Translate 增加拼音显示和翻译评分

- Mr. Snail - 谷奥——探寻谷歌的奥秘
感谢读者 字符映射表 和 52Dora-陈志勇 的爆料. 最近Google Translate又多了两个小功能:拼音显示和翻译评分. 当翻译成简体中文或正体中文的时候,可点击“显示对于的拉丁字符的拼音”来了解到如何读音(不过其实Google不是可以帮你朗读吗. 然后不管翻译成哪国语言,都可对翻译结果进行评分,有三个级别可选──通过人肉评分,Google Translate可以依靠大家的力量提升翻译质量,而且可以防止那些故意误导Google让它翻译错的恶搞之人.

Google Maps 允许自由切换地名翻译图层

- SotongDJ - 谷奥——探寻谷歌的奥秘
Google Maps在去年就开始为地名进行国家化处理,但也因此闹了不少笑话,好在后来允许恢复了,现在Google只会为部分拥有官方译名的地址进行翻译. 不过最近Google Maps也做出了一些改变,以前只要是有官方翻译名的地址,会同时给你显示出当地语言的地名和翻译成你使用语音的地名. 现在Google Maps允许你自由切换地名的翻译图层了,你可以同时显示两种语言的地名(如上图,如果那个地名已经有被翻译的话),也可以只显示当地的语言(如下图).

Google改进语音翻译与Siri竞争

- lin - Solidot
Shawn the R0ck 写道 "Google翻译Android版是Google机器翻译软件的移动版,Google宣称现在可以在14门语言之间来回翻译. 在今年的早些时候Google加入了对话模式,即帮助用户在英文和西班牙语之间同声传译. 现在Google让新的翻译软件能运行在Android 2.2上和新增加了巴西葡萄牙语,捷克语,法语,德语,意大利语,日语,韩语,中文普通话,波兰语,俄语,土耳其语的语言翻译.

Google 翻译,梦想与现实的距离有多远

- Pancho Tsui - 月光博客
  在信息纷繁如大洋般浩浩的互联网时代,操持各自语言的人们汇聚网络,言之纷纷,书之不息,各类信息无时不发,无处不在……不论是经典著述、长篇大论,抑或巧思短文、灵感的火花……似乎,互联网承载和传播了这个星球上人类的所有智慧. 然而,一个简单的事实让信息携带智慧流通全球还依然只是一个梦想——即:不同语言之间无法直接沟通.

【翻译】使用Sencha Touch开发Google Glass应用程序

- - CSDN博客推荐文章
原文: Developing for Google Glass with Sencha Touch. 作者:Ross Gerbasi. He specializes in new and emerging media including video and graphics production and has contributed to the open source community on emerging interactive solutions.