为什么 Google 翻译只重算法不重语言学的语法结构和规则?

标签: google 翻译 算法 | 发表时间:2013-09-22 11:25 | 作者:知乎用户(登录查看详情)
出处:http://www.zhihu.com
啊,这是自然语言处理界争论了很久的问题了,所谓的理性主义(基于规则)和经验主义(基于统计)之争。

记得看过一本书上详细的讨论过这个问题,详情可以移步这篇文章: http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp

总结来说,基于统计的方法有如下好处,基于大量数据基础,有很好的鲁棒性,不需要真正理解语言就可以做出相当好的结果。由于人类语言的复杂性,去枚举一个语言的语法规则,是耗时费力的,以及鲁棒性比较差。

就机器翻译来说,现在的基于统计的平行文本技术已经能够产生很好的结果了,而且算法是独立于语言的。Google用一个通用的算法就可以在全世界各种语言中互相翻译,而不需要专门为每一种两两语言互译请专家来编写系统。试想,人工去为中译英制定规则,这需要考虑到词词对应,语法对应,以及考虑到上下文来解析词语的二义性,这很难依靠基于规则的方法来实现。

另注:平时接触到的当前自然语言处理系统中,真正由人编写规则已经是相当相当少见了,绝大多数都是基于大规模文本库训练出来的,根据概率论自动获取所需要的参数。而且我始终觉得自然语言处理的算法中,机器不是尝试去理解人类语言,而是去努力找出最符合人类语言习惯的答案。

再注:后来寻思了一下,似乎这所谓的两个主义之争,就只有在那本书上看过(有人提到过吴军博士的《数学之美》也提到过这个),其他地方也没记得提到过这个。我觉得吧,实际中,根本没有这种所谓上纲上线站队的,只是不同的研究团队会从不同的角度出发(当然现在基于统计的还是主流),对于同一个问题提出解决方案,反正很多问题都是有硬性的测试集评判标准的,欢迎各种方法,学术界百花齐放得乐呵呵呢。

— 完 —
本文作者: 知乎用户(登录查看详情)

【知乎日报——比新闻更多】听亲历者和内行专家八仙过海谈新闻,离现场更近一点。
下载知乎新 app - 知乎日报客户端(Android / iPhone 同步上架):
http://daily.zhihu.com/download

此问题还有 18 个回答,查看全部。
延伸阅读:
如何将 C 语言翻译成汇编语言?
如何理解 Objective-C 中的 strong 和 weak ?

相关 [google 翻译 算法] 推荐:

为什么 Google 翻译只重算法不重语言学的语法结构和规则?

- - 知乎每日精选
啊,这是自然语言处理界争论了很久的问题了,所谓的理性主义(基于规则)和经验主义(基于统计)之争. 记得看过一本书上详细的讨论过这个问题,详情可以移步这篇文章: http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp.

Google翻译的内涵

- hahahaha哈 - 大家都是中国人
非PS图,可以自行前往http://translate.google.com/验证.

用安卓的Google翻译来聊天

- 安得米 - 谷奥——探寻谷歌的奥秘
在移动技术及网络的帮助下人们能够更轻松地获取想要的信息及和其他人沟通,但是语言不通成了一个很大的障碍. Google就一直在努力解决这个问题,希望大家能更轻松地交流沟通. 今年年初,Google在安卓版的Google翻译上添加了一个叫对话模式的实验版功能,它能让你将对话在不同语言之间来回转换. 最初只有英语和西班牙语,但从今天起它将开始支持14种语言,包括巴西葡萄牙语,捷克语,荷兰语,法语,德语,意大利语,日语,朝鲜语,国语(普通话),波兰语,俄语和土耳其语.

Google 发布 JavaScript 到 Dart 翻译器

- - 谷奥——探寻谷歌的奥秘
由于嫌JavaScript太烂,所以 Google之前发布了自己的Dart语言. 这个新的平台可适合开发简单、高效而具有可扩展的网页应用,整合了强大的全新的编程特色,但却同时具备你熟悉的语言语法结构. 今天Google则发布了 JavaScript 到 Dart 翻译器,这个应用可以告诉你Javascript和jQuery的变量、函数、类库、DOM操作、数组等等,转换成Dart版本之后语法应该怎么写.

Google Chrome扩展开发指南全部翻译工作完成

- beralee - cnBeta.COM
感谢金山说下次我们翻译啥?的投递. 360极速浏览器一批工程师用业余时间完成了Chrome extension developer's guide全部翻译工作,放在360极速浏览器应用开放平台的开发文档里供大家参考学习.

Google Translate 增加拼音显示和翻译评分

- Mr. Snail - 谷奥——探寻谷歌的奥秘
感谢读者 字符映射表 和 52Dora-陈志勇 的爆料. 最近Google Translate又多了两个小功能:拼音显示和翻译评分. 当翻译成简体中文或正体中文的时候,可点击“显示对于的拉丁字符的拼音”来了解到如何读音(不过其实Google不是可以帮你朗读吗. 然后不管翻译成哪国语言,都可对翻译结果进行评分,有三个级别可选──通过人肉评分,Google Translate可以依靠大家的力量提升翻译质量,而且可以防止那些故意误导Google让它翻译错的恶搞之人.

Google Maps 允许自由切换地名翻译图层

- SotongDJ - 谷奥——探寻谷歌的奥秘
Google Maps在去年就开始为地名进行国家化处理,但也因此闹了不少笑话,好在后来允许恢复了,现在Google只会为部分拥有官方译名的地址进行翻译. 不过最近Google Maps也做出了一些改变,以前只要是有官方翻译名的地址,会同时给你显示出当地语言的地名和翻译成你使用语音的地名. 现在Google Maps允许你自由切换地名的翻译图层了,你可以同时显示两种语言的地名(如上图,如果那个地名已经有被翻译的话),也可以只显示当地的语言(如下图).

Google改进语音翻译与Siri竞争

- lin - Solidot
Shawn the R0ck 写道 "Google翻译Android版是Google机器翻译软件的移动版,Google宣称现在可以在14门语言之间来回翻译. 在今年的早些时候Google加入了对话模式,即帮助用户在英文和西班牙语之间同声传译. 现在Google让新的翻译软件能运行在Android 2.2上和新增加了巴西葡萄牙语,捷克语,法语,德语,意大利语,日语,韩语,中文普通话,波兰语,俄语,土耳其语的语言翻译.

Google 翻译,梦想与现实的距离有多远

- Pancho Tsui - 月光博客
  在信息纷繁如大洋般浩浩的互联网时代,操持各自语言的人们汇聚网络,言之纷纷,书之不息,各类信息无时不发,无处不在……不论是经典著述、长篇大论,抑或巧思短文、灵感的火花……似乎,互联网承载和传播了这个星球上人类的所有智慧. 然而,一个简单的事实让信息携带智慧流通全球还依然只是一个梦想——即:不同语言之间无法直接沟通.

【翻译】使用Sencha Touch开发Google Glass应用程序

- - CSDN博客推荐文章
原文: Developing for Google Glass with Sencha Touch. 作者:Ross Gerbasi. He specializes in new and emerging media including video and graphics production and has contributed to the open source community on emerging interactive solutions.