技术能否打破语言的障碍?Google显然认为答案是肯定的。在一位德国电脑科学家的领导下,该公司正在研制一款世界通用的翻译工具。微软和脸谱也在研究类似技术。

当科幻小说作家设想人类的未来时,总是有一些改进世界的点子反复出现。比如免费的用之不竭的能源、以光速旅行的宇宙飞船、还有能够翻译宇宙所有语言的迷你电脑。

网络巨头谷歌公司正试图将最后一个梦想变成现实,注册公司流程,负责这一项目的是一位来自德国西南部小乡村的电脑科学家。

41岁的弗朗兹·约瑟夫·奥克长期专注于一个目标:建造完美的翻译计算机,它是如此的低调、敏捷,“人们很容易忽略它的存在,只是听到有一个声音在对他/她耳语。这一装置能够瞬间翻译对话或是用任何语言写成的文本——— 比如网页内容。

奥克拥有计算机博士学位,他的论文主题是人工智能。美国国防部高级研究计划署(D A R PA )将他招募到加利福尼亚。2004年,奥克接到谷歌创始人之一拉里·佩奇的电话。他问奥克:你难道不想更上一层吗?于是奥克拥有了自己领导的部门——— 谷歌翻译。

大胆的未来幻想是谷歌的商业模式之一,从自动驾驶汽车,到延长寿命的研究,这家网络巨头涉猎了众多超前的领域。虽然迄今为止,谷歌翻译似乎并没有拿出多少成绩,这可能是因为奥克和他所领导的团队有着更大的野心:他们想要打破不同语言之间的壁垒。

这位德国科学家和他的团队已经取得了重大进展。谷歌翻译现在可以在71种语言之间来回翻译,比如将英语翻译为德语;将冰岛语翻译为日语,或是反过来。

只需要将需要翻译的文本粘贴到谷歌翻译页面的空白方框内,瞬间就可以将其翻译为目标语言。只需要点击一个按钮就可以将意大利语的网页翻译成德语或其他的69种语言。你还可以用智能手机将日本地铁站一个令人不解的标识牌拍摄下来,翻译工具可自动识别图片上的文字并翻译。

去年,谷歌翻译服务的使用次数达到2亿次。迄今为止,这一服务完全免费。但众多的跨国公司肯定会愿意花钱购买自动翻译服务;在未来,随着机器翻译质量的提高,谷歌随时可以开始收费。

现在,公司的目标还只是完善这一服务,并将它引入智能手机。翻译小组已经开发出一款应用程序,它可将智能手机变成一款会说话的翻译机器,迄今为止,这款程序已经可以处理约24种语言。只要翻译的语句相对简单,这款程序的使用效果还算不错。比如有人想要告诉一位北京的出租车司机他需要赶快去一家药店。他只需要用自己熟悉的语言(比如德语)对手机说出要求,手机立刻会用中文重复他的意图:“请带我去一家药店。”奥克觉得,目前这一程序依然“有些迟钝、笨拙,因为还需要按按钮。”更重要的是,翻译的质量不太稳定。然而,就在几年前,哪怕是现在的水平,人们也是无法想象的。

几十年前,IBM奠定了自动翻译的基础,但这个项目进展迟缓,很快就被放弃。由于这个前车之鉴,谷歌翻译启动的第一年只是“一个纯粹的研究项目”,但在近期他们取得了巨大的进展,奥克甚至称之为“飞跃”。

翻译小组在谷歌硅谷总部的规模在壮大,团队成员包括多名德国电脑专家,但却没有一个语言学家。奥克本人也不擅长语言学。相反,他说,“我学语言很艰难,这正是机器翻译的魅力:重要的是擅长数学和统计学,会编程。”

开发字典、定义语法结构……诸如此类模拟人类翻译的规则都和谷歌翻译程序无关。事实上,这些语言规则大多太灵活,太不精确,导致电脑无法处理。比如在英语和德语中,形容词位于名词之前,而在法语中却相反。因此如果拘泥于语法规则,翻译软件很快就会“迷失”。

谷歌翻译团队遵循自己的专长:海量数据处理和统计分析。“我们的系统所做的就是对比现有的翻译文本,自我学习,比如某个单词和某些词语的组合在另一种语言中最常见的翻译是什么,”奥克说,“最终我们计算的是翻译的可能性。”现有参照数据越庞大,这套系统就越准确。因此,只有在互联网出现之后,计算机翻译才成为可能。万维网提供了海量的现成翻译文本。

翻译软件一边收集数据,一边学习。比如,当被要求将一句话从法语翻译为德语,软件先从网上搜索对应的单词、短语,然后根据搜集到的信息计算出如何构成一个新的句子。这一方法颇为有效,但远远谈不上完美。语法、语调和歧义依然是自动翻译软件面对的巨大难题。翻译结果虽然可以理解,却是语言学家的噩梦。机器显然不懂得文字之美。难道需要教会软件如何优美地遣词造句吗?奥克认为没有必要。关键在于如何“更有效地学习。”换句话说,电脑需要掌握模仿的艺术。

从翻译程序的角度,当需要互译的语言本身在语法和单词结构上相似,并有大量的参照数据时,翻译的效果通常比较令人满意。英语和西班牙语的互译相对完美,而英语和日语互译则不如人意。“不幸的是,英语和德语也属于艰难的组合,”奥克说,“这尤其让我烦恼。”

但是,谷歌最终的目的到底是什么?它想要垄断人类通信吗?或是希望掌控全球交流?

奥克说商业策略不在他的管辖范围。但他表示:“机器翻译让很多人能够获得从前无法获得的信息,这就让其他的事情成为可能。”重要的是它们创造的间接利益。在其他产品上谷歌采取相似的策略。它的搜索引擎和邮件服务目前都是免费的,但它们却为谷歌带来了数亿的用户和与之相关的信息。

与此同时,谷歌也面临日益激烈的竞争。几周前,社交网站脸谱收购了一家小公司。该公司研发了一套语言输入和自动翻译系统。脸谱希望这套系统可以方便不同国家用户之间的沟通。目前这家社交网站在全球200多个国家和地区拥有超过10亿用户。

欧盟也开发了自己的自动翻译软件M T @EC。它主要用于翻译官僚术语。由于金融危机导致的预算削减,在未来几年,欧盟可能不得不裁减10%的翻译人员。

微软也启动了自己的翻译项目。去年秋天,微软全球运营部负责人里克·拉希德在中国的一次新闻发布会上宣布了他们的研究成果。拉希德说英语,这款微软的翻译器同时将他的话翻译为普通话———不是用千篇一律的计算机声音,而是用拉希德自己的声音,通过他之前录制的语音样本组装而成。这至少赋予了机器翻译一点点的人性化。

( 责任编辑: 张忠权 )