全文共4000字,31图,预计阅读11分钟
最近,大家都在吹捧一款来自德国的硬核翻译软件——DeepL。声称使用了爬虫和机器学习,对标谷歌翻译,目前已经支持中英互译。
“硬核!谷歌翻译被碾压!全球首个翻译引擎进化归来”
“DeepL或许会成为你今年首选的翻译工具”
“干掉谷歌的翻译软件来了!”
……
还有这种好事?(我不信.jpg)那就比比吧!注意:本文仅测评中英互译。
我们从口碑、市场占有比选择了5款翻译工具,海外选手有Google翻译、DeepL,国产选手有搜狗、有道、百度。他们将作为首轮竞赛选手,最终逐出三强进入第二轮竞赛。
选手已就位,第一轮将从新闻、长对话、学术论文展开对决。
第一轮第一部分
我们从VOA(美国之声)上摘选一篇关注度较高的新闻稿:Wuhan Ends Lockdown, Health Workers Worldwide Under Strain.(2892字符)
摘取部分原文如下:
在“After 76 days in lockdown, the Chinese city where the coronavirus first appeared has reopened. ”这句上,DeepL犯错了,并且是很严重的错误。
其余这四位选手发挥正常,看看DeepL:“中国冠状病毒首次出现的城市……”
译文出现严重歧义,扣分。
再看,“Tens of thousands of”的翻译:Google和有道选择了“成千上万人”,而剩下的则选择了“数万人”。我们知道,“Tens of thousands of”可以作为固定搭配,我们经常译为数以万计的,数万的。相应的,“Thousands of”才经常译为成千上万。扣分。
我们继续看。对于人名,各位选手会怎么翻译?比如这句:“said Wuhan local Tong Zhengkun”我们惊喜的发现,只有有道和谷歌对其做了优化。中国文化博大精深,汉字则是其中最难的一部分,只凭借一个英文名就能译出一个中文名是不严谨的。因此,有道在翻译出的中文名后加上了“(音)”,音译,这是加分的优化,也是正确的优化。Google则采用了全球通用的方法,直接使用原英文名,这也是聪明的优化。同样的,在后面对于名人的人名翻译,只有这两位选手译成了“英国首相鲍里斯·约翰逊(Boris Johnson)”,加分!
回到翻译本身上来,“Tong”该怎么翻译?通过检索百家姓,“Tong”可以译为“童”、“佟”、“同”、“茼”、“桐”、“仝”等,这些都可以作为姓氏存在。诡异的是,DeepL翻译成了“唐”……可以理解这个错误,因为“唐”姓是可以译为“Tong”的,可以不扣分,但是很差劲。
再来看这句“Being indoors for so long drove me crazy.”很有意思,海外选手把“indoors”译为“室内”,国产选手有道、百度译成了“家”。毕竟是国产,翻译更本土化。
当然,有道也不总是加分,在翻译“The city had most of China…”这句时,竟然译成了“北京”。
在翻译“In other countries around the world, the economic, political and emotional effects of fighting the virus grow more worrisome.”这句上,全员阵亡。这里给出一个适合中文阅读习惯的译文:在全球其他国家,抗击病毒导致的经济、政治和情绪影响变得更加令人担忧。
下一段,搜狗对于“感染”和“携带”的释义出了偏差,对于“He is recovering, his spokesman said.”这句,DeepL又出了一个错误。
第一轮第二部分
长对话,我们从2019年12月的CET-6中摘选了一篇听力长对话。
没想到,第一句就难倒了各位选手……只有有道翻译根据下文“We”将男士的“your”译成了“你们的”。谷歌将依据前面的“Excuse me”将“your”译成了“您的”,这是符合本土化的一个亮点,但就是还差了点。
“Far from it”也是一句固定搭配,用于加强否定,可译为远非如此,绝非这样。但也仅有搜狗、有道、DeepL将其翻译成了“远非如此”。
再看这句“there’s no agreed upon definition of Jazz”,翻译最棒的是有道:人们对爵士乐的定义并没有一致的看法。其次是谷歌:关于Jazz的定义尚未达成共识。(谷歌也太追求保险了吧!)之后是百度:对爵士乐的定义还没有达成一致。然后是搜狗:对爵士乐没有一致的定义。最后是DeepL:
……
第一轮第三部分
从知网任意下载一篇英文学术论文:Bot recognition in a Web store: An approach based on unsupervised learning
那么先从标题开始吧。了解学术期刊/论文的朋友应该都知道,论文标题会有“基于……”、“……:……”、“……以……为例”、“……的应用”这样的一些格式。
所以关于标题的翻译,谷歌更胜一筹。只有谷歌将英文“:”译成了中文冒号“:”,且释义内容无偏差。最怪的就是DeepL,直接把句子给断了。再来两个,结果还是一样。
现在我们开始翻译文档,五位选手都拥有“文档”翻译功能,不过,百度和DeepL不支持pdf格式的文档。在笔者转化成ppt格式后,百度翻译可以正常执行,但可惜的是,DeepL并不支持翻译成中文。
通过比对发现,搜狗翻译会将文档中的字符全部导出,重新排版翻译,也会出现一些术语漏翻的现象。而有道翻译则更优秀,原件双屏显示,翻译没有较大偏差,甚至连字体颜色都保持与原件一致。在文档翻译“英转中”这块,有道可以说是国产之光了。
再来看看百度,虽然短篇支持选择领域专业性翻译,但文档翻译并不支持,且因ppt无法在线放大阅读,只能选择导出文件。译文中出现了大量的未翻,甚至还有像“Robots”这样的词都没有翻译出来……
谷歌文档翻译则需要科学上网,最后导出的结果以网页形式呈现。页面截取原文件红框内的文字,可以发现这块的译文有些糟糕。但是总体上译文没有太大偏差,标点符号转化以及字符排版仍是大问题。
至此,第一轮竞赛结束。综合评估,有道、谷歌、DeepL将进入第二轮PK。第二轮将从方言、古文以及用户体验来对决。
第二轮第一部分
要知道,中国方言可以分为7种:官话方言、吴方言、湘方言、客家方言、闽方言、粤方言、赣方言。据统计,可以形成体系的方言有80多种。这里我们使用东北话、四川话和粤语来出题。
1、到站下车,请您吱声
可以发现对于单句,三款工具都给出了更多的版本供选择。对于三位选手给出的译文,我们先不讨论,我们给他翻译回去:
对比很明显了,这句话的难点就在于“吱声”。这个词在东北话中可解释为“说话、应答、招呼”。有道的意思很接近,但还是不太行。谷歌、DeepL使用了同一词汇,但英译中则不同。柯林斯词典中“squeak”的释义为“发出吱吱声、短促的尖叫”,很明显,“吱声”的意思被两位选手拔高了。
2、摆龙门阵
谷歌收录不少“摆龙门阵”的翻译,加分。有道的翻译一针见血,同时也有更多翻译可选。DeepL译出了“摆出龙门的阵型”,还标注了“俚语(lit.)”,但是译文效果没有达到。
3、你食咗饭未呀?
这句粤语的意思是:你吃饭了没?
有道在这句上栽了跟头,译成了“breakfast(早餐)”。谷歌这句很直白“你过米饭没?”,这放在汉语中这话是有歧义的。DeepL在这一部分终于赢了一把。
第二轮第二部分
古文,是机器翻译最难攻克的。
1、山川异域,风月同天
有道的译文属于目前网络通用版本,无争议。谷歌的翻译很蹩脚。DeepL同样标注了“Lit.”,但是属于直译,没有翻译出本身的含义,所以此译文无价值。
2、秋水共长天一色,落霞与孤鹜齐飞。
因为古诗没有标准译文,且三款工具都采用了直译,所以我们可以直接采用这句诗的现代汉语翻译来比较:落日映射下的彩霞与孤独的野鸭一齐飞翔,秋天的江水和辽阔的天空连成一片。
有道把“长天”译成了“long day”。谷歌则“落霞”、“孤鹜”均译错,句子结构理解错。DeepL将“孤鹜”译成了“lonely rustlers”,有点意外,因为柯林斯词典是这么说的:偷牲口的人。
3、吾谁与归
先解释一波,吾谁与归:我与谁一道归去呢?
有道很老实,一个字一个字输出。谷歌是不是翻译累了?DeepL很有诗意,对出了下句:谁归于我。谢谢,都有被笑到。
最后的测试!
用户体验竞技赛。
有道:有人工翻译服务(增值)、有选词对应、有译文结果多选、有播音、有划词释义、有收藏、有复制、有文档翻译、能修改。响应速度快。
谷歌:有选词对应、有多选、有播音、有语音输入、有划词释义、有收藏、有复制、有分享译文、有文档翻译、能修改。响应速度快,文档翻译需要科学上网。有翻译记录,但谷歌宣布该功能即将取消。
DeepL:有选词对应(黑灰字体切换)、有多选、有复制、有分享、有另存为文本格式、有文档翻译(不支持中英)、能修改。响应速度较慢。
两轮竞技赛比完了,没有绝对的输赢。说了这么多,只是想说:就中英互译来说,DeepL没有宣传的那么牛,没有比过谷歌翻译那么强大,更没有有道这样的本土翻译工具接地气。
理解大家一旦发现新鲜产品,尤其是在国外哪个地区火了哪个软件,就在国内大肆吹捧,动不动就“颠覆”、“干过”、“对标”,但这东西真的适合我们吗?我们发现了亮点,学习过来,改进自己的产品,让自家的东西越来越好,这样不好吗?
文化自信,不只是说说而已。
以上,DeepL还不成熟,除英德互译外,暂不建议使用。
参考资料:
有道翻译:http://fanyi.youdao.com/
谷歌翻译:https://translate.google.cn/
搜狗翻译:https://fanyi.sogou.com/
百度翻译:https://fanyi.baidu.com/
DeepL:https://www.deepl.com/translator/