全文共4000字,31图,预计阅读11分钟

 

最近,大家都在吹捧一款来自德国的硬核翻译软件——DeepL。声称使用了爬虫和机器学习,对标谷歌翻译,目前已经支持中英互译。

 

别吹了,DeepL还没你们说的那么厉害!

“硬核!谷歌翻译被碾压!全球首个翻译引擎进化归来”

 

“DeepL或许会成为你今年首选的翻译工具”

 

“干掉谷歌的翻译软件来了!”

 

……

 

还有这种好事?(我不信.jpg)那就比比吧!注意:本文仅测评中英互译。

 

我们从口碑、市场占有比选择了5款翻译工具,海外选手有Google翻译、DeepL,国产选手有搜狗、有道、百度。他们将作为首轮竞赛选手,最终逐出三强进入第二轮竞赛。

 

别吹了,DeepL还没你们说的那么厉害!

选手已就位,第一轮将从新闻、长对话、学术论文展开对决。

 

第一轮第一部分

 

我们从VOA(美国之声)上摘选一篇关注度较高的新闻稿:Wuhan Ends Lockdown, Health Workers Worldwide Under Strain.(2892字符)

 

摘取部分原文如下:

 

别吹了,DeepL还没你们说的那么厉害!

在“After 76 days in lockdown, the Chinese city where the coronavirus first appeared has reopened. ”这句上,DeepL犯错了,并且是很严重的错误。

 

别吹了,DeepL还没你们说的那么厉害!

其余这四位选手发挥正常,看看DeepL:“中国冠状病毒首次出现的城市……”

 

译文出现严重歧义,扣分。

 别吹了,DeepL还没你们说的那么厉害!

 

再看,“Tens of thousands of”的翻译:Google和有道选择了“成千上万人”,而剩下的则选择了“数万人”。我们知道,“Tens of thousands of”可以作为固定搭配,我们经常译为数以万计的,数万的。相应的,“Thousands of”才经常译为成千上万。扣分。

 

我们继续看。对于人名,各位选手会怎么翻译?比如这句:“said Wuhan local Tong Zhengkun”我们惊喜的发现,只有有道和谷歌对其做了优化。中国文化博大精深,汉字则是其中最难的一部分,只凭借一个英文名就能译出一个中文名是不严谨的。因此,有道在翻译出的中文名后加上了“(音)”,音译,这是加分的优化,也是正确的优化。Google则采用了全球通用的方法,直接使用原英文名,这也是聪明的优化。同样的,在后面对于名人的人名翻译,只有这两位选手译成了“英国首相鲍里斯·约翰逊(Boris Johnson)”,加分!

 

回到翻译本身上来,“Tong”该怎么翻译?通过检索百家姓,“Tong”可以译为“童”、“佟”、“同”、“茼”、“桐”、“仝”等,这些都可以作为姓氏存在。诡异的是,DeepL翻译成了“唐”……可以理解这个错误,因为“唐”姓是可以译为“Tong”的,可以不扣分,但是很差劲。

 

别吹了,DeepL还没你们说的那么厉害!

再来看这句“Being indoors for so long drove me crazy.”很有意思,海外选手把“indoors”译为“室内”,国产选手有道、百度译成了“家”。毕竟是国产,翻译更本土化。

 

当然,有道也不总是加分,在翻译“The city had most of China…”这句时,竟然译成了“北京”。

 

在翻译“In other countries around the world, the economic, political and emotional effects of fighting the virus grow more worrisome.”这句上,全员阵亡。这里给出一个适合中文阅读习惯的译文:在全球其他国家,抗击病毒导致的经济、政治和情绪影响变得更加令人担忧。

 

下一段,搜狗对于“感染”和“携带”的释义出了偏差,对于“He is recovering, his spokesman said.”这句,DeepL又出了一个错误。

 

别吹了,DeepL还没你们说的那么厉害!

第一轮第二部分

 

长对话,我们从2019年12月的CET-6中摘选了一篇听力长对话。

 

别吹了,DeepL还没你们说的那么厉害!

没想到,第一句就难倒了各位选手……只有有道翻译根据下文“We”将男士的“your”译成了“你们的”。谷歌将依据前面的“Excuse me”将“your”译成了“您的”,这是符合本土化的一个亮点,但就是还差了点。

 

“Far from it”也是一句固定搭配,用于加强否定,可译为远非如此,绝非这样。但也仅有搜狗、有道、DeepL将其翻译成了“远非如此”。

 

别吹了,DeepL还没你们说的那么厉害!

再看这句“there’s no agreed upon definition of Jazz”,翻译最棒的是有道:人们对爵士乐的定义并没有一致的看法。其次是谷歌:关于Jazz的定义尚未达成共识。(谷歌也太追求保险了吧!)之后是百度:对爵士乐的定义还没有达成一致。然后是搜狗:对爵士乐没有一致的定义。最后是DeepL:

 

别吹了,DeepL还没你们说的那么厉害!

……

 

第一轮第三部分

 

从知网任意下载一篇英文学术论文:Bot recognition in a Web store: An approach based on unsupervised learning

 

那么先从标题开始吧。了解学术期刊/论文的朋友应该都知道,论文标题会有“基于……”、“……:……”、“……以……为例”、“……的应用”这样的一些格式。

 

别吹了,DeepL还没你们说的那么厉害!

所以关于标题的翻译,谷歌更胜一筹。只有谷歌将英文“:”译成了中文冒号“:”,且释义内容无偏差。最怪的就是DeepL,直接把句子给断了。再来两个,结果还是一样。

 

别吹了,DeepL还没你们说的那么厉害!

现在我们开始翻译文档,五位选手都拥有“文档”翻译功能,不过,百度和DeepL不支持pdf格式的文档。在笔者转化成ppt格式后,百度翻译可以正常执行,但可惜的是,DeepL并不支持翻译成中文。

 

别吹了,DeepL还没你们说的那么厉害!

通过比对发现,搜狗翻译会将文档中的字符全部导出,重新排版翻译,也会出现一些术语漏翻的现象。而有道翻译则更优秀,原件双屏显示,翻译没有较大偏差,甚至连字体颜色都保持与原件一致。在文档翻译“英转中”这块,有道可以说是国产之光了

 

别吹了,DeepL还没你们说的那么厉害!

别吹了,DeepL还没你们说的那么厉害!

再来看看百度,虽然短篇支持选择领域专业性翻译,但文档翻译并不支持,且因ppt无法在线放大阅读,只能选择导出文件。译文中出现了大量的未翻,甚至还有像“Robots”这样的词都没有翻译出来……

 

别吹了,DeepL还没你们说的那么厉害!别吹了,DeepL还没你们说的那么厉害!

谷歌文档翻译则需要科学上网,最后导出的结果以网页形式呈现。页面截取原文件红框内的文字,可以发现这块的译文有些糟糕。但是总体上译文没有太大偏差,标点符号转化以及字符排版仍是大问题。

 

别吹了,DeepL还没你们说的那么厉害!别吹了,DeepL还没你们说的那么厉害!

至此,第一轮竞赛结束。综合评估,有道、谷歌、DeepL将进入第二轮PK。第二轮将从方言、古文以及用户体验来对决。

 

第二轮第一部分

 

要知道,中国方言可以分为7种:官话方言、吴方言、湘方言、客家方言、闽方言、粤方言、赣方言。据统计,可以形成体系的方言有80多种。这里我们使用东北话、四川话和粤语来出题。

 

1、到站下车,请您吱声

 

别吹了,DeepL还没你们说的那么厉害!

可以发现对于单句,三款工具都给出了更多的版本供选择。对于三位选手给出的译文,我们先不讨论,我们给他翻译回去:

 

对比很明显了,这句话的难点就在于“吱声”。这个词在东北话中可解释为“说话、应答、招呼”。有道的意思很接近,但还是不太行。谷歌、DeepL使用了同一词汇,但英译中则不同。柯林斯词典中“squeak”的释义为“发出吱吱声、短促的尖叫”,很明显,“吱声”的意思被两位选手拔高了。

 

别吹了,DeepL还没你们说的那么厉害!

2、摆龙门阵

 

别吹了,DeepL还没你们说的那么厉害!

谷歌收录不少“摆龙门阵”的翻译,加分。有道的翻译一针见血,同时也有更多翻译可选。DeepL译出了“摆出龙门的阵型”,还标注了“俚语(lit.)”,但是译文效果没有达到

 

3、你食咗饭未呀?

 

别吹了,DeepL还没你们说的那么厉害!

这句粤语的意思是:你吃饭了没?

 

有道在这句上栽了跟头,译成了“breakfast(早餐)”。谷歌这句很直白“你过米饭没?”,这放在汉语中这话是有歧义的。DeepL在这一部分终于赢了一把。

 

第二轮第二部分

古文,是机器翻译最难攻克的。

 

1、山川异域,风月同天

 

别吹了,DeepL还没你们说的那么厉害!

有道的译文属于目前网络通用版本,无争议。谷歌的翻译很蹩脚。DeepL同样标注了“Lit.”,但是属于直译,没有翻译出本身的含义,所以此译文无价值

 

2、秋水共长天一色,落霞与孤鹜齐飞。

 

别吹了,DeepL还没你们说的那么厉害!

因为古诗没有标准译文,且三款工具都采用了直译,所以我们可以直接采用这句诗的现代汉语翻译来比较:落日映射下的彩霞与孤独的野鸭一齐飞翔,秋天的江水和辽阔的天空连成一片。

 

有道把“长天”译成了“long day”。谷歌则“落霞”、“孤鹜”均译错,句子结构理解错。DeepL将“孤鹜”译成了“lonely rustlers”,有点意外,因为柯林斯词典是这么说的:偷牲口的人。

 

别吹了,DeepL还没你们说的那么厉害!

3、吾谁与归

 

别吹了,DeepL还没你们说的那么厉害!

先解释一波,吾谁与归:我与谁一道归去呢?

 

有道很老实,一个字一个字输出。谷歌是不是翻译累了?DeepL很有诗意,对出了下句:谁归于我。谢谢,都有被笑到。

 

最后的测试!

 

用户体验竞技赛。

 

有道:有人工翻译服务(增值)、有选词对应、有译文结果多选、有播音、有划词释义、有收藏、有复制、有文档翻译、能修改。响应速度快。

 

谷歌:有选词对应、有多选、有播音、有语音输入、有划词释义、有收藏、有复制、有分享译文、有文档翻译、能修改。响应速度快,文档翻译需要科学上网。有翻译记录,但谷歌宣布该功能即将取消。

 

DeepL:有选词对应(黑灰字体切换)、有多选、有复制、有分享、有另存为文本格式、有文档翻译(不支持中英)、能修改。响应速度较慢。

 

两轮竞技赛比完了,没有绝对的输赢。说了这么多,只是想说:就中英互译来说,DeepL没有宣传的那么牛,没有比过谷歌翻译那么强大,更没有有道这样的本土翻译工具接地气。

 

理解大家一旦发现新鲜产品,尤其是在国外哪个地区火了哪个软件,就在国内大肆吹捧,动不动就“颠覆”、“干过”、“对标”,但这东西真的适合我们吗?我们发现了亮点,学习过来,改进自己的产品,让自家的东西越来越好,这样不好吗?

 

文化自信,不只是说说而已。

 

以上,DeepL还不成熟,除英德互译外,暂不建议使用。

 

 


参考资料:

 

有道翻译:http://fanyi.youdao.com/

谷歌翻译:https://translate.google.cn/

搜狗翻译:https://fanyi.sogou.com/

百度翻译:https://fanyi.baidu.com/

DeepL:https://www.deepl.com/translator/

 


别吹了,DeepL还没你们说的那么厉害!