?
圖片來源:unsplash
■本報記者 張雙虎 趙廣立
因為機(jī)器翻譯和軟件應(yīng)用翻譯得越來越準(zhǔn)確,將英語逐出中學(xué)必修課的話題余音未了,谷歌翻譯就“翻車”了。
近日,谷歌翻譯將一份英文藥物說明譯出“您可以根據(jù)疼痛程度使用盡可能多的反坦克導(dǎo)彈”的句子。有研究者發(fā)布了谷歌翻譯在急診指導(dǎo)中應(yīng)用效果的評估報告。結(jié)果顯示,對于不同語言,谷歌翻譯的準(zhǔn)確率存在差距,最高可達(dá)到94%,而最低只有55%。
機(jī)器,能否扛起翻譯的大旗?
機(jī)器翻譯的本質(zhì)
“對機(jī)器翻譯來說,即使不是醫(yī)藥等專業(yè)領(lǐng)域,也有可能出現(xiàn)類似的錯誤,這是機(jī)器翻譯的本質(zhì)決定的。”中科院自動化研究所模式識別國家重點實驗室研究員張家俊對《中國科學(xué)報》說。
時至今日,機(jī)器翻譯已歷經(jīng)基于手工書寫翻譯規(guī)則的翻譯技術(shù)(RBMT)、通過統(tǒng)計機(jī)器翻譯技術(shù)(SMT)以及基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)(NMT)三代。不管谷歌還是微軟,目前提供在線翻譯的公司都利用深度學(xué)習(xí)模型,從數(shù)以億計的人類翻譯過的數(shù)據(jù)中,學(xué)習(xí)一種語言到另一種語言的自動轉(zhuǎn)換。
“這本質(zhì)上是基于概率統(tǒng)計的映射,翻譯模型并沒有真正理解語言,無法感知生成譯文的質(zhì)量,因此會產(chǎn)生一些對人類來說非常低級的錯誤而不自知。”張家俊說,“由于模型是數(shù)據(jù)驅(qū)動的,所以數(shù)據(jù)的規(guī)模、領(lǐng)域和質(zhì)量直接決定了最終翻譯的效果?!?/p>
科大訊飛研究院副院長劉俊華同樣認(rèn)為,當(dāng)前機(jī)器翻譯主要通過基于神經(jīng)網(wǎng)絡(luò)端到端序列建模和大規(guī)模雙語平行數(shù)據(jù)訓(xùn)練,實現(xiàn)源語言到目標(biāo)語言的轉(zhuǎn)換。因此,“訓(xùn)練數(shù)據(jù)的覆蓋度和質(zhì)量對機(jī)器翻譯系統(tǒng)性能有著決定性的影響”。
“當(dāng)機(jī)器翻譯模型在訓(xùn)練過程中,沒有學(xué)習(xí)過相應(yīng)的詞語或句子時,就很難保證翻譯準(zhǔn)確,這可能是導(dǎo)致谷歌翻譯出現(xiàn)莫名其妙錯誤的主要原因?!眲⒖∪A告訴《中國科學(xué)報》,“另一個原因是語言本身的豐富性和變化性所致。比如語言中的雙關(guān)、歧義等,也導(dǎo)致機(jī)器翻譯很難完全避免不出錯。”
劉俊華認(rèn)為,對這類問題,目前比較有效的方法是不斷地積累專業(yè)領(lǐng)域的訓(xùn)練數(shù)據(jù)、提升機(jī)器翻譯算法的建模能力,以及對專業(yè)術(shù)語進(jìn)行干預(yù)解決。
差距為啥這么大
谷歌翻譯的模型是基于新聞為主的全領(lǐng)域數(shù)據(jù)訓(xùn)練而成,沒有針對醫(yī)藥領(lǐng)域進(jìn)行專門處理,所以翻譯系統(tǒng)對新聞和日常用語等總體翻譯得比較好,而在一些專業(yè)領(lǐng)域表現(xiàn)就不夠理想。
“相對于新聞等通用領(lǐng)域,醫(yī)藥、學(xué)術(shù)領(lǐng)域中人類翻譯的數(shù)據(jù)沒那么多。更重要的是,大部分人類翻譯的數(shù)據(jù)要么沒有電子版,要么沒有共享。”張家俊說,“數(shù)據(jù)量少導(dǎo)致機(jī)器無法很好地學(xué)習(xí)到兩種語言序列間的映射關(guān)系。另外一個難點在于專業(yè)領(lǐng)域里術(shù)語特別多,而術(shù)語通常采用約定俗成的固定翻譯,這對于目前基于概率統(tǒng)計的模型來說是個非常棘手的問題。目前學(xué)術(shù)界正在關(guān)注這個問題,但有效的解決辦法不多。”
“專業(yè)領(lǐng)域的翻譯要求更精準(zhǔn),而且有特定的術(shù)語或語言表達(dá)方式,機(jī)器翻譯很難遵從這樣的約定。”劉俊華補(bǔ)充說,“專業(yè)領(lǐng)域訓(xùn)練數(shù)據(jù)稀缺,還會不斷出現(xiàn)新的詞語(如新型冠狀病毒肺炎)等。同時,術(shù)語往往存在一詞多義現(xiàn)象(如doctor在醫(yī)學(xué)領(lǐng)域翻譯成醫(yī)生的概率要大于博士),這導(dǎo)致機(jī)器翻譯難度加大。”
機(jī)器翻譯準(zhǔn)確率與用于模型訓(xùn)練的數(shù)據(jù)量密切相關(guān)。由于不同語言之間,模型訓(xùn)練的數(shù)據(jù)量存在很大的差距,如英語、西班牙語、漢語等聯(lián)合國官方語言,使用人口多,現(xiàn)有用于機(jī)器翻譯模型訓(xùn)練的平行數(shù)據(jù)也非常多,機(jī)器翻譯準(zhǔn)確率整體會更好一些。而對于亞美尼亞語、波斯語等“小語種”來說,可用于訓(xùn)練的數(shù)據(jù)量較少,翻譯準(zhǔn)確率自然會偏低一些。
劉俊華說:“不同語言的特點和難度、不同語種間的關(guān)聯(lián)度也導(dǎo)致翻譯準(zhǔn)確率出現(xiàn)較大差異?!?/p>
劉俊華舉例說,如波斯語、阿拉伯語是從右往左書寫、阿拉伯語文本一般不書寫元音符號、俄語存在復(fù)雜的屬格變化等都是翻譯的難點,導(dǎo)致需要投入更大的精力來提升機(jī)器翻譯的準(zhǔn)確性。
在語種間關(guān)聯(lián)度方面,漢語與英語之間關(guān)聯(lián)度較低,翻譯難度比較大。而西班牙語吸收了大量的英語詞匯,兩者在語法上也存在較多相似點,翻譯難度相對低一些。
“一般來說,同一語系或語族內(nèi)的語言之間翻譯起來難度低一些,準(zhǔn)確率也會更高?!眲⒖∪A說。
機(jī)器難以替代人類
在剛剛閉幕的兩會上,全國政協(xié)委員許進(jìn)提出的“改革義務(wù)教育階段英語必修課地位”曾引起熱議。其理由是英語占課時多,成果應(yīng)用率低,在人工智能時代,機(jī)器翻譯能解決日常應(yīng)用中的問題。
在日常交流時,機(jī)器翻譯的表現(xiàn)的確可圈可點。
記者用兩款常用軟件翻譯“研表究明,漢字序順并不定一影閱響讀?!边@樣故意顛倒語序的句子。翻譯軟件居然和人一樣避開了干擾,“聰明”地識別出句意并正確地翻譯出來。
專家認(rèn)為,由于訓(xùn)練數(shù)據(jù)量越來越大、模型能力越來越強(qiáng)、計算速度越來越快,機(jī)器翻譯的效果確實越來越好、越來越流暢。
“對于語序,人類在閱讀時是有預(yù)期的,如果看到的字符串與預(yù)期的很像可能就不會覺察到。如果翻譯模型在海量文本上學(xué)習(xí)過這樣的情況,就能避開干擾,識別詞語間的正確順序。”張家俊說。
盡管如此,受訪專家也表示機(jī)器翻譯依然任重道遠(yuǎn)。
中科院自動化研究所研究員宗成慶認(rèn)為,翻譯中口語、書面語和專業(yè)領(lǐng)域各有特點,口語有語氣、表情、重音、語速、口音(方言)、噪聲等機(jī)器翻譯的難點;書面語有詞匯、成語、人名、句子結(jié)構(gòu)復(fù)雜等不確定因素。因此,進(jìn)行專業(yè)領(lǐng)域的翻譯更要“有目標(biāo)地根據(jù)用戶需求進(jìn)行個性化定制”。
“機(jī)器翻譯不可能完全替代人,尤其在需要中高級翻譯的情況下?!弊诔蓱c告訴《中國科學(xué)報》,“機(jī)器翻譯的工具屬性更強(qiáng)。人機(jī)應(yīng)該是互助關(guān)系,在一些簡單場景、不太重要的場合,機(jī)器翻譯可以快速處理,幫助人們提高效率。而對翻譯質(zhì)量要求高的地方,如文學(xué)作品、重要國際會議等場合,還需要人工翻譯。”
宗成慶認(rèn)為,中國在機(jī)器翻譯應(yīng)用系統(tǒng)開發(fā)方面,能夠跟跑甚至在某些語言方面領(lǐng)跑國際,“但原創(chuàng)性的理論方法尚待拓展”。這其中原因很多,比如數(shù)據(jù)收集規(guī)模小、公共基礎(chǔ)資源缺乏等。
“目前有80多種語言與漢語之間的翻譯找不到對照資源。一些小語種(如達(dá)利語)語言學(xué)家太少,做翻譯系統(tǒng)時,能評價的人都沒有。”宗成慶說,“還有些小語種因為就業(yè)困難,面臨后繼無人的窘境?!彼粲酰瑖覒?yīng)將其視作儲備力量,加大這方面人才的培養(yǎng)力度。
《中國科學(xué)報》 (2021-03-25 第3版 信息技術(shù))