Pages

Saturday, 22 February 2020

人工智能翻譯:只能輔助無法取代人類的原因

谷歌、微軟、有道、訊飛......翻譯軟件越來越普及,質量越來越高,但要取代人類在翻譯界的地位?

機器在翻譯領域的應用越來越廣已經沒有疑問,可以看見機器在部分領域部分取代人工翻譯正在發生,在一些高等學府的現代語言學位課程中也有了一席之地。

但凖確地說,在翻譯界機器仍處於輔助地位,還是工具,電腦輔助翻譯(CAT)工具。

迄今為止CAT最大的貢獻是讓人類擺脫了簡單重覆的勞務;它主要還是扮演輔助角色,因為人類的語言系統既恢弘又精密,溫度和色調的豐富多彩及千變萬化,機器一時半會兒還無法完全掌握。

可以用美國初創公司Waverly Labs首席執行官安德魯·奧喬亞(Andrew Ochoa)的兩句話為例。這家公司生產翻譯耳機。

     英語原文:

「It has taken decades of research to create a framework of algorithms designed to recognise patterns in the same way as the human brain - a neural network,」 says Andrew Ochoa, chief executive of US start-up Waverly Labs, which produces translation earpieces.

「Combining that with speech recognition technology has allowed us to make a huge leap forward in terms of accuracy.」

    谷歌翻譯:

美國初創公司Waverly Labs首席執行官安德魯·奧喬亞(Andrew Ochoa)說:「經過數十年的研究,創建了一種算法框架,旨在以與人腦相同的方式識別模式 - 神經網絡。」

「將其與語音識別技術相結合,使我們在凖確性方面取得了巨大的飛躍。」

雖然沒有大錯,但讀來總感覺哪裏不太順,而且跟原意還是有較明顯的差異。

    本文作者翻譯:

「創建一種能夠像人腦一樣識別模式的算法框架 - 神經網絡,是在數十年研究的基礎上完成的。」

「將它(神經網絡)與語音識別技術將結合,使我們在 凖確性方面取得巨大飛躍。」

這個修飾機器翻譯的過程可能容易也可能痛苦。西班牙英-西翻譯納瓦羅·戈薩爾維茲就認為CAT工具與其說是在幫忙不如說是扼制創造性。

他說,機器給你一份半成品,你得花加倍的力氣和時間去核對、糾正、修飾,還不如自己從頭做起更快更容易。

尤其是涉及到情感等主觀色彩較濃或者語氣微妙的情況,譯文詞不達意可能算是好的,更有可能出現令人啼笑皆非的荒唐結果。

「里程碑」

2017年,微軟亞洲研究院與雷德蒙研究院研發的機器翻譯系統的漢 - 英新聞報道翻譯質量和凖確率達到人類專業翻譯水平。

這個newstest2017新聞報道測試集在國際權威評測大賽WMT17大會上發佈。當時媒體稱之為人工智能(AI)里程碑。

但這並不意味著翻譯機器可以替代人類,更遑論全面替代。

這個話題當時在中文專業社交網站「知乎」上引起討論。

用戶「小號是留住最真的」預測,3-5年內,非文學類(專業、應用類)筆譯將被取代90%,會展等低端陪同口譯至少70%將被口譯設備和app取代。中高端(會議、同傳口譯)5-7年內將被取代50%以上。文學類還看不到被取代的可能性,

即便是不涉及較多主觀情感色彩的專業翻譯,比如法庭口譯,即使是同一語系的英-法互譯,谷歌翻譯目前仍有較大改善空間。

怎一個LOVE了得?





看上面截圖,中文「愛之切切」,怎一個LOVE了得?

「山川異域」,日本救援武漢抗擊新冠肺炎的物資包裝上用了這個詩句,它難道不是oceans apart 的意思?至少不應該是異域風情之意吧?

「風月同天」翻譯成相同的風和月,意思模棱兩可,含糊其辭。當然,畢竟還是機器,人工智能,還沒把漢語詩詞學精學透。

機器就是機器

薩曼莎·蘭利(Samantha Langley)曾經當過律師,現在是法庭認證批准的法-英法律翻譯。她的親身體驗是「谷歌翻譯可能出現重大錯誤,尤其是涉及一詞多義的情況,而這在法律和工程等專業領域也很常見」。

翻譯機器和軟件無疑在某些領域很有用,比如使用說明、問卷調查、市場訊息和比賽數據等,但生硬和不準確仍是在更廣泛的領域使用機器翻譯的主要障礙。

消費市場隨身譯工具種類也越來越多。最近很火的一款是WLE翻譯耳機,跟智能手機軟件配套使用。翻譯耳機會把外語語音翻譯成用戶選擇的語言。

說是即時同傳,但也有幾秒鐘的延後,如果網速慢則時間差更大。

更主要的是, 人類的語言交流,字詞句只是最基本的元件,還有大量看不見的要素,語氣語調、修辭技巧等等,還有方言、俚語、成語和習慣用法等變量。

跨國市場營銷和翻譯公司Wordbank(字庫)的品牌及內容總監佐伊·庫珀(Zoey Cooper)很清楚機器翻譯的短板。

她對BBBC記者傑西卡·伯溫(Jessica Bown)說:「要想跟讀者建立聯繫,就需要人來翻譯,那樣才可能做到自然順暢,凖確捕捉到話裏話外的情緒,而這通常需要徹底改變句子的結構或語序。」

如此看來,在最近的將來,機器仍舊只能扮演輔助角色。

勞工市場看來也有同感。

英國招聘網站Reed的廣告中有15%的職位要求至少掌握一門外語;美國商會外語教學部的研究發現,75%的企業需要員工掌握不止一種語言。

在翻譯軟件和手機翻譯app越來越普及的中國,學英語仍被許多家長認為是必須從娃娃抓起的大事。

世界上有5600多種語言,英語是最通用的,即便是所有語言跟英語互譯,機器取代人類也需要相當長時間,需要做很多凖備,包括數據庫和神經網絡(算法)的設計。



from BBC中文 https://www.bbc.com/zhongwen/trad/science-51587441