新華社北京9月10日電 特稿:機(jī)器翻譯革命強(qiáng)勢來襲
新華社記者楊駿
安徽黃山不少出租車司機(jī)經(jīng)常拉“老外”,不會外文也能交流無礙;去年北京的全球機(jī)器智能峰會上,各國大咖扎堆演講,現(xiàn)場卻不見同聲傳譯者;更多中國人海外游,面對東京的日文菜單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語而慌張。
這一切都源于一項近年來不斷取得突破的技術(shù)——機(jī)器翻譯。
人工智能推波助瀾
全球知名翻譯公司“一小時翻譯”首席執(zhí)行官奧弗·紹尚日前警告說,未來1至3年內(nèi),基于神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的機(jī)器翻譯將會承擔(dān)價值400億美元翻譯市場上的近一半工作,預(yù)計會導(dǎo)致50萬名翻譯失業(yè)。
神經(jīng)機(jī)器翻譯(NMT)自2014年在科學(xué)論文中首次被提及以來,已使機(jī)器翻譯領(lǐng)域出現(xiàn)翻天覆地的變化,它開始全面超越以統(tǒng)計模型為基礎(chǔ)的統(tǒng)計機(jī)器翻譯(SMT),快速成為在線翻譯系統(tǒng)的主流標(biāo)配。
神經(jīng)機(jī)器翻譯的“神經(jīng)元”可以學(xué)習(xí)和收集信息,模仿人類大腦的神經(jīng)元建立聯(lián)系。它克服了傳統(tǒng)方法將句子分割為不同片段進(jìn)行翻譯的缺點(diǎn),充分利用上下文信息,對句子進(jìn)行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經(jīng)機(jī)器翻譯系統(tǒng)越來越多,國內(nèi)的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國外的谷歌、臉書、微軟等都在布局,這使相關(guān)技術(shù)發(fā)生“質(zhì)變”。
如今,許多出租車司機(jī)都能用手機(jī)上的翻譯軟件,輕松和“老外”溝通。在不少國際會議上,機(jī)器翻譯干脆直接扮演現(xiàn)場同聲傳譯角色。
語音識別技術(shù)發(fā)展對這場翻譯革命也功不可沒。語音識別包括遠(yuǎn)場識別、噪音識別以及多輪交互,是人工智能的重要切入點(diǎn)。
因此,這場機(jī)器翻譯技術(shù)革命,正是人工智能革命夢想照進(jìn)現(xiàn)實(shí)的重要一環(huán)。
應(yīng)用場景日漸豐富
“兩年前,人工智能的翻譯質(zhì)量往好了說,也就是讓你能對文本的內(nèi)容有個大致了解,專業(yè)翻譯寧愿自己從頭開始翻,”“一小時翻譯”首席執(zhí)行官紹尚說,“今天,通過神經(jīng)機(jī)器翻譯,人們只要對機(jī)器翻譯內(nèi)容進(jìn)行少量修改,就能獲得人性化翻譯?!?
機(jī)器翻譯應(yīng)用量正呈加速增加態(tài)勢。臉書的用戶高達(dá)數(shù)十億,為了打破用戶之間的溝通瓶頸,該公司去年上線神經(jīng)機(jī)器翻譯功能,機(jī)器翻譯的速度和水平均得到大幅提升。另據(jù)官方信息顯示,機(jī)器翻譯在阿里巴巴內(nèi)部可以每天翻譯出幾十億量級的產(chǎn)品信息,每天的在線翻譯請求達(dá)到數(shù)億次。在電子郵件和網(wǎng)站頁面語言轉(zhuǎn)換方面,谷歌公司稱,其機(jī)器翻譯服務(wù)每天在全世界被使用超過10億次。
旅游業(yè)對翻譯需求更加旺盛。有數(shù)據(jù)顯示,中國已成為世界第一大出境旅游客源國。2017年中國公民出境旅游突破1.3億人次,花費(fèi)達(dá)1152.9億美元。解決語言溝通問題正成為越來越多中國出境游客的迫切需求。
許多中國游客借助智能翻譯軟件和機(jī)器,輕松搞定國外道路路牌、餐館菜單和超市購物,甚至在旅途中認(rèn)識外國朋友。各大技術(shù)企業(yè)也在爭奪這一巨大市場。
機(jī)器翻譯的應(yīng)用場景正不斷豐富,越來越多的政府和企業(yè)網(wǎng)站需將內(nèi)容“多語言化”;視頻網(wǎng)站可能需要借助機(jī)器翻譯將視頻內(nèi)容翻譯成多語言版本;就連人工翻譯服務(wù)供應(yīng)商也會借助機(jī)器翻譯來提升人工翻譯的效率。
人機(jī)翻譯相輔相成
人類翻譯,未來還有需求嗎?
人們發(fā)現(xiàn),對于“夫妻肺片”等專有名詞以及唐詩宋詞,機(jī)器翻譯能力已有了長足進(jìn)步,但面對“杠精”等網(wǎng)絡(luò)熱詞以及新流行語的翻譯能力仍有待提高。
盡管在達(dá)沃斯年會等一些國際論壇上,智能同傳翻譯應(yīng)用越來越多,但在個別場合,機(jī)器翻譯也鬧過一些令人費(fèi)解的“烏龍”。
這說明,人工智能翻譯要充分考慮復(fù)雜性。一些會議現(xiàn)場語言多樣,話題專業(yè)性強(qiáng),噪音干擾多,而且講話者的語言習(xí)慣和口音也各不相同,即使能從嘈雜的環(huán)境中提取主要音色,語義識別仍充滿挑戰(zhàn)。
專家認(rèn)為,人工翻譯是一個“閱讀-內(nèi)化-表達(dá)”的過程,人類讀到文本之后,會聯(lián)想到相關(guān)現(xiàn)實(shí)場景,然后給出另一種語言對這種場景的表達(dá)。但機(jī)器翻譯通常只是一個“解碼”過程,將原文看成被加密的譯文。這樣的過程缺乏現(xiàn)實(shí)體驗,談不上理解,自然難免出錯。
總體而言,人工翻譯與紙面翻譯供給能力有限,但翻譯水準(zhǔn)專業(yè)、精準(zhǔn),至少目前依然不可缺少;日常交流溝通不需要特別高質(zhì)量的同聲傳譯,機(jī)器翻譯在這方面市場前景巨大。
因此,人機(jī)應(yīng)該成為一套耦合的系統(tǒng),適合機(jī)器干的,交給機(jī)器;適合人工做的,還是由人完成。不要因為機(jī)器翻譯的進(jìn)步,就吆喝著大家都別學(xué)外語;也不要因為人工智能翻譯的失誤,就否定其巨大作用。