2017年3月9日

十年之內,語言障礙將不復存在


來源:華爾街日報
日期:2017/03/09 15:45

過去,我出國旅行總會隨身帶一本口袋字典,裡面有各種常見短語和字詞的翻譯。如果想要表達某個句子,我會拿著字典翻查五分鐘,用銜接生硬的動詞、自認為最貼切的名詞,硬湊出一句話。而現在,我只需要拿出手機把這個短語輸入谷歌翻譯(Google Translate),就可以轉換為90種語言中的任意一種譯文,網絡快速運轉便可讓這一過程瞬間完成。

比起查字典這種老套的方法,機器翻譯更快速也更高效。雖然機器翻譯在準確性、功能性和傳達方面仍有缺陷,但我相信這種情況不會長期存在。我預測,10年後本文的每一位讀者都能夠將這些文字轉換為數十種外語,語言障礙這一特有的概念將不復存在。



當前的翻譯工具每天為兩億多人處理超過10億條翻譯,在此過程中不斷發展完善。隨著數據的指數化增長,上述翻譯量很快就能在一個下午達成,然後縮短到一個小時。機器翻譯的準確性將以驚人的速度得到提高,可以詮釋每一個細枝末節。只要機器翻譯出錯,用戶就可以對錯誤進行標記,而這些數據同樣將被納入未來的翻譯過程。我們需要的只是更多的數據、更強的處理能力和更好的軟件。隨著時間的推移,這些條件終將成為現實,從而在發音和口頭對話翻譯等領域填補溝通的空白。

最有意思的創新將是用戶端的硬件開發。10年後,將出現一種小耳機,當有人說某種外語的時候,它能輕聲地將你聽到的內容幾乎同步地轉換為你的母語。滯後的時間取決於聲音的傳播速度。

而且,你耳朵聽到的聲音不會是像Siri那樣的電腦合成人聲。生物工程學正對聲音的頻率、波長、強度和其他屬性進行測量。隨著這門學科的進步,連接到你耳內小聽筒的雲端軟件將重現講述者的聲音,只不過講的是你的母語。當你回應的時候,你的語言會被翻譯成對方的語言,通過對方的耳機或者你的手機、手表或10年後盛行的任何個人設備上的揚聲器放大,傳到對方耳中。

當前的翻譯工具往往只能在兩種語言之間轉換。你可以試著進行任何涉及三種語言的機器翻譯,翻譯出來的結果往往是“不知所雲”。但在未來,說多少種語言都沒關系了。你可以舉辦一場晚宴,八個講著八種不同語言的人圍桌而坐,而你耳朵裡聽到的永遠是自己想要聽到的那種語言。

這些突破方案的研究和商業化來自私人部門和國防情報組織的交叉領域。Siri起源於美國國防高級研究計劃局(DARPA)資助的一個人工智能項目,其語音識別引擎由Nuance Communications 開發,這家公司默默地為70%的《財富》雜志100強企業提供語音軟件,每年在語音生物識別方面的研發投入超過三億美元。

美國國家安全局(U.S. National Security Agency)和以色列信號情報國家部隊(Israeli National Sigint Unit) 在語音生物識別和翻譯的基礎研究上投資巨大,這很大程度上是因為加密導致數字通信的分析難度加大。許多情報機關的研究正著手統計地方方言、語調種類和強弱等細微差別,專業翻譯人員認為正是這些因素導致語言從算法上去分類太過復雜。隨著從事這項工作的以色列人全日制兵役服役期滿,同時在馬裡蘭州和弗吉尼亞州的美國公職人員進入私人部門工作,這些創新將進入公共領域。

通用機器翻譯應會加速全球互聯互通的不斷推進。雖然目前階段採用英語作為商業通用語仍是全球化背後的重要驅動力(以至於當前講英語的人群中非母語人士已達到母語人士的兩倍),下一波潮流(機器翻譯技術的提升)將消除使用同一種語言的必要性,打開更寬廣的溝通大門。例如現在,如果一群講韓語的商業人士在巴西舉辦的一次會議上和講普通話的企業高管談話,雙方都會講英語。但是未來將不再有這種必要,從而為非精英人士以及大量的非英語人士開啟進軍國際業務之門。

新技術消除的語言障礙遠不止於此。機器還將幫助全球數千萬有嚴重聽覺和語言障礙的人降低社交隔離。不久前在烏克蘭旅行的時候,有一群工程學學生向我展示了一個亮閃閃的黑藍色機器人手套。手套使用緊貼手指的柔性傳感器識別手語,通過藍牙在智能手機上將其翻譯成文字,緊接著文字被轉換為語音,可以讓聾啞人 “說話”,並且實時地讓對方聽到。相信不久後,手機下拉菜單上可供選擇的語言選項將達到數十種。

這一項新技術的經濟效益顯而易見。機器翻譯將進入目前看來太難掌控的市場,並打開這些市場。想一想像印度尼西亞這種地方。雅加達和巴厘島有許多講英語、普通話和法語的人,但是在其他6,000個有居民居住的島嶼上,通曉這三種語言的人卻屈指可數。如果人們無需精通爪哇語(或者印度尼西亞其他700種語言中的任何一種)就能在這些省份做生意,那麼這些市場馬上就變得更容易進入,相應地,當地市場也可以更順暢地引入外部資本。

跨越班達海和阿拉弗拉海,印度尼西亞的東面是資源豐富的巴布亞新幾內亞。這個國家礦產儲備豐富、農產豐沃、海產豐美(金槍魚產量佔全球的18%),但是語言種類卻多達850種,讓大多數國外投資者望而卻步。

應用於翻譯領域的大數據將徹底顛覆這一切。它將進入全世界經濟隔絕的各個地區,幫助它們融入全球經濟。原則上,它能讓我們每個人成為建設巴別塔的智者。

(本文作者Alec Ross曾經擔任美國國務卿高級創新顧問,也是《未來的產業》(The Industries of the Future)一書的作者。這本書已於2016年2月2日由Simon & Schuster 出版社出版。本文所述僅代表其個人觀點。)

沒有留言: