Google:機器學習讓Google翻譯變強,但雙向即時翻譯仍有挑戰
若要說 Google 對人類踏足跨地域的最大貢獻,那麼第一個會想到的是 Google Maps,另外一個會想到的是近年成長相當迅速的 Google 翻譯,而在去年導入機器學習技術之後,Google 翻譯彷彿吃了大力丸,效率倍增,稍早 Google 向臺灣媒體說明了機器學習究竟爲Google翻譯帶來哪些改變,但是要真正讓手機變成翻譯年糕,還是有挑戰。
毋庸置疑的,AlphaGo 對上南韓棋王李世石一役後,讓「人工智慧」這個看似艱深難懂的技術受到更多人討論。Google臺灣董事總經理簡立峰表示,近年來,Google發展重點從「行動第一(Mobile-First)」轉向「人工智慧第一(AI-First)」,將機器學習技術應用到使用者日常運用的Google產品和服務中,以改善既有技術、發展跨領域機器學習技術,爲使用者帶來更快速、更聰明、更便利的服務。
人工智慧的分類包括Super-Human、Par-Human、Sub-Human,Google 翻譯就是屬於Sub-Human的範疇,而 Google 無人車與 DeepMind 旗下的 AlphaGo 其實就是 Super-Human 的領域。
對 Google 來說,人工智慧並非全新技術,而且其實在旗下的 Google Search、Gmail、YouTube、Chrome、語音辨識、圖像搜尋等功能,以及這兩年最受歡迎的無人車當中的視覺運算技術,都是人工智慧技術的一環。
對 Google 翻譯來說,目前全球每月擁有超過 5 億的活躍用戶,使用 Google翻譯的次數每天超過10億次,每秒於全球完成 1,000 億個字詞翻譯,字詞跟字詞之間,還有複雜的語言差異、語調問題,當然也是要透過機器學習來達成。
目前網路上有 50% 的內容是以英文呈現,但全球卻只有 20% 的使用者是以英文爲其主要語言,其中網路上並沒有印度語以及阿拉伯語言的內容,但這兩種語言就佔了接近 3 億使用者,從中可以看到人類對 Google 翻譯的需求。
Google 翻譯產品經理 Julie Cattiau 指出,其實 Google 翻譯剛推出時是以片語式機器翻譯(Phrase-Based Machine Translation)作爲主要運算方式,透過收集搜尋索引來建構翻譯模型,並以統計方式將共同出現過的詞彙記錄下來,套用到翻譯服務中;一直到 2016 年 9 月 Google 導入神經機器翻譯技術(Nature Machine Translation)之後,透過端對端的機器學習系統,讓 Google 翻譯能與時俱進,才快速發展,強調是過去十幾年來無法達到的。
從 Julie Cattiau 迴應來看,Google 翻譯應用程式支援多達 103 種語言,93 種手寫輸入語言詞組,整個系統至今年 4 月導入 26 組語言組合之後,共可翻譯 41 組語言組合,包括英文翻譯中文、英文翻譯泰文、英文翻譯日文、英文翻譯韓文、英文翻譯俄羅斯文、英文翻譯印度文、英文翻譯法文、英文翻譯德文、英文翻譯西班牙文、英文翻譯葡萄牙文、英文翻譯土耳其文、英文翻譯越南話等等雙向翻譯,幾乎是以倍增的形式在成長。
Google臺灣董事總經理簡立峰表示,機器學習可以看成是大數據應用的延伸,人工智慧的發展主要就是延續資通訊科技從雲端運算、行動網路、大數據分析等一系列進展演進而來。
以翻譯來說,透過導入機器學習技術,不但翻譯的語言組數快速成長,翻譯的辨識效率也比以往還要更升級,這都是因爲透過神經網路機器學習之下的翻譯系統不在是片段的翻譯,而是一次翻譯整個句子,藉由具備多層神經元的深度神經網路,讓系統得以學習去辨識句子中的模式和結構,最後翻譯出的語法更趨近日常對話、更順暢且易於閱讀的結果。
Julie Cattiau 表示,導入神經機器翻譯技術之後,Google 翻譯現在僅需要一套系統就能完成多元語言翻譯,簡化了過去需要建構多個不同翻譯系統造成可觀的運算成本的問題。
此外,透過Zero-Shot翻譯讓翻譯系統自行學習,不需額訓練就能自動翻譯另一種全新語言。簡單來說,以往的翻譯模組可能只有英文跟日文、英文跟韓文,日文跟韓文之間的翻譯,透過 Zero-Shot 技術,不僅可完成英日、日英、英韓、韓英的互譯,還可以直接完成韓日互譯,這也是大數據應用搭配機器學習的成果。Julie Cattiau 指出,目前推出的 16 組語言組中,共有 10 組語言組已經採用 Google 神經機器翻譯系統(GNMT)。
另一種機器學習的應用是 Google 翻譯中的即時鏡頭翻譯 (Word Lens),藉由即時視覺翻譯功能,使用者只需要拿手機鏡頭對向文件,就可以立刻取得翻譯結果。
Julie Cattiau 指出,考量到現實世界中的字母可能會反射、有污垢、髒污等因素,讓Google翻譯用「假」字母來模擬各式反光、點來模仿現實生活中圖片呈現的情境,以訓練機器的演算法來辨識出日常生活中每個語言,現已支援中英文對翻,並且支援 31 組語言辨識。
除了鏡頭翻譯之外,Google 翻譯同樣提供雙向翻譯的功能,目前支援 32 種語言組合的雙向對話,使用者只需要再選定語言組合後,點選「語音」圖示,即可讓兩個說着不同語言的使用者無障礙的對話,不過雖然現有 Google Cloud 的運算技術已經到位,但是礙於資料庫的蒐集以及多種可能的因素,目前雙向翻譯還不能做到真正雙向即時翻譯。
Google 翻譯功能其實非常多,除了上述功能,還提供離線模式跟觸控翻譯,前者支援 52 種語言,後者支援支援 103 種語言。Google 表示,目前臺灣是全球 Google翻譯(Android版)成長最快的市場,當中 Android 版版本用戶平高年成長 2 倍,iOS版版本用戶平高年成長60%。
談到下一步,Google翻譯希望能適時地截斷或捨棄來源句子裡的單詞,並且加強數字與日期翻譯,同時爲簡短、罕見字串、稀有名詞與品牌進行更正確的翻譯成果。