環球故事

環球:機械翻譯鬧笑話

  • 雖然Google Translate使用機械統計翻譯邏輯(即按統計以最多人理解的說法為準),可減少一些“一語多意”和“硬譯”所帶來的笑話,但人類語言千變萬化,機械翻譯始終還有很多弱點。

(香港)機械翻譯技術已經研發多年,但時至今日在“實戰”應用時仍屢鬧笑話。以在機械翻譯領域已屬領先的Google Translate為例,不少用戶都發現它經常會不依上文下理來翻譯詞語,有時翻譯結果“詞詞都對”,但湊在一起卻沒可能看得懂。在翻譯單字或短語時,例如“小心滑倒”,若機械翻譯的字組庫並無具體收錄時,它就會譯成“Carefully slide”(小心翼翼









 

地滑)。

除了一些機械式的翻譯錯誤,另一種常見的錯誤就是因“一語多意”而造成。例如“I miss the bus”,一般人都會理解為“我錯過了那班巴士”,但字面上亦可理解為“我想念那班巴士”,一些舊式機械翻譯工具漠視前文後理,便會譯出錯誤的意思。

聲音傳譯‧語氣難翻

雖然Google Translate使用機械統計翻譯邏輯(即按統計以最多人理解的說法為準),可減少一些“一語多意”和“硬譯”所帶來的笑話,但人類語言千變萬化,機械翻譯始終還有很多弱點,聲音傳譯就更難。例如語氣也往往影響說話的真正意思,同一句話,語氣不同,隨時可能變化說反話,要根據因人而異的聲線及語音去理解一個人真正的“心意”就更困難。

全球語言逾3000‧樊籬難解

《聖經》創世記聲稱遠古人類只說一種語言,連口音都是一樣。當時人們合作建造一座能通往天堂的高塔,結果引起上帝不滿。為阻止人類的傲慢計劃,上帝打亂了人們的語言,使人類彼此無法溝通,計劃結果流產。這座塔被稱為“巴別塔”(Babel Tower),“巴別”在希伯來語中是“變亂”的意思。但在現代,“巴別”已成為人類再度建立共同語言的象徵。早年由入門網站AltaVista(已被雅虎收購)提供的免費機械翻譯服務就命名為“巴別魚”。

美曾推“獨尊英語運動”

目前世界大約有3000多種語言。為解決言語不通障礙,有人試圖創造世界語、新共同語言等,但全都未能普及。在世界各地近代民族國家建立上,統一語言幾乎都是必然議題。例如美國在200多年來曾經開展過一系列的“獨尊英語運動”,令英語在今天成為美國的主流語言。19世紀時,英國也曾壓制威爾士語,在校園裡說威爾士語的孩子都要被掛上寫著“Welsh Not”的侮辱牌子。

中國一個世紀來的語言政策也是以獨尊北京話(普通話)為表現形式。支持者認為,統一語言能消除人們彼此間的文化隔閡,意味著人們能更徹底地交流,減省不必要的成本浪費,有助確立國族認同,但近年也有愈來愈多呼聲,強調應維護語言多元、保護一些瀕臨滅絕的地方語言,因為每種語言背後,都有緊扣地方生活的歷史智慧。

Google研手機即時傳譯‧配備聲音辨認系統

不過,如今的科技日新月異,或許將來與外國人溝通可以不再需要學外語,只需一部配備翻譯軟件的手提電話便可打破言語障礙?互聯網搜尋巨擘Google正研究將旗下的翻譯軟件及手提電話的話音識別軟件二合為一,實現外語即時傳譯。新軟件若能成功運作,毫無疑問將能改變全人類的溝通模式。

聽完整段話‧才開始傳譯

現時Google已經推出自動翻譯文字的工具Google Translate,若要翻譯整個外文網頁,只要利用Google Translate鍵入網址即可。這個工具現時覆蓋了52種語言,包括在上週才新加入的海地克里奧爾語。Google同時亦擁有一套聲音辨認系統,容許手機用戶向電話說出聲控指令進行搜索。

Google的新研究建基於上述兩種現有技術,Google希望可以在未來數年初步完成一套即時傳譯系統。新技術將能夠明白手機使用者的說話,並將它們翻譯成指定外語。當然,所謂“即時傳譯”還是會有一點滯後:就如一個專業的人類翻譯員,電話會分析一整段說話,一直聆聽說話一方直到電腦完全明白句子意思後,才開始進行傳譯。

Google翻譯服務部門的負責人奧齊(Franz Och)說:“我們認為即時傳譯技術能得到實現,並將在未來的數年內得到良好的應用。為了讓這項功能順利運作,我們希望將高精確度的翻譯系統及語音識別系統進行整合,這是我們目前的工作目標。若你有留意機械翻譯以及聲音辨識發展,(你會發現)這兩個系統最近得到了重大發展。”

口音差異阻語音識別發展

奧齊承認,語音識別發展仍面臨重大挑戰,皆因“每個人都有不同的聲音,口音以及速度……但手機的語音辨認系統應更有效,因為手機本身就是非常個人化的用具。(配備語音辨識系統的)手機可從你過往的語音搜查記錄,‘掌握’到你的口音和說話內容。”他表示,就翻譯系統而言,系統的使用次數愈多,精確度就愈高。

他聲稱,與其他翻譯系統簡單粗略的文法翻譯規則不同,Google的翻譯系統是透過龐大的資料庫進行檢索再作出翻譯,從而改進翻譯結果。奧齊說:“我們所輸入的資料愈多,翻譯質量就愈高。”他表示不用擔心不夠人輸入資料,“目前有許多的翻譯愛好者”。

但是一些專家質疑,機械即時傳譯所面臨的挑戰仍然十分巨大。班戈大學的語言學名譽教授克里斯特爾(David Crystal)說:“語音識別的困難在於口音的差異。目前還沒有任何一個系統能有效解決這問題。也許Google能夠比其他人更快的解決這一問題,但是我不認為在未來數年就有一個語音系統可以處理高速的(蘇格蘭)格拉斯哥方言。但就長遠的未來而言,這是個非常有趣的工作。”(香港明報)

星洲互動‧2010.02.08

環球故事: 意大利:最矮男人病逝

(意大利‧羅馬)身高74.6厘米(2呎5吋)的全球最矮男人、中國內蒙古的何平平,早前在意大利羅馬拍攝節目時突感心臟不適,上週六(3月13日)在醫院病逝,年 ...

環球故事: 泰國:準備血灑首相府

(泰國)泰國週一(3月15日)發生紅衫軍新一浪示威潮以來,首宗暴力襲擊事件。曼谷一個軍營週一下午遭榴彈炮襲擊,兩名士兵受傷。至於紅衫軍則一度包圍首相阿比希 ...

環球故事: 泰國:給首相最後通牒

(泰國‧曼谷)泰國首都曼谷今日(週日,3月14日)將出現一片紅海,數以萬計支持前首相塔辛的“紅衫軍”將舉行近年最大型的示威,他們向首相阿比希發出最後通牒, ...

環球故事: 中國:高鐵市場新黑馬

(中國‧北京)中國欲建設一條延伸到俄羅斯、中亞以及東亞17個國家的高速鐵路網,把中國和歐亞大陸諸國連成一體,引發各界關注。

環球故事: 柬埔寨:麻風果煉柴油

(柬埔寨)柬埔寨首家以麻風果實提煉生化柴油的公司,計劃於3月中旬將產能提昇至每天600公升。NCT Jacam能源有限公司總裁崔素波接受《柬埔寨星洲日報》 ...

環球故事: 中國:帥丐身世大曝光

(中國)“那憂鬱的眼神,唏噓的胡碴子,還有那雜亂的頭發,都深深地迷住了我。”早前,一個乞丐網帖突然在中國互聯網絡上走紅,帖內敘述的是一個被網友譽為“究極華 ...

環球故事: 日本:公主上學被欺負

(日本)日本校園欺凌文化嚴重,日本宮內廳週五(3月5日)表示,皇太子德仁的8歲女兒愛子,在學校裡對多名男同學的粗暴行為,感到極度不安,並覺得肚痛,3月初開 ...

環球故事: 香港:未婚媽媽守護者

(香港)未婚媽媽阿慈18歲懷孕,當時她相信,男友承諾在外國完成學業便回港結婚。隨著肚子愈來愈大,另一半卻不知所終,懷孕期間幸得到“護航大使”義工貞姨與丈夫 ...