微軟AI新里程碑!機器翻譯大突破 中翻英可達人類水平

▲微軟技術院士黃學東。(圖/獵雲網提供)

▲微軟技術院士黃學東表示,在機器翻譯任務中達到人類水平是我們所有人的夢想。(圖/獵雲網提供)

圖、文/獵雲網(ilieyun)

一組微軟研究團隊於本週3/14(三)宣布,他們已經創造了第一個能夠將中文新聞翻譯成英文的機器翻譯系統,精確度與人類譯者一致。該公司表示,它通過來自各種在線報紙的約2000條語句樣本對這一系統進行了反複測試,並將測試結果與人類譯者的翻譯進行了比較,它還甚至聘請了外部的雙語顧問來進一步驗證機器的精確度。

這一被稱為newstest2017的樣本集已於去年秋天在研究會議WMT17上發布。令人感到驚訝的是研究人員能夠如此快速的達到這一里程碑,尤其是機器翻譯是人們幾十年來一直在試圖解決的問題。

微軟指出,許多人甚至認為達到與人類相同水平的目標可能永遠無法實現。

負責微軟語音、自然語言和機器翻譯工作的技術專家黃學東,在微軟的一篇博文中表示:「在機器翻譯任務中達到人類水平是我們所有人的夢想,我們只是沒有意識到能夠這麼快實現這一目標。」

讓機器在這一規模上理解語言遠比語音識別複雜得多。AI和語音識別的進步讓語音助手能夠嵌入我們的智能手機之中,幫助消費者處理日常計算任務,控制智能家居設備以及用於新聞和娛樂目的。

但是要求機器對網頁或新聞文章進行翻譯往往會出現難以理解的單詞混亂,雖然可以讓你對所說的內容有一個大致的了解,卻無法進行深度的理解。

要真正理解長篇文章中的內容,你需要人的幫助。

但不同的人工翻譯會以一種稍微不同的方式來翻譯一個句子。

「機器翻譯要比單純的模式識別任務複雜得多,」微軟亞洲研究院助理總監兼自然語言處理小組負責人周明說道。「人們可以使用不同的單詞來表達相同的意思,但你無法判斷哪一種更好。」

微軟還指出,最近在AI方面取得的進展,為研究人員實現這一里程碑作出了貢獻。

深度神經網絡——一種訓練AI系統的方法,允許研究人員創造更加流利自然的翻譯,並考慮到更廣泛的內容背景,這一超前的方法被稱之為統計機器翻譯。

微軟的研究人員還在系統中增加了他們自己的訓練方法,以提高其精確度。這些方法類似於人們如何重複自己的工作時間,並再次確認是否正確的過程。

研究人員表示,他們使用的方法包括雙重學習的事實檢查翻譯;審議網絡,進行重複翻譯和改進;聯合訓練等新技術,以迭代促進英到中和中到英翻譯系統;以及協議正規化,即通過左到右和右到左閱讀語句來生成翻譯。

周明表示,用於實現這一里程碑的技術不會局限於機器翻譯。

「這是機器翻譯研究可以應用於人工智能研究全部領域的領域,」周明表示。

此外,它可以在未來讓其他語言的翻譯更加準確和自然。研究人員表示,這一系統尚未在實時新聞報導中測試過,在該技術被商業化到微軟產品前還有其他的挑戰需要解決。

▲系統將顯示一個中文(簡體)句子,然後以兩種方式進行翻譯。(圖/獵雲網提供)

▲系統將顯示一個中文(簡體)句子,然後以兩種方式進行翻譯。(圖/獵雲網提供)

但是你可以在微軟的網站上使用這一新的翻譯系統:https://translator.microsoft.com/neural。

系統將顯示一個中文(簡體)句子,然後以兩種方式進行翻譯,右邊的翻譯會更加完善以表明這一技術的先進性。

機器翻譯是谷歌的研究人員一直致力於研究的內容,包括使用谷歌的機器學習技術進行中英文查詢。這些進展已經付諸實施,以改進谷歌面向消費者的產品,比如谷歌翻譯應用,以及谷歌搜索的整合。

●作者:何棄療;編譯:福爾摩望,獵雲網原創文章未經授權轉載必究,如需轉載請聯繫官方微信號進行授權。
●轉載時須在文章頂端明確註明出處、保留官方微信、作者和原文超連結如轉自獵雲網 (微信號:ilieyun)字樣。
●獵雲網報導中所涉及的融資金額均由創業公司提供,僅供參考,獵雲網不對真實性背書。

分享給朋友:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面