機器翻譯新突破，微軟中英新聞翻譯達人類水平

發布時間：2018-03-15 瀏覽數：

翻譯沒有唯一標準答案，它更像一種藝術。

AI科技評論消息：14日晚，微軟亞洲研究院與雷德蒙研究院的研究人員宣布，其研發的機器翻譯係統在通用新聞報道測試集newstest2017的中-英測試集上，達到了可與人工翻譯媲美的水平；這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯係統。

newstest2017測試集由來自產業界和學術界的團隊共同開發完成，並於2017年在WMT17大會上發布。而新聞（news）測試集則是三類翻譯測試集中的一個，其他兩類為生物醫學（biomedical）和多模式（multimodal）。

四大技術

我們知道，對於同一個意思人類可以用不同的句子來表達，因此翻譯並沒有標準答案，即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯，而且兩個人的翻譯都不錯。微軟亞洲研究院副院長、自然語言計算組負責人周明表示：“這也是為什麼機器翻譯比純粹的模式識別任務複雜得多，人們可能用不同的詞語來表達完全相同的意思，但未必能準確判斷哪一個更好。”

這也是為什麼科研人員在機器翻譯上攻堅了數十年，甚至曾經很多人都認為機器翻譯永遠不可能達到人類翻譯的水平。近兩年隨著深度神經網絡的引入，機器翻譯的表現取得了很多顯著的提升，翻譯結果相較於以往的統計機器翻譯結果更加的自然流暢。

據了解，在這次的工作中來自微軟亞洲研究院和雷德蒙研究院的三個研究組通過多次交流合作，將他們的研究工作相結合，再次更進一步地提高了機器翻譯的質量，其中用到的技術包括對偶學習（Dual Learning）、推敲網絡（Deliberation Networks）、聯合訓練（Joint Training）和一致性規範（Agreement Regularization）等。

對偶無監督學習框架

對偶學習，即利用任務的對偶結構來進行學習。例如，在翻譯領域，我們關心從英文翻譯到中文，也同樣關心從中文翻譯回英文。由於存在這樣的對偶結構，兩個任務可以互相提供反饋信息，而這些反饋信息可以用來訓練深度學習模型。也就是說，即便沒有人為標注的數據，有了對偶結構也可以做深度學習。另一方麵，兩個對偶任務可以互相充當對方的環境，這樣就不必與真實的環境做交互，兩個對偶任務之間的交互就可以產生有效的反饋信號。因此，充分地利用對偶結構，就有望解決深度學習和增強學習的瓶頸——訓練數據從哪裏來、與環境的交互怎麼持續進行等問題。

推敲網絡的解碼過程

推敲網絡中的“推敲”二字可以認為是來源於人類閱讀、寫文章以及做其他任務時候的一種行為方式，即任務完成之後，並不當即終止，而是會反複推敲。微軟亞洲研究院機器學習組將這個過程沿用到了機器學習中。推敲網絡具有兩段解碼器，其中第一階段解碼器用於解碼生成原始序列，第二階段解碼器通過推敲的過程打磨和潤色原始語句。後者了解全局信息，在機器翻譯中看，它可以基於第一階段生成的語句，產生更好的翻譯結果。

聯合訓練：從源語言到目標語言翻譯（Source to Target）P(y|x) 與從目標語言到源語言翻譯（Target to Source）P(x|y)

聯合訓練可以認為是從源語言到目標語言翻譯（Source to Target）的學習與從目標語言到源語言翻譯（Target to Source）的學習的結合。中英翻譯和英中翻譯都使用初始並行數據來訓練，在每次訓練的迭代過程中，中英翻譯係統將中文句子翻譯成英文句子，從而獲得新的句對，而該句對又可以反過來補充到英中翻譯係統的數據集中。同理，這個過程也可以反向進行。這樣雙向融合不僅使得兩個係統的訓練數據集大大增加，而且準確率也大幅提高。