剛剛，微軟宣布重大裏程碑：中英機器翻譯水平可“與人類媲美”

發布時間：2018-03-14 瀏覽數：

3月14日消息根據微軟亞洲研究院消息，今天，微軟研究團隊宣布其研發的機器翻譯係統在通用新聞報道測試集newstest2017的中-英測試集上達到了人類水平，這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯係統。該係統模型包含了由微軟亞洲研究院研發的對偶學習、推敲網絡、聯合訓練和一致性規範技術。機器翻譯是自然語言處理領域最具挑戰性的研究任務之一。

剛剛，微軟宣布重大裏程碑：中英機器翻譯水平可“與人類媲美”(1)

newstest2017新聞報道測試集由產業界和學術界的合作夥伴共同開發，並於去年秋天在WMT17大會上發布。為了確保翻譯結果準確且達到人類的翻譯水平，微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。

剛剛，微軟宣布重大裏程碑：中英機器翻譯水平可“與人類媲美”(2)

微軟技術院士，負責微軟語音、自然語言和機器翻譯工作的黃學東稱，這是對自然語言處理領域最具挑戰性任務的一項重大突破。“在機器翻譯方麵達到與人類相同的水平是所有人的夢想，我們沒有想到這麼快就能實現。”他表示，“消除語言障礙，幫助人們更好地溝通，這非常有意義，值得我們多年來為此付出的努力。”

微軟亞洲研究院副院長、自然語言計算組負責人周明表示，在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心，但仍有很多挑戰需要我們解決，比如在實時的新聞報道上測試係統等。

微軟機器翻譯團隊研究經理Arul Menezes表示，團隊想要證明的是：當一種語言對（比如中-英）擁有較多的訓練數據，且測試集中包含的是常見的大眾類新聞詞彙時，那麼在人工智能技術的加持下機器翻譯係統的表現可以與人類媲美。

沒有“正確的”翻譯結果

newstest2017新聞報道測試集包括約2000個句子，由專業人員從在線報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估，每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色，微軟沒有停留在測試集本身的要求，而是從外部聘請了一群雙語語言顧問，將微軟的翻譯結果與人工翻譯進行比較。

驗證過程之複雜也從另一個側麵體現了機器翻譯要做到準確所麵臨的複雜性。對於語音識別等其它人工智能任務來說，判斷係統的表現是否可與人類媲美相當簡單，因為理想結果對人和機器來說完全相同，研究人員也將這種任務稱為模式識別任務。

然而，機器翻譯卻是另一種類型的人工智能任務，即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯，而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的“正確的”方法不止一種。周明表示：“這也是為什麼機器翻譯比純粹的模式識別任務複雜得多，人們可能用不同的詞語來表達完全相同的意思，但未必能準確判斷哪一個更好。”

複雜性讓機器翻譯成為一個極有挑戰性的問題，但也是一個極有意義的問題。劉鐵岩認為，我們不知道哪一天機器翻譯係統才能在翻譯任何語言、任何類型的文本時，都能在“信、達、雅”等多個維度上達到專業翻譯人員的水準。不過，他對技術的進展表示樂觀，因為每年微軟的研究團隊以及整個學術界都會發明大量的新技術、新模型和新算法，“我們可以預測的是，新技術的應用一定會讓機器翻譯的結果日臻完善。”

研究團隊還表示，此次技術突破將被應用到微軟的商用多語言翻譯係統產品中，從而幫助其它語言或詞彙更複雜、更專業的文本實現更準確、更地道的翻譯。此外，這些新技術還可以被應用在機器翻譯之外的其他領域，催生更多人工智能技術和應用的突破。

更多詳情內容，點此了解。