機器之心編譯
參與:李亞洲、Smith
近日,斯坦福大學、微軟聯合發表了一篇論文,提出了一種在機器理解(MC)中使用 2-階段合成網絡(SynNet) 進行遷移學習的技術。論文作者之一、前微軟人工智能首席科學家鄧力已經離職,加入對衝基金巨頭 Citadel。

我們開發了一種在機器理解(MC)中使用一個全新的 2-階段合成網絡(SynNet) 進行遷移學習的技術。在某個領域中給定一個高性能 MC,我們的技術旨在回答有關另一領域文檔的問題,其中我們使用的是無標記數據問答對。不使用提供的注釋的情況下,在 SQuAN 數據集預訓練的模型上使用我們提出的 SynNet,能夠在 NewsQA 數據集挑戰賽上取得 46.6% 的 F1 測量結果,接近領域內(in-domain) 模型的表現(F1 結果為 50.0%),超過域外(out-domain) 基線 7.6%。

圖 1:2-階段 SynNet 的圖釋。給定段落的情況下,訓練 SynNet 的目的是對問題與答案進行合成。模型的第一階段是一個答案合成模塊,使用一個雙向 LSTM 在輸入段落上預測 IOB 標簽,標記出可能是答案的關鍵語義概念。第二個階段是一個問題合成模塊,使用一個單向 LSTM 來生成問題,同時顧及段落中詞彙與 IOB id 的嵌入。盡管段落中的多個跨度(span) 可以被認為是潛在答案,但我們隻選擇了一個 span 來生成問題。

表 1:隨機采樣的段落和對應的來自 NewsAQ 訓練集的合成問題與人類問題的對比。

表 2:主要結果。使用我們的 SynNet 精調的 BIDAF 模型在 NewsQA 測試集上的精度匹配(EM)和 span F1 結果。

表 3:NewsQA 到 SQuAD。在 SQuAD 上開發的一係列 NewsQA BIDAF 模型與使用由 2-階段 SynNet 生成的數據精調的模型的 EM 和 span F1 結果對比。

表 4:Ablations Studies。使用一個 2-階段 SynNet 精調的 BIDAF 模型在 NewsQA 測試集上的精確匹配和跨距 F1 結果。

圖 2:在 SQuAD(黃色)上訓練的 BIDAF 模型基準的 NewsQA 準確率對比使用我們方法精調的模型對比在 NewsQA 上從頭開始訓練的一個模型(深藍)。
相關資訊
最新熱門應用
樂速通app官方最新版
生活實用168.55MB
下載
墨趣書法app官網最新版
辦公學習52.6M
下載
光速寫作軟件安卓版
辦公學習59.73M
下載
中藥材網官網安卓最新版
醫療健康2.4M
下載
駕考寶典極速版安卓app
辦公學習189.48M
下載
貨拉拉搬家小哥app安卓版
生活實用146.38M
下載
烘焙幫app安卓最新版
生活實用22.0M
下載
喬安智聯攝像頭app安卓版
生活實用131.5M
下載
駕考寶典科目四app安卓版
辦公學習191.55M
下載
九號出行
旅行交通133.3M
下載