係統粉 > IT資訊 > 微軟資訊

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋

發布時間:2019-12-25    瀏覽數:
十三 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

研究是為了實現一個長期目標,通常是漸進式的發展過程。

隨著歲末鍾聲的臨近,微軟研究院回顧了這一年來在人工智能領域中的工作。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(1)

微軟研究院表示:

總體來說,研究大盤點包括以下幾個方麵:

· 讓AI和機器學習係統更容易被訪問;
· 促進了”以人為本“的創新研究;
· 創建適合所有人的人機交互;
· 安全、存儲、係統以及應用方麵的突破;
· 為研究社區提供開源工具和數據;
· 為研究團體提供獎學金

此外,沈向陽博士於前不久宣布離職微軟。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(2)

微軟研究院在此次複盤中也與沈向洋博士道了聲”再見“。

提高AI和機器學習的可訪問性

機器學習很顯然對人們的生活產生了一定影響。

那麼微軟的研究人員在這一年中做了些什麼呢?

提高機器學習係統的能力,進一步發展這一科學的新模式。

他們使用了一些特殊方法讓這些係統能夠更容易被訪問。

在深度學習方麵,微軟研究院合作研究經理高劍峰博士的團隊,提出了MT-DNN模型。

這是一個學習通用語言嵌入的模型,結合了多任務學習的優勢和BERT的語言模型預訓練,幫助係統快速發展自然語言處理所必需的語義理解。

MT-DNN地址:
https://www.microsoft.com/en-us/research/blog/towards-universal-language-embeddings/

微軟研究院Xu Tan的團隊則開發了MASS。

這是一種預訓練方法,在序列到序列的語言生成方麵優於現有模型。

MASS地址:
https://www.microsoft.com/en-us/research/blog/introducing-mass-a-pre-training-method-that-outperforms-bert-and-gpt-in-sequence-to-sequence-language-generation-tasks/

而在未來幾年裏,將會出現機器學習的突破。

能夠超越目前將使用馬爾科夫決策過程作為基礎的方法,尤其是強化學習,會變得更加適用於現實場景。

項目地址:
https://www.microsoft.com/en-us/research/blog/reinforcement-learning-for-the-real-world-with-dr-john-langford-and-rafah-hosn/

許多機器學習應用程序受益於龐大的數據集,然而也有很多應用是沒有足夠的數據來證明其方法是有效的。

進入機器教學(machine teaching)領域,領域專家可以用很少的數據建立定製的人工智能模型。

項目地址:
https://www.microsoft.com/en-us/research/blog/machine-teaching-luis-and-the-democratization-of-custom-ai-with-dr-riham-mansour/

另外一個讓AI較為民主化的項目是研究院與Justin Harris合作的區塊鏈框架上的分散與協作人工智能。

它可以讓用戶在以太網上訓練和維護模型和數據集。

此外,微軟研究院首席研究員Debadeepta Dey在今年的NeurIPS上提出了Petridish項目。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(3)

△超過300名微軟研究人員參與了NeurIPS 2019

這是一種高效的前向神經結構搜索算法,它可以幫助識別給定機器學習任務的神經結構。

項目地址:
https://www.microsoft.com/en-us/research/blog/project-petridish-efficient-forward-neural-architecture-search/

促進負責、包容、以人為本的創新

2019年ACM FAT *大會在亞特蘭大舉行。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(4)

微軟研究院在會議上發表了四篇論文,分別涵蓋了職業分類中的性別偏見、數據驅動決策在加強不公正方麵的作用、算法決策係統的戰略操縱,以及在沒有資金的情況下公平分配項目。

這些工作來自微軟的 FATE 研究小組,該小組研究人工智能、機器學習、數據科學、大規模實驗和自動化的複雜社會影響。

在五月份的CHI大會上,研究員Saleema Amershi與其合作者提出了一套人機交互設計的指導方案,彙集了20多年的研究、建議和最佳實踐,圍繞著與人工智能係統的有效交互。

把這些工作結合在一起,將有助於設計師管理用戶的期望,調節自治的程度,解決模糊性,並向用戶提供係統如何從用戶的行為中學習意識。

項目地址:
https://www.microsoft.com/en-us/research/blog/guidelines-for-human-ai-interaction-design/

此外,開源模擬器 AirSim今年舉辦了無人機的NeurIPS比賽。

在無人駕駛飛機挑戰賽中,參賽者與微軟研究院的一名對手在同一跑道上進行競爭,他們的策略和機動水平通常是同類競賽所沒有的。

項目地址:
https://www.microsoft.com/en-us/research/blog/game-of-drones-at-neurips-2019-simulation-based-drone-racing-competition-built-on-airsim/

創建適合所有人的人機交互

在ACM CHI關於計算係統中的人為因素的會議上,微軟研究人員展示了一些論文和演示,探索如何為有認知或感覺障礙的用戶提供可訪問性。

這些研究包括:瀏覽器的“閱讀模式”是否真的對患有閱讀障礙的人有幫助,以及幫助低視力的人(包括亮度敏感度和低視力)更容易接觸到VR的工具。

還展示了微軟的Soundscape,這是一個使用3D音頻提示來增強態勢感知和輔助導航的項目。

項目地址:
https://www.microsoft.com/en-us/research/product/soundscape/features/

此外,還有一些使虛擬環境更加真實、可觸摸和可導航的項目。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(5)

△微軟Dreamwalker VR

Dreamwalker是一個虛擬現實項目,可以通過虛擬現實增強真實世界的行走體驗。虛擬環境可以實時檢測用戶周圍的環境,並生成一個虛擬世界,說明他們的路徑和任何障礙。

項目地址:
https://www.microsoft.com/en-us/research/publication/dreamwalker-substituting-real-world-walking-experiences-with-a-virtual-reality/

安全、存儲、係統和應用方麵的突破

同態加密技術的發展和采用在2019年取得了持續的進展。同態加密技術可以在加密數據上進行計算,有助於保護隱私。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(6)

Microsoft SEAL已經成為世界上最流行的同態加密庫之一,在學術界和工業界都得到了廣泛的采用。

項目地址:
https://github.com/Microsoft/SEAL

今年4月,隨著EverCrypt的發布,Project Everest又向前邁進了一步,建立了一個安全認證的HTTPS生態係統。

其中,EverCrypt是第一個完全認證的密碼提供商,滿足了TLS協議的安全需求。Project Everest是微軟、Inria和卡內基梅隆大學的合作項目。

項目地址:
https://www.microsoft.com/en-us/research/blog/evercrypt-cryptographic-provider-offers-developers-greater-security-assurances/

到2023年,預計將有超過100 ZB的數據存儲在雲裏。

為了滿足這一需求,Project Silicon正在開發第一個從媒體設計到雲計算使用的存儲技術。

項目地址:
https://www.microsoft.com/en-us/research/project/project-silica/

今年,這個團隊與華納兄弟公司(Warner Bros.)合作進行了一項概念驗證,把1978年的電影《超人》(Superman)裝在一塊幾乎堅不可摧的玻璃上,大小和杯墊差不多。

項目地址:
https://www.microsoft.com/en-us/research/blog/optics-for-the-cloud-storage-in-the-zettabyte-era-with-dr-ant-rowstron-and-mark-russinovich/

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(7)

與此同時,今年4月,微軟和華盛頓大學的研究人員實現了一個“Hello, World!”,他們展示了首個以人工合成的DNA存儲和檢索數據的全自動係統。

項目地址:
https://news.microsoft.com/innovation-stories/hello-data-dna-storage/?utm_source=elevate&utm_campaign=1385

劍橋大學的研究人員 Andy Gordon 和 Simon Peyton Jones 通過探索編程語言研究如何改進電子表格這一世界上最常見的商業應用,展示了基礎研究的實際影響。

在下麵的項目中,他們詳細介紹了他們與Microsoft Excel團隊的合作是如何改進產品的,比如單元格可以包含與外部數據源鏈接的一級記錄,以及可以計算“溢出”到相鄰單元格的數組值的公式。

項目地址:
https://www.microsoft.com/en-us/research/blog/influencing-mainstream-software-applying-programming-language-research-ideas-to-transform-spreadsheets/

在 ACM 網絡搜索和數據挖掘國際會議上,微軟的研究人員展示了一項關於極端分類的新研究。

極端分類是一個研究領域,有望顯著提高算法的速度和質量。這項工作可以帶來更多相關的推薦和搜索結果。

在下麵這篇二月份的博文中,印度微軟研究院的 Manik Varma 對極端分類進行了深入探討。

項目地址:
https://www.microsoft.com/en-us/research/blog/everything-you-always-wanted-to-know-about-extreme-classification-but-were-afraid-to-ask/

由於計算機視覺技術的進步,尤其是視頻目標檢測和分類技術的進步,視頻分析已經變得更加精確。

然而,快速而實用的實時視頻分析卻相對滯後。

去年12月,微軟研究人員 Ganesh Ananthanarayanan 和 Yuanchao Shu 主持了一個關於 Project Rocket 的網絡研討會,這是一個可擴展的軟件棧,利用邊緣和雲來滿足視頻分析應用的需求。

項目地址:
https://www.microsoft.com/en-us/research/project/live-video-analytics/

為研究社區提供開源工具和數據

在這一年中,微軟的研究人員為了學術界的利益,做了一些開源項目,包括以下內容:

SandDance:是 Azure Data Studio、 Visual Studio Code 和 Power BI 中的數據可視化工具。
地址:https://cloudblogs.microsoft.com/opensource/2019/10/10/microsoft-open-sources-sanddance-visual-data-exploration-tool/

TensorWatch:是一個人工智能調試和可視化工具。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-makes-ai-debugging-and-visualization-tool-tensorwatch-open-source/

PhoneticMatching:是 Maluuba 自然語言理解平台的一個組成部分。
地址:https://www.microsoft.com/en-us/research/blog/a-phonetic-matching-made-in%cb%88h%c9%9bv%c9%99n/

SpaceFusion:是一個學習範例,它將不同的深度學習模型彙集到一起,用於人工智能對話。
地址:https://www.microsoft.com/en-us/research/blog/spacefusion-structuring-the-unstructured-latent-space-for-conversational-ai/

Icecaps:一個會話建模工具包。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-icecaps-an-open-source-toolkit-for-conversation-modeling/

Icebreaker:一個深層次的生成模型,最小化訓練一個機器學習模型所需的數據量和成本。
地址:https://www.microsoft.com/en-us/research/blog/icebreaker-new-model-with-novel-element-wise-information-acquisition-method-reduces-cost-and-data-needed-to-train-machine-learning-models/

基於去年發布的Microsoft Research Open Data(一個基於Azure的數據共享庫),公司開發了一套數據使用協議,並在GitHub上發布,可將其應用於多個公共數據集。

支持和尊重研究團體

今年,微軟研究院推出了Ada Lovelace獎學金,用來支持計算機相關領域攻讀博士學位的人才。

微軟年度研究大盤點:ML突破將到來,人機交互更真實,惜別沈向洋(8)

有關他們的研究可以訪問下麵的鏈接:
https://www.microsoft.com/en-us/research/academic-program/ada-lovelace-fellowship/#!fellows

10名博士生還獲得了為期兩年的獎學金(作為博士獎學金項目的一部分),用來支持他們在光子學、係統和網絡以及人工智能方麵的研究。

此外,微軟研究院將獎學金授予了五位從事高影響力突破性研究的教師。

有關他們的研究可以訪問下麵的鏈接:
https://www.microsoft.com/en-us/research/blog/investing-in-leading-minds-microsoft-research-faculty-fellowship/

微軟研究院的研究人員在本年度獲得了許多獎項和榮譽,完整名單如下:
https://www.microsoft.com/en-us/research/awards/

最後,要和沈向洋博士說一聲再見。

沈向陽博士已經在微軟就職23年,將於明年2月份離職。

傳送門

微軟研究院博客:
https://www.microsoft.com/en-us/research/blog/microsoft-research-2019-reflection-a-year-of-progress-on-technologys-toughest-challenges/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

上一篇:Win10裏的隱藏小技巧你都知道嗎 下一篇:CPU占用率高怎麼解決?Win10係統電腦CPU占用率100%的解決方法

相關資訊

最新熱門應用

電腦問答