係統粉 > IT資訊 > 微軟資訊

微軟AI Lab:助你從零開始成為AI開發者

發布時間:2018-07-27    瀏覽數:

在今年的Build大會上,微軟推出了人工智能開放項目平台——AI Lab,旨在幫助規模龐大且正在快速增長的開發者隊伍來探索、學習和使用微軟AI平台的最新技術,探索自己的第一個人工智能項目。

微軟AI Lab:助你從零開始成為AI開發者(1)

AI Lab目前開放了五個人工智能項目,展示了微軟自定義視覺服務(Custom Vision Service)、AttnGAN、Visual Studio Tools for AI、Cognitive Search、機器閱讀理解等最新技術的使用。在每個項目中,開發人員都可以訪問GitHub上的開源代碼,嚐試Demo演示,還可以觀看清晰的介紹視頻,從而獲得對人工智能潛在的商業問題和解決方案的深入理解。

繪畫機器人

繪畫機器人(DrawingBot)是由微軟研究院人工智能實驗室的研究人員開發的,能根據文本信息繪製出相應圖像的模型。DrawingBot的核心技術是GAN網絡(Generative Adversarial Network),其中包含兩個機器學習模型,一個模型根據文本描述生成圖像,另一個模型用文本描述去鑒別生成圖像的真實性。如果生成的圖像和文字描述相差甚遠,就無法通過鑒別模型的檢測,因此GAN網絡通過兩個模型的合作,能夠使生成的圖像越來越接近本文所描述的內容。然而,GAN網絡對“一隻藍色的鳥”、“一棵常青樹”這樣比較簡單的文字描述能生成效果較好的圖像,而對於“一隻綠冠紅腹、黃色翅膀的鳥”這樣複雜的描述,生成的圖像還不那麼盡如人意。

想象一下,如果讓我們來根據一段描述畫一幅畫,我們會怎麼做?通常來說,我們會在這個過程中不斷地參考文本描述,尤其是正在繪製的區域所對應的那部分文字。基於這個啟發,研究人員將GAN網絡改進為AttnGAN網絡(attentional GAN),用數學表達來模擬人類的這種注意力特征,將輸入的文本分解為單個的單詞,將單個單詞與待生成圖像的特定區域相匹配。根據CVPR上的一篇研究論文的測試結果,這種方法使生成圖像的質量提高了近三倍。

微軟AI Lab:助你從零開始成為AI開發者(2)

項目鏈接:https://www.ailab.microsoft.com/experiments/1e9e1eef-2ab1-41f1-b341-0118f414bd78

微軟AI Lab:助你從零開始成為AI開發者(3)

JFK文件演示

為了幫助用戶更好地了解美國總統肯尼迪被暗殺的整個事件,微軟的研究人員利用Azure搜索服務和微軟認知服務開發了一個應用程序,能夠自動分析與暗殺有關的所有解密文件,並將原始文檔整理成結構化的信息。

JFK文件演示背後的核心技術是Cognitive Search,這是微軟在Build大會上發布的一項基於AI的內容理解技術,由內置認知服務功能的Azure搜索提供支持,能從任何內容資源中提取數據,並運用可組合的認知功能從數據中提取需要的知識。這些知識將被整理和存儲在索引中,優化搜索數據的體驗。Cognitive Search能方便快捷地利用雲和AI的強大力量處理數據,當我們第一次將它應用於JFK文件演示係統時,效果令人驚歎,我們提出的許多有趣的問題不僅可以獲得回答,還可以在原始文件中看到答案和問題之間的關係。JFK文件演示係統能使我們的客戶輕鬆將其應用到自己的領域、回答他們所需要的問題。

微軟AI Lab:助你從零開始成為AI開發者(4)

項目鏈接:https://www.ailab.microsoft.com/experiments/7d6b0652-51dc-440d-a12a-481f28525143

風格遷移

風格遷移(Style Transfer)是一種對圖片風格進行轉換的技術,能從一張圖片中提取出風格並應用到另一張圖片中,也就是我們常見的“濾鏡”功能。這個項目展示了如何訓練和部署深度學習模型,開發一個簡單有趣的風格遷移應用。

微軟AI Lab:助你從零開始成為AI開發者(5)

風格遷移項目使用Visual Studio Tools for AI來訓練和部署深度學習模型。Visual Studio Tools for AI能讓開發者在本地開發機器上輕鬆部署Keras + Tensorflow模型的訓練代碼,然後上傳到Azure VM上,利用強大的Nvidia GPU來訓練模型,大大提高工作效率。我們在提高模型訓練速度的同時,在生成圖像中保留了與原始圖像的語義相似性。此外,Visual Studio Tools for AI還能直接從訓練好的TensorFlow模型生成C#代碼,無需再手動重新編寫。使用全新的Microsoft.ML.Scoring庫,開發者可以便捷地在應用中使用TensorFlow或ONNX模型,在設備端或者雲端運行。

微軟AI Lab:助你從零開始成為AI開發者(6)

風格遷移隻是采用訓練機器學習模型方法的應用之一,在應用中使用機器學習技術的過程本質上是相同的。開發者可以使用Tensorflow或CNTK等框架自行訓練模型,也可以使用Azure認知服務等預先訓練的AI模型。

項目鏈接:https://www.ailab.microsoft.com/experiments/99907c05-d487-450b-9ee9-901b40205e81

機器閱讀理解

機器閱讀理解(MRC)是讓計算機根據給定的上下文來回答問題,需要對上下文和問題之間的複雜交互進行建模。微軟的研究人員采用新的神經網絡ReasoNet(Reasoning Network)來模仿人類閱讀時的推理過程:ReasoNets會帶著問題反複閱讀文檔,每次關注文檔的不同部分,直到給出令人滿意的答案。

微軟AI Lab:助你從零開始成為AI開發者(7)

同時,微軟亞洲研究院的研究人員也提出一種獨特的R-NET算法,使機器閱讀理解能力在SQUAD數據集上超越了人類平均水平。R-NET是一個端到端的深度學習模型。模型分為四層,最下麵一層給問題和文本中的每一個詞做一個表示,即深度學習裏的向量;第二步,將問題中的向量和文本中的向量做一個比對,找出與問題接近的文字部分。接下來,將結果放在全局中進行比對。這些都是通過注意力機製(attention)達到的。最後一步,針對挑出的答案候選區中的每一個詞彙進行預測,哪一個詞是答案的開始,到哪個詞是答案的結束。這樣,係統會挑出可能性最高的一段文本,最後將答案輸出出來。

當我們將這些機器閱讀理解算法用於由沈向洋和Brad Smith撰寫的《未來計算:人工智能及社會角色》一書時,機器閱讀理解回答了大量有趣的問題。機器閱讀理解技術能夠應用於企業級數據處理,幫助客戶回答特定領域的問題。

微軟AI Lab:助你從零開始成為AI開發者(8)

項目鏈接:https://www.ailab.microsoft.com/experiments/ef90706b-e822-4686-bbc4-94fd0bca5fc5

Drones + AirSim

Drones + AirSim是一項有趣的模擬“搜索與拯救”的任務。我們先在AirSim中創建了一個3D環境來模擬微軟園區中的足球場,將各種動物放置在球場中;創建了一個Python腳本模擬無人機,它可以在球場中自由拍攝照片。然後我們將無人機拍攝的圖像上傳至Azure自定義視覺(Custom Vision)服務,訓練模型來識別圖像中的動物,利用Azure IoT Edge將訓練好的模型部署到無人機上。於是,無人機能夠在足球場中飛行、拍照,並實時識別出畫麵中的動物。這一項目能夠讓用戶了解實時自定義的AI如何在無人機這樣的邊緣設備上運行。

微軟AI Lab:助你從零開始成為AI開發者(9)

項目鏈接:https://www.ailab.microsoft.com/experiments/92262b36-de2e-444e-86ca-8bcb8bd02454

微軟AI Lab:助你從零開始成為AI開發者(10)

上一篇:微軟正式發布第六代小冰 商業化的四個方向 下一篇:微軟12年視覺專家危夷晨出山,掛帥曠視上海研究院

相關資訊

最新熱門應用

電腦問答