在今年的Build大會上,微軟推出了人工智能開放項目平台——AI Lab,旨在幫助規模龐大且正在快速增長的開發者隊伍來探索、學習和使用微軟AI平台的最新技術,探索自己的第一個人工智能項目。

AI Lab目前開放了五個人工智能項目,展示了微軟自定義視覺服務(Custom Vision Service)、AttnGAN、Visual Studio Tools for AI、Cognitive Search、機器閱讀理解等最新技術的使用。在每個項目中,開發人員都可以訪問GitHub上的開源代碼,嚐試Demo演示,還可以觀看清晰的介紹視頻,從而獲得對人工智能潛在的商業問題和解決方案的深入理解。
繪畫機器人繪畫機器人(DrawingBot)是由微軟研究院人工智能實驗室的研究人員開發的,能根據文本信息繪製出相應圖像的模型。DrawingBot的核心技術是GAN網絡(Generative Adversarial Network),其中包含兩個機器學習模型,一個模型根據文本描述生成圖像,另一個模型用文本描述去鑒別生成圖像的真實性。如果生成的圖像和文字描述相差甚遠,就無法通過鑒別模型的檢測,因此GAN網絡通過兩個模型的合作,能夠使生成的圖像越來越接近本文所描述的內容。然而,GAN網絡對“一隻藍色的鳥”、“一棵常青樹”這樣比較簡單的文字描述能生成效果較好的圖像,而對於“一隻綠冠紅腹、黃色翅膀的鳥”這樣複雜的描述,生成的圖像還不那麼盡如人意。
想象一下,如果讓我們來根據一段描述畫一幅畫,我們會怎麼做?通常來說,我們會在這個過程中不斷地參考文本描述,尤其是正在繪製的區域所對應的那部分文字。基於這個啟發,研究人員將GAN網絡改進為AttnGAN網絡(attentional GAN),用數學表達來模擬人類的這種注意力特征,將輸入的文本分解為單個的單詞,將單個單詞與待生成圖像的特定區域相匹配。根據CVPR上的一篇研究論文的測試結果,這種方法使生成圖像的質量提高了近三倍。

項目鏈接:https://www.ailab.microsoft.com/experiments/1e9e1eef-2ab1-41f1-b341-0118f414bd78
JFK文件演示為了幫助用戶更好地了解美國總統肯尼迪被暗殺的整個事件,微軟的研究人員利用Azure搜索服務和微軟認知服務開發了一個應用程序,能夠自動分析與暗殺有關的所有解密文件,並將原始文檔整理成結構化的信息。
JFK文件演示背後的核心技術是Cognitive Search,這是微軟在Build大會上發布的一項基於AI的內容理解技術,由內置認知服務功能的Azure搜索提供支持,能從任何內容資源中提取數據,並運用可組合的認知功能從數據中提取需要的知識。這些知識將被整理和存儲在索引中,優化搜索數據的體驗。Cognitive Search能方便快捷地利用雲和AI的強大力量處理數據,當我們第一次將它應用於JFK文件演示係統時,效果令人驚歎,我們提出的許多有趣的問題不僅可以獲得回答,還可以在原始文件中看到答案和問題之間的關係。JFK文件演示係統能使我們的客戶輕鬆將其應用到自己的領域、回答他們所需要的問題。

項目鏈接:https://www.ailab.microsoft.com/experiments/7d6b0652-51dc-440d-a12a-481f28525143
風格遷移風格遷移(Style Transfer)是一種對圖片風格進行轉換的技術,能從一張圖片中提取出風格並應用到另一張圖片中,也就是我們常見的“濾鏡”功能。這個項目展示了如何訓練和部署深度學習模型,開發一個簡單有趣的風格遷移應用。

風格遷移項目使用Visual Studio Tools for AI來訓練和部署深度學習模型。Visual Studio Tools for AI能讓開發者在本地開發機器上輕鬆部署Keras + Tensorflow模型的訓練代碼,然後上傳到Azure VM上,利用強大的Nvidia GPU來訓練模型,大大提高工作效率。我們在提高模型訓練速度的同時,在生成圖像中保留了與原始圖像的語義相似性。此外,Visual Studio Tools for AI還能直接從訓練好的TensorFlow模型生成C#代碼,無需再手動重新編寫。使用全新的Microsoft.ML.Scoring庫,開發者可以便捷地在應用中使用TensorFlow或ONNX模型,在設備端或者雲端運行。

風格遷移隻是采用訓練機器學習模型方法的應用之一,在應用中使用機器學習技術的過程本質上是相同的。開發者可以使用Tensorflow或CNTK等框架自行訓練模型,也可以使用Azure認知服務等預先訓練的AI模型。
項目鏈接:https://www.ailab.microsoft.com/experiments/99907c05-d487-450b-9ee9-901b40205e81
機器閱讀理解機器閱讀理解(MRC)是讓計算機根據給定的上下文來回答問題,需要對上下文和問題之間的複雜交互進行建模。微軟的研究人員采用新的神經網絡ReasoNet(Reasoning Network)來模仿人類閱讀時的推理過程:ReasoNets會帶著問題反複閱讀文檔,每次關注文檔的不同部分,直到給出令人滿意的答案。

同時,微軟亞洲研究院的研究人員也提出一種獨特的R-NET算法,使機器閱讀理解能力在SQUAD數據集上超越了人類平均水平。R-NET是一個端到端的深度學習模型。模型分為四層,最下麵一層給問題和文本中的每一個詞做一個表示,即深度學習裏的向量;第二步,將問題中的向量和文本中的向量做一個比對,找出與問題接近的文字部分。接下來,將結果放在全局中進行比對。這些都是通過注意力機製(attention)達到的。最後一步,針對挑出的答案候選區中的每一個詞彙進行預測,哪一個詞是答案的開始,到哪個詞是答案的結束。這樣,係統會挑出可能性最高的一段文本,最後將答案輸出出來。
當我們將這些機器閱讀理解算法用於由沈向洋和Brad Smith撰寫的《未來計算:人工智能及社會角色》一書時,機器閱讀理解回答了大量有趣的問題。機器閱讀理解技術能夠應用於企業級數據處理,幫助客戶回答特定領域的問題。

項目鏈接:https://www.ailab.microsoft.com/experiments/ef90706b-e822-4686-bbc4-94fd0bca5fc5
Drones + AirSimDrones + AirSim是一項有趣的模擬“搜索與拯救”的任務。我們先在AirSim中創建了一個3D環境來模擬微軟園區中的足球場,將各種動物放置在球場中;創建了一個Python腳本模擬無人機,它可以在球場中自由拍攝照片。然後我們將無人機拍攝的圖像上傳至Azure自定義視覺(Custom Vision)服務,訓練模型來識別圖像中的動物,利用Azure IoT Edge將訓練好的模型部署到無人機上。於是,無人機能夠在足球場中飛行、拍照,並實時識別出畫麵中的動物。這一項目能夠讓用戶了解實時自定義的AI如何在無人機這樣的邊緣設備上運行。

項目鏈接:https://www.ailab.microsoft.com/experiments/92262b36-de2e-444e-86ca-8bcb8bd02454
相關資訊
最新熱門應用
zg交易所安卓版app
其它軟件41.99MB
下載
比特幣交易app安卓手機
其它軟件179MB
下載
福音交易所蘋果app
其它軟件287.27 MB
下載
鏈易交易所官網版
其它軟件72.70MB
下載
抹茶交易所官網app
其它軟件137MB
下載
抹茶交易所app
其它軟件137MB
下載
中安交易所官網
其它軟件58.84MB
下載
熱幣全球交易所app蘋果
其它軟件38.33MB
下載
歐聯交易所app
其它軟件34.95 MB
下載
bitstamp交易所
其它軟件223.89MB
下載