係統粉 > IT資訊 > 微軟資訊

微軟研發繪圖機器人 根據文字描述畫出相應圖像

發布時間:2018-01-22    瀏覽數:

微軟研發繪圖機器人 根據文字描述畫出相應圖像(1)

【網易智能訊 1月22日消息】微軟近日推出了一項新的模仿類似藝術家的人工智能技術—一個“繪圖機器人”。機器人能夠根據文字描述創建一個與之相對應的圖像,而且它也增加了細節,這些細節甚至超越了本身而不僅僅在所對應的文字裏出現的內容。“這些現象可以說明,人工智能具有自己的想象力”,一名在微軟公司的工作人員說道。

“如果你在必應引擎去搜索關於一隻鳥的信息,你會得到一個與鳥類相關的圖片。但是在這裏,圖片是由計算機逐個像素地從頭開始創建的,“微軟公司在華盛頓州雷蒙德市微軟研究實驗室深度學習技術中心的首席研究員兼研究經理何曉東在微軟最近的一篇公告中表示。 “這些鳥可能在現實世界中都不存在,而它們隻是代表了我們研發的人工智能對鳥類想象力的一個方麵的描述。”

研究人員說,機器人能夠生成各種圖像,包括從“普通的田園場景”,如放牧家畜,甚至包括對“浮動雙層巴士”的想象圖。

微軟方麵表示,該機器人已經在配對圖像和標題的數據集上進行了培訓,該培訓能夠使其理解如何將相應的單詞與圖像進行匹配。 例如,當標題上寫著“鳥”時,它先學會畫一隻鳥,然後通過機器學習來理解鳥的圖像應該是什麼樣的。

何曉東說:“這是我們相信機器可以學習的根本原因之一。”

微軟研發繪圖機器人 根據文字描述畫出相應圖像(2)

繪圖機器人的技術由兩個機器學習模型組成,一個是從文本描述生成圖像,另一個是使用文本描述來判斷生成圖像的真實性。 前者試圖從後者獲得虛擬的照片,但後者不想被愚弄。所以通過互相之間內部的“競爭”,兩者結合起來便能夠共同創造更高質量的圖像。

它尤其擅長從更複雜的句子中繪製圖像,而其他技術可能會從標有“鳥”的標題中畫出一隻鳥,例如,如果您要求它畫一隻綠色的皇冠,黃色的翅膀和紅色的肚皮,那麼質量就會下降。在微軟研發該項技術之前,一般的結果便是生成一個模糊的“綠黃色微紅的鳥”,微軟的工作人員解釋說。

尤其有趣的是,當沒有提到具體的細節時,機器人如何填補信息空白。事實就是,基本上,由於其能夠記憶訓練數據,它會擁有一點自己的常識來發展想象力。在搜索鳥類的這個例子中,即使沒有在文本中說明,機器人通常會畫一隻坐在樹枝上的鳥,因為最初賦予它進行學習記憶的圖像通常顯示類似的東西。

根據最近的一篇研究報告,微軟方麵還指出,與現有技術相比,這種新型機器人生成的圖像質量相較以前提升了近三倍。

當然,這不是第一個研發出來的與藝術相結合的人工智能技術。

這兩者結合有時會產生出色的結果,比如Google的人工智能機器生成的圖像展現了其具有藝術表現力的潛能。穀歌還有一個神經網絡,可以猜測你正在繪製什麼,他們還擁有一個自動繪圖機器人,並定期地詳細介紹它如何在幫助機器進行繪製的研究。

Facebook也一直在開發神經網絡來製作飛機,汽車和動物等小圖片,甚至用它從照片中創建自己的Bitmoji形象。

對於微軟來說,教一個機器人根據文本來畫出相對應的圖像這項技術代表著它已經達到了在這個計算機視覺和自然語言處理領域所需要的技術。

這包括CaptionBot的自動寫入照片字幕的開發,以及可以回答人們詢問圖像的問題的技術,如圖中對象的位置或屬性,這是對盲人有幫助的事物。

微軟研發繪圖機器人 根據文字描述畫出相應圖像(3)

至於人工智能藝術家在現實世界中如何為人類服務,微軟公司有一些想法。

這表明該機器人可以作為畫家或室內設計師的素描助手,或者可以作為聲控美化照片的工具來被使用。 (“Cortana,請你為我畫一隻鳥”,也許它能做到?)

何曉東表示,隨著計算能力的增強,該技術可能會對電影動畫製作有所幫助,從而減少動畫師在電影後期製作所需的手工勞動量。

但該技術還沒有達到我們能夠用它完成所提出的要求的程度。

如果仔細觀察這些圖像,它們幾乎都會有缺陷,我們可以很明顯地看出來它們是由機器創造的,而不是人類:例如上圖中的藍喙鳥,水果和奇形怪狀的香蕉圖(見上文)。

然而,隨著它的進3倍速度能力的提高,繪圖機器人代表了人工智能發展的裏程碑,微軟公司相關人員說道。

(選自:TechCrunch 編譯:網易智能 參與:付曾)

上一篇:微軟高層: AI助手可在未來實現像人類一樣思考 下一篇:索尼PlayStation: 我們可能做手柄不如微軟, 但和耐克做了雙不錯的運動鞋

相關資訊

最新熱門應用

電腦問答