係統粉 > IT資訊 > 微軟資訊

畫家要失業了?微軟的繪畫機器人能夠根據文本生成圖像!

發布時間:2018-01-22    瀏覽數:

最近,微軟公布了人工智能一項新的進展,可以根據用戶描述來繪圖,這項技術刷新了我們對人工智能的認知。

如果給你畫筆和稿紙,讓你畫一隻鳥,這隻鳥有黃色的身體,黑色的翅膀和短短的鳥喙,那麼你一定會從鳥的輪廓開始畫起,然後不停的修改,用黃色的畫筆填充鳥的身體,用黑色的畫筆來畫翅膀,最後完成鳥喙。如果想讓畫更加生動形象,你可能會畫上樹幹,讓鳥停在上麵棲息。

畫家要失業了?微軟的繪畫機器人能夠根據文本生成圖像!(1)

現在,微軟開發出的機器人也能夠做到這一點了。

微軟的研究實驗室開發的新型人工智能技術,能夠將文本描述中截取的單個詞語生成圖像。這項技術被研究人員稱作是“繪畫機器人”(drawing bot),當你輸入文字後,機器會根據文字先生成一張模糊的圖片,然後再反複識別文字的意思,逐個像素地補充圖片細節。

畫家要失業了?微軟的繪畫機器人能夠根據文本生成圖像!(2)

“如果你通過搜索引擎來搜索,你會得到一幅鳥的圖片。”但在這裏,這些圖片是由電腦逐個像素進行創建的,”何曉東說,他是微軟位於華盛頓州雷德蒙德實驗室,深度學習技術中心的首席研究員和研究主管。“這些鳥可能在現實世界中並不存在——它們隻是電腦想象中的鳥類。”

畫家要失業了?微軟的繪畫機器人能夠根據文本生成圖像!(3)

這個“繪畫機器人”用到的核心機器學習技術是生成對抗網絡(GAN),簡單來說,就是有兩個模型一起工作,一個根據文本生成圖像,另一個則會根據文本鑒別生成圖像的真實性,二者一同作用,讓生成的圖片更符合文本描述。

這項技術可以運用到實際應用中,比如,它可以作為畫家和室內設計師的草圖助手,或作為語音控製的照片美化工具。伴隨更強大的計算能力,這項技術還可以生成基於電影劇本的動畫電影,為電影製作人減少一些需要人工的成本。

目前這項技術還不完善,對於常見文字生成的圖片速度和質量都較高,對與不太符合常規邏輯或不常見的文字生成結果則不太準確,例如,輸入“一輛紅色的雙層巴士漂浮在湖麵上”,會得到一個像是有著兩層甲板的巴士飄在群山環繞的湖麵上的模糊圖像。此外,在對圖像進行仔細檢查後,幾乎總能發現瑕疵,例如,在鳥的圖片中,呈現的是藍鳥喙,而不是黑色的;水果和基因突變的香蕉長在一起。這些缺陷清楚地表明,是電腦而不是人類創造了這些圖像。

畫家要失業了?微軟的繪畫機器人能夠根據文本生成圖像!(4)

盡管如此,這項技術與之前的文本到圖像生成技術相比,產生的圖像質量提高了將近三倍。此外,這也是通往增強人類自身能力的類人工智能道路上的一個裏程碑。

上一篇:AI越界人類家庭!微軟小冰發起家庭調教計劃 下一篇:購機黨看過來, 使用微軟surface book2的真實體驗

相關資訊

最新熱門應用

電腦問答