係統粉 > IT資訊 > 微軟資訊

微軟人工智能玩》《吃豆人》,輕鬆碾壓人類最高分

發布時間:2017-06-15    瀏覽數:

微軟昨天宣布它的人工智慧(AI)係統在經典遊戲《吃豆人》上拿下首個滿分的999990分。

微軟人工智能玩》《吃豆人》,輕鬆碾壓人類最高分(1)

這個係統是由微軟今年一月收購的加拿大深度學習新創公司Maluuba所開發。該團隊運用一種強化式學習(reinforcement learning)的人工智慧技術及分散合擊的策略,在Atari 2600模擬器上執行《吃豆人》,並因此超越人類拿下首個滿分。

微軟人工智能玩》《吃豆人》,輕鬆碾壓人類最高分(2)

《吃豆人》是1980年代相當受歡迎的遊戲,小精靈要在迷宮中盡可能吃下白豆子拿分,但又要小心4大幽靈的追趕。然而這個遊戲變化多端相當難打,因而也成為許多AI界人士很有興趣的目標。今年Google在4月1日也曾推出結合《吃豆人》和Google Maps作為愚人節慶祝活動。人類最高紀錄是266,330分。

微軟人工智能玩》《吃豆人》,輕鬆碾壓人類最高分(3)

微軟Maluuba團隊設計了一種名為混合式獎賞架構的策略,它使用150多隻小精靈,使它們在單一共同目標之下,又各自被分配一個特定任務。例如一些去尋找大力丸,一些負責躲避幽靈。此外並設計出一個類似公司資深經理的大精靈(top agent),可在收集所有精靈建議做出團隊的最佳決策。

例如,某些AI可能會追蹤豆子,而另一些則專注於躲避敵人。負責最終決策的AI將基於加權邏輯去進行決策。如果100個AI希望向左側移動去吃掉一個豆子,而隻有3個想要向右移動躲避敵人,那麼最終的決策將是向右移動,以避免撞上敵人。

研究人員表示,透過強化式學習,這個AI係統中一方麵協調所有成員偏好,另一方麵讓各個成員專注單一問題,結果是對整個團體都獲益。

這次發表再次顯示AI在遊戲或比賽上已經不輸人類。Alphabet旗下DeepMind公司的人工智慧AlphaGo在上個月以三戰全勝擊敗世界排名第一的柯潔後,暫時沒有人類能阻止AI了。

上一篇:iNAS榮獲2017年度微軟手機應用開發合作夥伴獎 下一篇:微軟三款Surface新設備國內正式上市

相關資訊

最新熱門應用

電腦問答