微軟昨天宣布它的人工智慧(AI)係統在經典遊戲《吃豆人》上拿下首個滿分的999990分。

這個係統是由微軟今年一月收購的加拿大深度學習新創公司Maluuba所開發。該團隊運用一種強化式學習(reinforcement learning)的人工智慧技術及分散合擊的策略,在Atari 2600模擬器上執行《吃豆人》,並因此超越人類拿下首個滿分。

《吃豆人》是1980年代相當受歡迎的遊戲,小精靈要在迷宮中盡可能吃下白豆子拿分,但又要小心4大幽靈的追趕。然而這個遊戲變化多端相當難打,因而也成為許多AI界人士很有興趣的目標。今年Google在4月1日也曾推出結合《吃豆人》和Google Maps作為愚人節慶祝活動。人類最高紀錄是266,330分。

微軟Maluuba團隊設計了一種名為混合式獎賞架構的策略,它使用150多隻小精靈,使它們在單一共同目標之下,又各自被分配一個特定任務。例如一些去尋找大力丸,一些負責躲避幽靈。此外並設計出一個類似公司資深經理的大精靈(top agent),可在收集所有精靈建議做出團隊的最佳決策。
例如,某些AI可能會追蹤豆子,而另一些則專注於躲避敵人。負責最終決策的AI將基於加權邏輯去進行決策。如果100個AI希望向左側移動去吃掉一個豆子,而隻有3個想要向右移動躲避敵人,那麼最終的決策將是向右移動,以避免撞上敵人。
研究人員表示,透過強化式學習,這個AI係統中一方麵協調所有成員偏好,另一方麵讓各個成員專注單一問題,結果是對整個團體都獲益。
這次發表再次顯示AI在遊戲或比賽上已經不輸人類。Alphabet旗下DeepMind公司的人工智慧AlphaGo在上個月以三戰全勝擊敗世界排名第一的柯潔後,暫時沒有人類能阻止AI了。
相關資訊
最新熱門應用
matic交易所
其它軟件225.08MB
下載
比特可樂交易所鏈接
其它軟件7.27 MB
下載
defi去中心化交易所
其它軟件166.47M
下載
易歐數字app官網安卓手機
其它軟件397.1MB
下載
中幣交易所app蘋果手機
其它軟件77.35MB
下載
yfii幣交易所app
其它軟件223.89MB
下載
oke歐藝app官方
其它軟件397.1MB
下載
比特國際資產交易所app
其它軟件163.20M
下載
環球交易所app
其它軟件47.40MB
下載
比安交易所官網app
其它軟件179MB
下載