係統粉 > IT資訊 > 微軟資訊

微軟開源TextWorld框架,以文字遊戲來訓練增強學習AI

發布時間:2018-07-17    瀏覽數:

微軟開源的TextWorld包含遊戲生成器和遊戲引擎兩個組件,除了可以用來生成文字遊戲外,遊戲引擎具備簡單的推理算法,能夠玩市場上的文字遊戲,供研究人員評估人工智能。

微軟開源TextWorld框架,以文字遊戲來訓練增強學習AI(1)

在人工智能中,增強學習以及自然語言識別都是重要的技術,但是這兩項技術卻很難合適的應用在一起。微軟實驗室發布了,用來製作文字遊戲的可擴充Python框架TextWorld,開發人員除了可以使用TextWorld來訓練或是測試人工智能的語義識別、記憶或是規劃等能力外,也能進一步執行文字遊戲,用以評估人工智能與人工設計環境互動的情況。

文字遊戲為遊戲環境與玩家的互動,僅由或是主要透過文字表現的遊戲,玩家可以透過遊戲的文字敘述,來理解遊戲世界的環境,並透過文字命令來進行操縱角色等遊戲控製。在典型的文字遊戲中,玩家需要解決一係列的問題,在過程中收集寶物並到達指定位置,目標可能是明確指定的,也可能需要玩家從遊戲過程取得的線索自行推理。

微軟開源TextWorld框架,以文字遊戲來訓練增強學習AI(2)

人工智能要完全可以玩文字遊戲,除了需要有產生連貫的文字命令外,還被要求以正確的順序產生命令,隻容許些微或是完全沒有錯誤發生。文字遊戲結合了以有限製的解析器(Parser )探索空間,以及積極回應玩家的遊戲世界,因此仔細觀察遊戲中文字提供的線索,並采用創造性的理解與行動,則是在遊戲中獲勝的重要能力。

增強學習以及自然語言識別剛好適合應用在這樣的素材上,TextWorld包含遊戲生成器和遊戲引擎兩個組件,遊戲生成器可以將高階遊戲設定轉換成文字遊戲語言Inform 7,諸如房間數量、物體數量、遊戲長度或是獲勝條件等。而遊戲引擎則是一個簡單的推理機器,透過簡單的算法,產生合法的一連串往前往後等動作的遊戲控製鏈。

微軟開源TextWorld框架,以文字遊戲來訓練增強學習AI(3)

透過TextWorld可以來訓練和測試人工智能的語義識別與探索等技能,同時研究人員也可以使用泛化以及轉移學習來進行研究,並讓TextWorld玩市場上的文字遊戲,以評估人工智能在複雜人類設計環境中的表現。

微軟實驗室首席研究經理Geoff Gordon提到,增強學習與自然語言兩項技術都很重要,但事實上他們卻不那麼適合,而TextWorld確為這兩者找到了一個良好的結合方式。他表示,雖然增強學習在近年來已經有重大的進展,如圍棋,但是這些相較於文字遊戲都是較簡單的應用,TextWorld的人工智能需要同時閱讀並產生自然語言,在許多情況下,都需要麵臨更為複雜的情況。

上一篇:網友發現微軟和任天堂貼吧聯動 索粉:再說我不高興了 下一篇:微軟Bing搜索新版曝光:拯救你的鼠標右鍵

相關資訊

最新熱門應用

電腦問答