係統粉 > IT資訊 > 微軟資訊

微軟科學家告訴你人工智能離成為“人”還有多遠

發布時間:2019-12-01    瀏覽數:
人工智能和人工智障隻有一字之隔,但從人工智能到人差得顯然不止那三個字。

人類常對自己感到不滿足。不會彈鋼琴;肢體不協調;身高沒有185;太過感(理)性;工資沒對門小李他老婆的姐夫高等等,這些不會、不能、沒有時常令人感到一事無成。可盡管人類有時認識不到自己是多麼有靈且美的生物,卻不得不在創造人工智能時,重新審視自身那些看似與生俱來的能力。

在不久前微軟“微軟小冰2019年度研究進展”分享會上,小冰團隊的三位科學家就著重分享了人工智能擬人化的過程中,在「對話」「語音」「比喻&聯想」三方麵的學習成果。

微軟科學家告訴你人工智能離成為“人”還有多遠(1)


由於篇幅限製,本文將重點分享微軟小冰在「對話」和「比喻&聯想」方麵的內容。

首先是「對話」。微軟小冰團隊的首席NPL科學家武威認為一個好的對話機器人應該具備三種能力,分別是「學習」、「自主管理」和「連結」。

學習不單單指從人類的對話中抽絲剝繭,學習人類交流的方式,還包括不同專業領域的對話機器人之間互相學習,可以理解為對話機器人之間教學相長。自主管理可以從去年小冰團隊發布的“共感模型“中體現。指人工智能在對話的過程中通過策略明確知道“自己”想要如何表達,及在此基礎上把控整個對話流程。

武威強調,目前用戶對聊天機器人的印象還停留在“我問你答”的單輪對話中,但要使AI擬人化效果更好,則需要認識到聊天機器人與人類對話時是在“交流,而不是回複”。舉個例子:

微軟科學家告訴你人工智能離成為“人”還有多遠(2)


圖中加粗的部分是微軟的TA-Seq2Seq模型根據自身屬性給出的具有信息增量的對話,不僅增加了回複的多樣性,同時達到引導交流過程的目的。因此在多輪對話中比較考驗AI對上下文的理解,需要考慮目的性,回複什麼以及如何引導交流。

該模型在商業最直接的的應用是“AI導購”這麼一個角色,即AI通過問問題了解用戶意圖,然後進行商品推薦。從之前小冰團隊在美國和日本的嚐試來看,AI推薦轉化率達到了68%左右。

3、說起連結則不得不提“多模態交互”。人類在呈現對話時很多樣的。拿微信來說,人們對話時不僅會發文字,還有表情包,語音,視頻等等,AI想要擬人化,則必須要學會從各種媒體格式的文件中提取信息。

多模態交互指的就是人工智能需要采集互聯網上各種格式內容,包括但不限於語音、視頻、行為,知識圖譜等等,進行理解歸納後,在根據AI自己的屬性反向輸出這些內容。


我個人認為最有意思的內容是宋睿華博士分享的小冰在比喻和聯想方麵的進展。

微軟科學家告訴你人工智能離成為“人”還有多遠(3)


她說想讓小冰可以學會比喻是個非常偶然的想法,這個想法來自一段對話:


A:“我在網上看到一種說法,不管什麼樣的句子,後麵加一個'愛情也是這樣的'都行得通。“

宋博士:”怎麼說?“

A:“舉個例子吧,‘人有兩條腿,愛情也是這樣的'。“

B:“你的意思是說愛情總會走的嗎?”

C(不服氣):”那為什麼不是愛情總會來的呢?“


這個故事令宋博士印象非常深刻。她意識到比喻這種修辭手法除了能讓表達更生動形象,更易達成共識外,更重要的是能否找到合適的角度去解讀,讓比喻自洽。於是這幫科學家們以這個有趣的故事為靈感,創造了一個”'愛情也是這樣的'規則“來訓練小冰學習比喻。

既是比喻,就需要有一個本體,一個喻體,以及連接這兩個物體的“解釋”,也就是使這個比喻自洽的邏輯。

經過分析後,宋博士的團隊發現,一般在本體比較抽象,難以理解的情境下,使用比喻的頻率更高,而喻體也多為具體,易懂的概念。

Word Embedding 在此處的用法可以理解為將比喻的本體和喻體兩個詞分別進行頭腦風暴,找到更多與之有關的關聯詞。再將兩個詞的關聯詞分別進行關聯程度排序對比,從而找到最合適的連接詞(解釋)。

微軟科學家告訴你人工智能離成為“人”還有多遠(4)


另外根據前人的研究發現,令人感到耳目一新的比喻,連接詞通常是喻體的一個顯著特征,卻很少有人將它與本體聯係起來。

微軟科學家告訴你人工智能離成為“人”還有多遠(5)


例:“愛情就像葡萄酒,對程序員來說都是奢侈品。”

“我們也發現了,靠近一邊的詞其實並不是那麼的好用,我們發現位與它們倆中間地帶的這個詞,有一種平衡的詞是最好的。比如說愛情像中國足球,像虛幻,或者是愛情像中國足球一樣沒有未來,這樣的一些比喻會給人們一種關聯、新穎的感覺。“ 宋睿華補充道。

此外,宋博士還分享了小冰在跨模態理解及聯想方麵的進展。

跨模態理解和聯想大概是小冰擬人化的征途中用戶感受最不明顯但卻能“注入靈魂”的一筆。

宋博士在現場分享了一個北極熊的故事:

微軟科學家告訴你人工智能離成為“人”還有多遠(6)


人類在聽到這個故事時,會不自覺的在腦海中形成畫麵,因此對於人類來說,不難聯想到北極熊遮住鼻子是為了遮住身體上唯一一個黑色的部位企圖在皚皚白雪中掩蓋自己。

早有研究發現,人類在理解語言是,會自動點亮相關感官,產生聯想,從而真正明白語言的含義。但這對機器來說是非常困難的,因為他們不存在“常識”。

還是這個北極熊的故事,人類通過圖片,電視,動物園等等途徑了解到北極熊外形,並會在接收到北極熊有關的信息時不自覺調動相關的知識和圖像。盡管AI也能通過互聯網捕捉到相關信息,卻無法產生聯想。可以理解為,當人類聽到北極熊的故事時,看到的是一個視頻,而AI“看”到的僅僅是一個名詞。

受到該發現的啟發,小冰團隊的科學家們便開始思考能否讓小冰也擁有自己的記憶,在因為“常識”的缺失,無法理解文字意思的時候,調取以往的經驗(圖像/視頻等多媒體)輔助理解。

於是便有了「Inspire-and-Create」架構,這個架構的流程很好理解,就是當AI獲取一個故事時,會觸發它的聯想能力。首先AI會提取其中的的關鍵詞,然後在“記憶庫”檢索符合上下文的圖片或視頻,接著經過故事版生成器(可以理解為聯想功能和輸出內容之間的處理器)加工,最後生成一個跨模態的故事。

微軟科學家告訴你人工智能離成為“人”還有多遠(7)


通過圖文聯係,跨模態的方式交互方式能讓AI真正理解文本,也能豐富AI與人類交流方式的多樣性。

正如我們所見,除了讓AI更加智能,科學家們也在賦予AI越來越多的“本能”。不論從人工智能到人要走多少步,這場征途已經啟程,拭目以待吧。


【淺黑科技】係頭條號簽約作者。

上一篇:微軟SurfaceLaptop3即將開賣:十代酷睿,7888元起 下一篇:報告:Windows 10份額不升反降

相關資訊

最新熱門應用

電腦問答