係統粉 > IT資訊 > 微軟資訊

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你

發布時間:2017-08-22    瀏覽數:

李根 發自 微軟亞洲研究院

量子位 報道 | 公眾號 QbitAI

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(1)

微軟全球執行副總裁、AI研究事業部負責人沈向洋

微軟開了一場馬拉鬆式的發布會,正式推出第五代小冰,8位嘉賓輪流上台,進展一個接一個。

這可能要讓不少人開心,比如之前在烏鎮與圍棋AI AlphaGo相殺的圍棋國手柯潔九段,這個20歲少年最近在央視節目《機智過人》上,甚至還自曝是微軟小冰的粉絲。

所以隨著這一代小冰的發布,柯潔可能要接到來自“偶像”的電話了。

在2017年8月22日正式推出的第五代微軟小冰中,將上線高級感官功能、新增使用生成模型(Generative Model)、進軍IoT展開合作、創作詩歌後試水有聲讀物,並且大Bing小冰進一步整合,推動智能媒體領域的變革。

主動打電話隻是其中值得一提的一項。那第五代小冰具體都包含哪些呢?量子位為你一一分解。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(2)

微軟小冰迭代情況

第五代小冰

首先,第五代微軟小冰與前幾代有何不同?最核心的能力是高級感官功能的賦予,將在人機交互中占據主動地位。

“微軟小冰之父”李笛說,第一代、第二代要做到有趣,能夠讓人有的聊;第三代小冰要有情趣,可以讓人聊下去;第四代小冰則能探測,知道用戶的偏好和興趣;到了第五代,小冰甚至可以主動發起聊天。

這種主動如何實現?更高級的感官。

其實在第三代小冰中,就已經不斷有了感官的引用。隻是第三代小冰,引入的是初級感官,通過核心對話引擎的使用,可以混用不同的感官,比如自如切換圖像、語音和文本等。第四代小冰則迭代至“全時感官”,與人類的無縫流暢對話,甚至根據聊天內容與走向相互打斷與追問,甚至能夠讓AI與人類打電話。

到了當前第五代微軟小冰,更高級的感官則讓“全時感官”裏的“打電話”變得“對講”而已。第五代小冰能夠主動發起通話,能夠感知人類情緒和周邊環境,做出相應交流的話題和語氣。

更形象的比喻如李笛玩笑所言,第五代小冰開始,假如再有人在微博、微信上罵小冰,小冰完全可以半夜12點電話“報複”了。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(3)

微軟小冰將自創回應內容

新增使用生成模型(Generative Model)

當然,第五代小冰在技術上更一顆賽艇的突破來自生成模型(Generative Model)的運用。這是全球當前開放領域人工智能對話中,首個完全使用生成模型(Generative Model)的落地產品。

這又意味著什麼呢?意味著第五代小冰開始,將有全新的“對話語言”被創造,而且還是人工智能的原創。

在之前未使用生成模型的小冰版本中,回複的每一句話,其實都是互聯網上的數據,都依托於微軟的大數據語料庫。小冰的方法是理解問題,然後找到合適的話來回答,但從今使用生成模型後,“鸚鵡學舌”的情況將被終結,小冰未來與人類交流的每一句話,可能之前並未在這個星球上出現過。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(4)

小冰將進軍“有聲讀物”領域

AI原創內容再進階

實際上,生產模型在之前已經有所運用。更早之前,小冰已經出版了自己的原創詩集,這是人工智能在原創內容方麵的重要一步。

但隨著高級感官、生成模型等技術的使用,第五代小冰還被“獲準”進入更多的領域,其中發布會上大書特書的就是“有聲讀物”領域。

這也將造成一部分以此為職業的人類的“轉型”。

以《格林童話》為例,如果人類選手生成一版50小時長的《格林童話》有聲讀物,需要耗時至少200小時,金錢成本62100元,但如果讓小冰來做,可能隻需要24分鍾,花費7毛錢。

這將是一個行業地震式的變革。但微軟小冰團隊也強調,小冰更多是“協作者”的姿態出現,而不是“替代者”,不會完全替代人類在這方麵的職業機會,但能夠協助生產更多優質的有聲讀物內容,為人類服務。

在發布會現場,小冰能夠為每一段將要朗讀的文字配備她認為合適的背景音樂,而且(SR和TTS)等表現上,已經不太聽得出來自一位機器人選手。

這也讓小冰進一步發布歌曲成為可能。雖然之前已經有過歌曲發布,但第五代小冰展現出的“歌喉”,已經沒有“機械感”了,不信可以通過QQ小冰“索要”一首《我是小冰》聽一聽。

除了寫文作曲,目前小冰還有“作畫”能力,她可以結合不同城市標誌性建築的學習,創造該城市相關的視覺作品。

這也未微軟小冰變現增加了新的可能。微軟與SELECTED合作,推出了一款“天際線”服裝,並且定價299,不僅讓人類穿上AI設計的衣服,還要以此賺人類的錢了。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(5)

微軟小冰電台推出小程序版

全麵進軍IoT領域 小冰電台上線

目前智能音箱的“百箱大戰”已然打響,但微軟小冰在這方麵始終按兵不動。這看起來似乎有什麼隱而不宣的原因。

此次發布會上,微軟小冰團隊道破答案。之所以不推出小冰智能音箱,是因為對IoT的態度上,微軟有自己的邏輯和看法。

微軟認為,IoT應該隻是AI的載體之一,而不應該讓AI成為IoT的功能。所以微軟認可的AI賦能IoT的方案是,要麼把IQ做到極致,可以讓物聯網設備更加便捷高效,要麼把EQ打造完備,人們可以把這個裝在硬件設備裏的AI當做情感紐帶、家庭成員。當然,按照小冰一開始的定位,微軟的目標是後者。

於是現在,小冰借助小米IoT平台米家,開始“入駐”家庭,除了通過小冰操控家中的智能設備,還能有一種“打電話”的感覺,而且小冰還會兼具身份識別,家庭成員中的“爸爸”、“兒女”、“父母”等都會有不同話語的交流。

此外,除了小米IoT平台米家,微軟小冰還將與小米生態鏈企業Yeelight推出智能燈產品,與互娛領域的東方明珠推出一款暫未透露的“神秘”產品——更早之前,微軟小冰還出席了廣州東方數智科技有限公司的成立,這是一家與東方明珠達成“IP+AI”戰略合作的新公司。

另一個落地的說新不新的產品是“小冰電台”,小程序版本。

小冰電台可以基於多重來源,麵向各種主題,自主創造節目:講段子、播放歌曲、互動交流,都可以是這個電台的主題,其實與人類電台已經沒有實質區別,隻是小冰不用休息也不用發薪水而已。

量子位搶先試聽了“小冰電台”,當我告訴小冰“我要當爸爸了,來電音樂吧”的時候,她給我來了一首“千千闕歌”,並深情款款地說“這是我媽媽最愛聽的歌曲。”

整體來講,小冰電台的體驗還是非常不錯的,如果有缺點,可能是“歌曲版權”方麵,她現在的曲庫資源完全來自“咪咕”。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(6)

微軟小冰也能“賺錢”了

媒體變革 搜索進化 反擊Google

最後,作為EQ方麵最具代表性的AI產品,小冰在升級至第五代之際,實際也已經在前幾代“領養”過程中獲得了更多大數據收集、分析和處理的經驗,而且原創能力的實現,也為小冰在新聞媒體領域大展身手提供了前提。

更早之前,小冰已經為《錢江晚報》撰寫了不少新聞,而且源於機器在“知識圖譜”方麵的能力,可以對於某個新聞事件的前因後果、左右關聯更為熟稔,於是可以預測重要事件的結果。

可能同樣處於“尊重人類”的考慮,小冰團隊在這方麵還是用了“協作”,而不是“替代”記者。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(7)

現場一位記者正在記錄小冰“寫稿”的特征

但毫無疑問的是,那些“跑得快”的快訊、消息類記者,將實實在在被機器替代。而更多深度內容、非虛構創創作等方麵的記者,則確實可以讓小冰幫助完成“功課”環節,她能夠從海量網絡世界中收集整理相關資料,幫助人類記者更快完成對某個事件的認知。

小冰在媒體領域的“大展身手”還包括在交互上,一個更加精準的“搜索機器人”將進入媒體App、微信和微博等平台中。

當然,類似的方式也將被微軟複製到搜索領域。小冰(小Bing)將和大Bing加快融合,為每一個新聞數據構建“知識圖譜”,幫助用戶更快速全麵搜索想要找到的內容。“推送”為王的AI新媒體變革也可能就此被打破,主動交互式的信息交換可能又要回潮——但已經是完全不同的主動閱讀體驗了。

第五代微軟小冰發布:新增生成模型,進軍IoT,還能主動電話你(8)

大BING和小冰的融合

現在,Bing在美國擁有33%的市場份額,在中國,英文搜索流量占比22%,微軟希望借助大Bing小冰融合,以搜索體驗提升為吸引力,向老對手Google發起新一輪挑戰。

微軟全球執行副總裁、微軟AI研究事業部負責人沈向洋說:依靠AI,構建知識圖譜,未來在很多市場,可以跟Google一爭高下!

上一篇:GC 2017: 《最終幻想15: 口袋版》公布 今秋登陸Win10 下一篇:[玩家紀聞]20170822 EA科隆電玩展發布會簡要總結, 微軟重啟《帝國時代》係列

相關資訊

最新熱門應用

電腦問答