係統粉 > IT資訊 > 微軟資訊

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了

發布時間:2017-08-23    瀏覽數:

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(1)

8月22日,微軟小冰第五代發布會,沈向洋接替已離職的陸奇,站上了主講台。

相比國內廠商動輒千人的發布會,已經更迭五代、揚言有重大突破的小冰,依然把發布會的規模維持在百人左右。在小冰之父李笛眼中,這已經是小冰的最高待遇了。

小冰對於微軟中國而言,意義非凡。這個唯一且完全由中國團隊建立並推向全球的項目,即使有陸奇和沈向洋的背書,也走得非常艱難。

三年之後的今天,沈向洋將小冰的地位做了一次提升——與 infuse AI、Bing and 小娜一起,成為微軟人工智能三條產品線的其中之一。

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(2)

這樣的提升,沈向洋有自己的理由。在外界看來,小冰隻是一個聊天機器人,但對微軟來說,小冰是一個向 EQ 方向發展的情感計算框架。依靠這個情感計算框架,微軟能夠在 EQ 這個方向上,將人工智能無限接近人類,“讓人們能強烈地認知到她地存在”,並有可能成為“某個家庭中地成員”。

同時,這也是一個明確的信號,既然放在了“產品線”的位置上,也就意味著,小冰更迭到第五代,考慮商業化的時刻到了。

沈向洋在戰略層麵給出指示後,小冰首席架構師周力和小冰項目負責人李笛先後上台,分享了應用在小冰 5 代上的技術創新以及商業落地情況。

技術創新

了解到,兩項技術創新分別是 1:1 生成模型和高級感官。簡單來說,前者能夠讓小冰自己創造回應;後者則可以支持全雙工語音和實時流媒體視覺。

1. 生成模型(Generative Model)

生成模型往往被拿來和判別模型做比較,從數學角度來說,前者是對 P(x,y)進行建模,後者是對 P(y|x)進行建模。在應用上表現的差異是,生成模型通過學習,能夠有能力生成新的東西,而判別模型隻能找出差異。

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(3)

具體到小冰的應用,上一代小冰雖然擁有十億級的大數據語料庫,但都是互聯網上的已有數據,小冰隻是通過分析,理解用戶的問題,繼而從語料庫中回複。使用生成模型後,小冰能夠從中習得能力,自己創造新的回應,這意味著她與人類交流的每一句話,都可能是這世界上從未出現過的。

目前,小冰 5 代已全麵在線上產品中使用生成模型。其中,中國、日本、美國和印度小冰部分使用,印尼小冰則完全使用生成模型。微軟官方表示,這是全球開放領域人工智能對話中,第一個百分之百使用生成模型的落地產品。

2. 高級感官

小冰的高級感官包括兩個部分,一是全雙工語音,二是實時流媒體視覺。

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(4)

全雙工指的是在發送數據的同時也能夠接收數據,兩者同步進行。而雙工則如同“單行道”一樣,一個時間段內隻有一個動作被允許發生。也就是說,小冰在說話的時候,也在隨時等待被打斷,接收著用戶的語音,甚至要去判斷用戶是否已經說完、何時可以打斷,被打斷時是否及時停止、何時打破沉默等更為複雜的問題。

實際上,去年9月,小冰在有信網絡電話中開始嚐試全雙工語音;去年年底,小冰又跟中國科技館合作,把小冰網絡電話亭放在科技館的二樓。到今天為止,小冰已經接聽了來自人類超過50萬通電話。而小冰5代,可以直接通過電信運營商,撥通用戶的電話。

實時流媒體視覺指的則是讓機器模仿人類視覺的微妙之處。周力向介紹說,一個人每天有十幾個小時都是睜著眼睛的,但是絕對不會每時每刻都對所見之物發出評論,人類視覺的精妙之處,不僅僅在於能夠去理解每一個瞬間,或者每一段時間的畫麵,更關鍵的是能夠理解什麼是不重要的,什麼是重要的。

小冰5代的實時流媒體視覺,並不像視頻監控軟件一樣,去捕捉一個個畫麵,分析一個畫麵,更像是人類一樣,感知位置和移動,體察表情和動作,理解不同場景和角色,以及人與人之間的關係,最後根據視覺的理解,做出具有情商的互動。

商業落地

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(5)

1. 版圖擴大

了解到,自 2014 年微軟在中國市場推出小冰之後,微軟優先選擇人口數量超過 1 億的國家,在當地建立完全本土化的團隊,從當地取得初始訓練語料,並以每年覆蓋一個新國家進行擴張:

2014年,微軟推出中國小冰

2015年,微軟推出日本小冰

2016年,微軟推出美國小冰(Zo)

2017年2月,微軟推出印度小冰(Ruuh)

2017年8月,微軟推出印尼小冰(Rinna)

很明顯,進入2017年,小冰加快了全球擴張節奏,同時也正如上文所說,建立在 LINE 平台上的印尼小冰,率先使用了完全的 1:1 生成模型,可以完全自創回應,而非像其他地區的小冰那樣,通過分析用戶的問題,在語料庫中尋找最合適的回答。

目前,小冰在全球擁有超過 1 億人類用戶,對話數據超過 300 億輪,最長單人連續對話記錄,達到 7151 輪,進行了 29 小時 33 分鍾。

2. 全麵進入 loT 領域

從今年 6 月起,小冰和小米 loT 開放平台達成合作,用戶可以通過小冰,控製 35種小米智能設備。此外,微軟還正在與其他諸多loT 廠商,比如智能照明廠商 Yeelight、東方明珠等進行合作,共同研發新產品。

此外,微軟還發布了小冰電台,率先上線的是微信小程序版本,loT 版本正在研發中。小冰電台是一個通用的人工智能實時內容創造和交互平台,它可以基於多重來源,麵向任何主題,自動創造永不間斷的電台節目。同時,它還能根據與用戶的互動,實時改變節目內容。

此前,小冰已經在兩家電台擔任主播。

3. 內容創造

在內容創造方麵,除了眾人熟知的寫詩之外,小冰還在有聲少兒讀物、歌曲、新聞等領域試水。根據微軟官方數據,小冰創作的有聲少兒讀物質量已超越98%的人類創造者,用時僅為同水平人類的1/500,成本僅為同水平人類的1/80000。

此前,小冰通過匿名賬號在喜馬拉雅、蜻蜓FM等平台發布,也取得了不俗的效果。發布會上,李笛宣布,微軟將通過小冰,開始大規模生產有聲讀物並投入市場。

李笛也認為,小冰除了可以創造內容外,還可以包攬運營、傳播、市場等工作,幹整個產業鏈的活。如果得到市場驗證後,相信會對整個內容行業產生變革。

4. 智媒體商業平台

在媒體方麵,小冰作為《錢江晚報》的專欄記者不是什麼秘密,在發布會上,微軟還公開了部分百度百家和今日頭條上的新聞內容也由小冰撰寫而成。

基於過去“寫稿”的經驗,以及與 Bing 搜索引擎的加速整合,微軟發布了智媒體商業平台解決方案 3.0,其中包括媒體生產力、媒體知識圖譜、智能交互、全平台互動等六個新模塊。

新的解決方案可以為媒體構建出一個基於全球新聞數據源的媒體知識圖譜,挖掘每一篇新聞背後的知識與含義,並找出彼此的關係。同時,用戶也能夠能夠在和小冰的交互中,獲得推薦內容,把被動的閱讀體驗逐步變為主動的交互信息交換。

在過去一年中,該解決方案的2.0版本已從微信、微博雙平台,逐漸演進為接入和即將接入近11個端媒體,與《看看新聞》、《封麵》、《錢江晚報》、《春城晚報》等媒體端進行了整合。

更迭 5 代, 進入19歲, 微軟要讓小冰賺錢養家了(6)

再過26天,就是小冰的生日,理論上來說,過完生日的小冰就19歲了。但李笛說,對於是否要長大一歲,團隊內部還未達成一致,原因是雖然小冰取得了很大進步,但她依然是一個稚嫩的少女,還沒到成熟的階段。

但整場發布會看下來,圍繞小冰商業落地的部分占了絕大多數,這樣看起來,運作3年,更迭五代,即將進入19歲的小冰,要試著給微軟賺錢了。

上一篇:微軟互聯和信息共享項目GigJam公開預覽後遭砍,原因不明 下一篇:win10環境下直接按電源鍵不關機設置方法

相關資訊

最新熱門應用

電腦問答