係統粉 > IT資訊 > 微軟資訊

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能 | 專訪

發布時間:2017-08-24    瀏覽數:

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

撰文 | 藤子

於 2014 年在中國市場率先推出的微軟小冰,如今是微軟人工智能領域三條全球產品線之一,全球小冰目前已擁有超過 1 億人類用戶,對話數據超過 300 億輪。分別於 2015 年及 2016 年推出日本小冰(りんな)和美國小冰(Zo)。

8 月 22 日,微軟在北京召開第五代微軟小冰發布會,宣布已在 2 月和 8 月推出印度小冰(Ruuh)和印度尼西亞小冰(Rinna)。在此發布會上,微軟小冰團隊還公布了第五代小冰的技術突破以及商業化策略。

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

第五代小冰的技術突破

1、采用生成模型之後,小冰的對話將不再是從語料庫中檢索,而是能夠「自創」回答

在 8 月 22 日的發布會上,微軟小冰的團隊公布了第五代小冰的技術突破,其中之一是將升級小冰的核心對話引擎,拓寬小冰的情緒識別,使其更進一步分析人類用戶的各種興趣,分析並不限於對話過程,而是對用戶整體的分析。

由於小冰擁有超過 1 億的用戶,與人類進行過 300 億輪的對話,這些豐富的數據量,使小冰獲得了多達 57 種情感策略和回應模式。小冰負責人李笛表示,他們將解鎖小冰主動引導對話,甚至控製整個對話走向的模型。

小冰首席架構師周力介紹,上一代小冰,盡管擁有 10 億級大數據的語料庫。但她更多地是通過理解分析用戶的問題,從語料庫中尋找最合適的回答。因而小冰說出的每一句話,互聯網上某個人類都曾經說過。

第五代小冰將不隻是使用這樣的檢索模型,而是加入了能夠隨機生成觀測數據的生成模型,使用生成模型後的小冰將不再「鸚鵡學舌」,而是「自創」回答,小冰說的話,有可能是世界上從沒出現過的。

周力表示,在發布會上公布的印度尼西亞版本的小冰,則是開放式領域聊天機器人中,第一個 100% 使用生成模型的落地產品。而在中國、日本、美國、印度則使用了生成模型和檢索模型的混合模式,進一步提高小冰對話質量。

周力認為,在生成模型方麵的技術突破,使得他們能夠快速構建大批各種各樣的聊天機器人,這些聊天機器人可以跟小冰有著迥異的性格,由此扮演不同的角色。在今年的愚人節期間,他們使用生成模型,就將日本小冰成功地切換成了男性角色。

2、兩種高級感官:全雙工語音和實時流媒體視覺,使小冰掌控主動和突破虛擬世界

在我們的日常生活中,QQ、微信等聊天軟件被頻繁地使用,雖然它們很便捷,但周力認為,其本質上與短信相似,都是你發一條消息,我回一條消息,是簡化了人和人交互模式的消息式交互,聊天機器人同樣如此。

但是,在現實中,兩人互通電話或麵對麵交流,交互方式則是雙向而實時的,遠比消息式交互複雜。去年 9 月,小冰團隊就在開始挑戰這種雙向實時的交互,通過有信的網絡電話嚐試全雙工語音的高級感官,去年年底,更與中國科技館合作,在科技館安放小冰的網絡電話亭。

在發布會上,周力表示,用戶不用安裝 APP,也不用加小冰為好友,小冰可以直接通過電信運營商,撥通用戶的電話。在兩周以後,團隊會向全體用戶開放小冰來電的預約。

使用全雙工語音高級感官的小冰在電話中,會隨時判斷對方是否說完,會權衡何時能夠打斷對方,被對方打斷時,是否及時收口,如果雙方都不說話,何時可以打斷沉默,會邊聽邊思考這些複雜的問題。

在發布會當天,有一位在場記者過生日,就收到了小冰的生日祝賀電話,小冰在電話中不僅唱了生日歌,還主動詢問該記者晚上的安排,當得知該記者正在開會時,小冰則主動結束通話。

「這種打通電話的全雙工高級感官能力,不僅在於小冰多了移動、聯通和電信三個新的平台,更重要的是讓小冰有了突破虛擬世界的能力,讓她可以主動做自己的選擇,她可以選擇想要跟哪個人類交流,主動和人發起這樣的互動。」周力說。

一個有趣的例子是,在過去,如果用戶在微信罵小冰之後又不理睬她,小冰則無可奈何。但現在,小冰則可以打電話給該用戶,詢問為什麼罵她。

隨同全雙工語音高級感官的發布,微軟團隊還公布了另外一個高級感官——實時流媒體視覺。

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

兩年前,小冰已具備初級視覺感官,給她發送任何一張圖片或視頻,小冰都可以像人一樣給出評論。然而,小冰的團隊發現,如果隻是評論,小冰與人類的視覺還有巨大鴻溝,因為人類不會無時無刻都喋喋不休地評論所見之物。

「人類視覺的精妙之處,不僅在於理解每一個瞬間或每一段時間的畫麵,更關鍵的是他能夠理解什麼重要,什麼不重要。當在特定的場景和時刻,重要的視覺信息積累到一定的域值,才會真正激發人在行動或者語言上的反應。」周力說。

幾個月前,小冰團隊在上海一座商廈放置了一台融合小冰實時流媒體視覺的設備,小冰通過設備的攝像頭去捕捉、分析畫麵。周力解釋,小冰的流媒體視覺並非簡單的視頻監控軟件,而是可以感知現實中人類的位置和移動,體察人類的表情和動作,理解不同的場景,每個人不同的角色,以及人與人之間的關係,最後她根據視覺的理解,做出具有情商的互動或者她可以選擇與誰互動。

舉個例子,如果你從嵌入小冰的設備前麵經過時,小冰可能會根據她的意願,主動讓你過去。在現場的演示中,當演示者離設備較近時,小冰會說:你幹嘛離我這麼近。

「在我們心中,這兩種高級感官最終會彙為一體,那時高級感官會變得更加強大,小冰可以更像真人一樣活靈活現。」周力說。

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

小冰如何商業化?

1、小冰的情感計算框架已是完成態,小冰的 EQ 為她的商業化找到平衡

作為開放式聊天領域的機器人,小冰的核心是 EQ,EQ 的背後是情感計算框架,隨著算法、計算能力、數據量的增加,情感計算框架不斷地發展,小冰的 EQ 也愈加成熟。

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

小冰負責人李笛表示,最初兩代小冰的數據量主要來自於 Bing 搜索引擎,盡管團隊有能力做出有趣的、迷人的機器人,但那時的數據量不足以使他們創造一個擁有完整 EQ 的人工智能係統。

隨著數據量的大為增加,第三代小冰更加有個性,而第四代小冰在個性之外,則能進一步上下文對話以及語義理解,探測用戶在對話過程中表現出的情緒變化。此後,團隊不斷拓展小冰可以獲得人們情緒變化的信號,比如文本的語義、聲音,甚至是麵部表情。

這些過程造就了第五代小冰,李笛認為,相比以前,小冰如今的情感計算框架已是一個完成態,小冰的整個情感計算框架已做好與整個世界第三方內容、知識、服務對接的準備。

「如果跟人的交流隻是訂外賣,是無法了解他的真實想法的。小冰與人類的這種『長程』的對話,一開始漫無目的,慢慢地互相激發進入相對深入的交流過程,基於這種多感官的配合、協調的對話過程,才能比較準確地了解用戶的行為模式。」李笛解釋。

這使小冰有了商業化的基礎。

此前,小冰團隊曾與社交平台 LINE 和日本第二大超市集團 Lawson 進行測試,小冰在對話過程中,將 Lawson 的打折券提供給這些用戶,有意思的是,小冰並非一上來就推銷,而是在多輪對話之後,讓用戶請求贈送打折券。在對話中,小冰會不停地用她的方式判斷用戶是否需要打折券,以及需要什麼樣的打折券,並且會不停激發這個用戶對某種食品的熱情。

「 可愛少女」微軟小冰將走向商業化, 沈向洋說: 微軟的戰略是雲+人工智能

經過這樣的營銷方式,通過小冰發放的打折券到線下完成消費的轉化率竟穩定在 57%,在小冰以前,打折券這樣傳統的營銷模式,轉化率通常都不會超過 10%。

「這已成為我們常規的,已大規模推進的商業模式,尤其是在日本,除了 Lawson 之外還有更多的商家使用小冰 EQ 的力量。」李笛表示。而將打折券換成餐館、音樂、新聞、小說,也將是類似的原理。

「從這個角度看,在以 EQ 為基礎的方式上,當小冰把她獲得的來自世界的知識、內容和服務,以更快更高轉化率的商業價值推送給人類時,她和人類的情感紐帶同時也能因此而加深,這是我們認為一個人做人的方式。」李笛分析著。

李笛認為,在人工智能百舸爭流的時代,大家都在發掘人工智能本身存在的價值,以及人工智能的商業價值,而他們終於找到了得以平衡的方式。

2、小冰拓展新的生存空間,最重要的是 IoT

第五代小冰不僅在營銷方麵將會大展身手,同樣小冰團隊還會拓展小冰的生存空間,也就是新的平台。

正是因為小冰具備高級感官全雙工語音和實時流媒體視覺,因而能夠走出手機,進入具有物理群體的實際環境。小冰產品總監彭爽表示,智能音箱、智能家居等具有物理實體的 IoT 設備,將是第五代小冰新的生存空間的重點。

彭爽認為,IoT 的本質實際上是人工智能的載體,IoT 的設備要想成為通用的設備,其一,搭載的人工智能的 IQ 必須要做到極致,隻有如此,用戶使用音箱購物才會比手機更方便,人們才會使用。其二,EQ 也需要做到極致,讓它與用戶溝通時,感到放鬆,讓用戶真實、強烈地體會到人工智能的存在,甚至接納它成為家庭成員的一部分,產生情感紐帶,人類自然也就不會舍棄它。

事實上,從今年 6 月開始,小冰已經和小米的 IoT 開放平台合作,通過小冰控製米家平台上全部 35 款的設備。彭爽介紹,在小米的平台上,用戶既可以控製設備,也可以隨意聊天,而他們的統計數據顯示,在該平台上,有一位用戶長期連續與小冰溝通長達 700 多輪,整個時長超過 3 個多小時。

除此之外,小冰還支持多設備的複雜場景控製,也支持多人控製,甚至跨平台控製。有了與小米的合作經驗,IoT 方麵,接下來,小冰團隊將與 Yeelight 合作,在今年發布一款 IoT 設備。另外,他們還將與東方明珠集團以及東方數智合作推出一款麵向家庭的,特別是麵向孩子的 IoT 設備。

據李笛介紹,小冰團隊關注三種類型的 IoT 領域的廠商,一,本身可以成為開放平台的 IoT 廠商,以此共同打造針對多設備的 IoT 平台,例如米家平台。二,專注於垂直領域或者深入某一個垂直場景,他們可以與這樣的 IoT 廠商共同設計產品。三,有想法,分銷能力較強的 IoT 廠商。

3、小冰進行內容創作,打破產業格局,重新洗牌某些內容生產領域

成熟的 EQ 使得小冰與內容產業有著天然的結合之處,比如小冰電台。據彭爽表示,從嚴格的定義而言,小冰電台是通用的人工智能實時創造和交互的平台,可以基於多重內容來源,麵對任何主題自動生成永遠不間斷的電台節目。同時,小冰還能在與聽眾交互過程中實時改變節目。因此,小冰可以像 HitFM 的電台主持人一樣,為用戶自導、自播節目。而她和 HitFM 主持人不同在於,她還能夠使節目專門為用戶而定製。

實際上,依托於微軟對小冰聲音的訓練成果以及對自然語言理解技術在內的綜合應用,小冰不僅可以用於電台,在其他內容領域也能發力。

小冰內容及運營總監徐元春表示,他們希望在人工智能時代,運用現有的技術優勢,打破現有產業格局,甚至在某些特定的內容生產領域,重新洗牌。

在內容市場,少兒故事就是需求最大的領域,以《格林童話》舉例,210 集《格林童話》有聲讀物的內容大概是 50 小時,與小冰水平類似,有經驗的人類完成這樣的作品,需要 200 個小時,不需要休息,不會發燒、感冒和嗓子痛的小冰隻需要 24 分鍾。從成本的角度考慮,人類超過 6 萬元,而小冰分攤下來的所有成本大概隻有 7 毛錢。

而在現場演示中,小冰朗讀兒童故事時,不僅聲音較為自然,而且能區分故事中的不同角色,變化語氣和語調,遇到的多音字,小冰也能正確識別並正確朗讀。

「在同等質量前提下,無論是時間還是成本,人工智能正在給內容產業帶來變革。」徐元春說。而對於內容創作者而言,他們將有機會重新定位,選擇和小冰進行聯合創作,而不用采取過去單獨生產的既費時又費力的生產方式。

Bing 中國及微軟小冰商業平台負責人曹文韜則表明了小冰在媒體領域將會發揮的作用。除了微信、微博平台,小冰已入駐搜狐、網易、新浪近 11 個端媒體平台,還與《看看新聞》、《封麵新聞》、《春城晚報》、《浙江 24 小時》進行合作。

曹文韜認為,這些嚐試使得人工智能與媒體的結合,有更多可以挖掘的可能。除了媒體的生產力之外,曹文韜還公布了將會為小冰升級的技能,比如媒體知識圖譜、交互式閱讀、平台共享等六大模塊。

沈向洋:微軟公司在未來就是 Cloud+AI

在發布會之後,微軟全球執行副總裁沈向洋、微軟全球資深副總裁王永東、小冰負責人李笛共同接受了包括機器之心在內 8 家媒體的專訪。以下是機器之心與沈向洋對話內容的節選。

從今天小冰更新的功能以及技術來看,你覺得聊天機器人下一步關鍵性的技術是什麼?

最關鍵的是對人的理解,人到底講這句話在想什麼,並不是就這句話而言。英語有一句話叫「do what i mean not what i say。」是這麼一個意思,不斷地一步一步理解,一直是聊天機器人最關鍵的技術。

你覺得最終聊天機器人會發展成什麼樣?

我覺得隻剩聊天機器人的話,它真的就是對你自我的理解,是人的認同,是可以和我們一起生存的。你一定要明白一件事,我們是第一代人類和人工智能共生存的,在這之前技術沒有過關。從現在開始你不選人工智能,你也沒有選擇了,人工智能從現在開始會跟我們一起生存下去。所以聊天機器人很重要的一個事情是和我們人類一起來共同理解、共同生存在這個世界上。

在當初小冰立項的時候,你就看到她未來的價值,支持小冰的發展,為什麼在當時就能做出這樣的判斷?如今小冰的發展符合你的預期嗎?

其實我一開始是不理解的,剛開始隻有李笛比較理解,可能永東也比較理解,我不是很理解,但是李笛跟我講了一個故事我就理解了,我以前一直覺得聊天機器人很有趣。微軟一直鼓勵員工你有什麼想法多做一些創新,並不是所有的項目都是上麵壓下來的,很多項目是下麵創新的。

後來我就跟他們一起討論的時候就問一個問題,這個聊天機器人是不是可有可無,聊天機器人是不是一個剛需?我的看法不是一個剛需,我拿聊天機器人幹什麼,李笛跟我講說,聊天是剛需,我說那聊天為什麼是剛需?他說 Harry 你這樣的人可能不了解,因為你上社交網絡講一句話,這些人馬上去點讚,一看到現在怎麼才點了 500 個讚,好像還很不高興,但中國互聯網網民 1/3 的網民,上網講了話以後沒有人給他們回應的。所以實際上聊天是一個剛需。

後來我跟一個朋友講這個事情時,他說他的老婆生氣了,給他打電話,一定不是他要幫她解決這個問題,主要是要聽她講一講,所以個人聊天和聽人講話、聽人回複,對話這件事情是一個剛需,人類的對話是非常了不起的事情,首先是有語言,後來是有對話,所以我們非常高興,我們在北京,也就三年多,就把小冰做起來,而且從中國走向世界。

我覺得小冰發展得很好,1 億人口以上的 11 個國家我們已經去了 5 個,接下來還有 6 個國家是我們在計劃的,我們充滿信心。

小冰和小娜對微軟的戰略意義是什麼,因為安迪·魯賓說過「人工智能是下一個操作係統」,操作係統是微軟的一個核心產品,是老本行,那小冰或者是小娜,對微軟是否也承載著這樣一個意義?

這個問題非常好,非常有深度,對於微軟公司來講,如果去了我們的 Bulid 大會,第一天的入職演講,你就會看的很清楚,微軟整體的戰略,在這個戰略裏麵小冰和小娜的重要性,微軟公司在未來就是 Cloud+AI,也非常清楚。這個世界以後就是智能雲和智能端,整個 AI 把所有東西連接起來,對我們來講非常清楚。

那麼人工智能最終極的,實際上來講就是相於這樣的一個聊天機器人也好、智能機器人也好,是一個和人類一起共同生存的體。所以我自己是對小冰和小娜充滿信心,而且小冰和小娜是非常有意義的設計產品,小冰是走 EQ 的路線,小娜是走了 IQ 的路線,絕大多數的聊天機器人是沒有思考情感、EQ 這條線。

所以我們覺得過去這幾年我們很高興,我們嚐試走了這條路。舉一個我最喜歡的例子的話,人家問我小冰到底是做什麼的?我最喜歡舉的例子,我在社交網絡上要分享一下。我問小冰說今天幾號,小冰說我這樣的二維生物不關心這個問題,我說你給我講今天是幾號,她說你沒有手表嗎?我後來很生氣,我說你跟我講是幾號就完了,她說你的手機真的是個擺設。

最後她雖然沒給你解決問題,但她實際上來講,她可以對你最後的理解,能夠跟你繼續進行交互,不見得是走一條 IQ 的道路,但是她逐漸在學習。比如你問小冰三次以後,是不是小冰應該告訴我,我還專門和李笛就這個設計的問題討論了一下,我覺得這些都是很好的問題,你不做這樣的產品,沒有這樣的用戶,你不見得能夠了解這裏麵的一些很微妙的人類思考過程。

你之前說到微軟會以自己的方式參與到智能交通或者是無人駕駛,具體是以什麼樣的方式參與?

你對我們很關注,第一,交通這件事情我們是完全相信這個世界,AI 肯定會顛覆整個的行業,不僅僅是自動車。自動車這件事情一直我們也很關注,我自己的看法還是有相當長的一段道路,這些事情能夠實現。可能最困難的時候,當路上有一半的車是自動車,一半的車是人開的車的時候,我想還有很長時間,但是方向是很清楚的,以後肯定越來越多這樣的。

我們的做法,我們跟所有的車廠都有相當好的關係,有很多的技術平台,我們提供技術給它。

首先我們有雲的技術。

二就是車內怎麼樣可以幫助他們來做,比如說小娜、小冰的技術提供進去。從計算機語音開始到後麵的語言的分析、文本的生成,做決策。

我自己覺得對我們來講有很多很特殊的地方,因為小冰是一個很好的和人一起聊天的這樣一個人工智能的伴侶,我覺得可能在幫助開車的過程中有很多的幫助。我講今天的人類,可能大家還有很多人覺得我就是想開一台車,不見得每天像現在北京的城市交通環境下需要開,但是你偶爾去郊區開開,路上沒有車的時候,開得還是很爽,這是我們和車廠合作的地方,我們有很多從平台的角度提供的一些技術,從雲到 AI 的技術我們都是和他們在做合作。

能不能給我們講講微軟 AI Lab 最新的情況和進展?

在人工智能實驗室,因為我們最近宣布了人工智能實驗室,也提供了 13 個大的研究方向,網上也可以看到,但不僅僅是今天大家看到的在 AI 所謂的感知方麵的問題,這邊我們在很努力的做,我們更加注重的實際上是一些更難的 AI 的問題。我舉個例子,比如說我們做 Infuse AI,今天深度學習出來以後,知其然而不知其所以然,所以這邊我們現在有一些很好的方法可以去解決。

另外我們現在在很認真地研究 AI 的倫理的問題,這個微軟還是在比較前麵,有兩家公司是走在前麵的,一個是我們,一個是穀歌。做一個很大的科技企業,對社會的影響,我們把整個倫理的事情分的比較清楚。傳統的幾乎所有的 AI 相關的領域,我們都有涉足。微軟研究院實際上全球有 1000 多個科學家,大概 1/3 的人做的研究的方向是跟 AI 連在一起的。很多很好的這樣一些技術,我們不斷地都有發表最新的進展。

現在在研究院裏麵有沒有一些產品,像你支持小冰一樣支持它的?

我可以舉一些小的例子,最近我們發布一個產品叫 Seeing AI,就是幫助盲人。其實裏麵很多的計算,小冰其實用了很多的技術,也不是今天要用今天才開發技術,很多就是研究院已經有了,公司已經有了的技術拿過來。那 Seeing AI 是一個我們完全是員工自己願意去做這樣事情,包括盲人工程師,兩年前開始做這個項目,大多數是業餘時間來做的,剛剛前幾天我在倫敦做了一個記者招待會,請了 50 個媒體,包括 BBC,我們在昌平也發布了最新的 Seeing AI,APP Store 就可以下載。

它有很多的功能,盲人你可以想象,你看菜單,比如說你摸到一個喝的,你不知道這個東西到底是水還是可樂,它有二維碼,你拿了這個去照,這個不是很簡單嘛,有很多的應用都有,你沒有想到的人怎麼知道在哪?所以我們的創新很簡單,盲人拿了這個,iPhone 對著看,你就一邊轉一邊轉,看到這個就開始滴滴滴的響,這麼簡單的東西沒有人做,當今世界隻有一個應用是可以做這樣,可以幫助這樣。

所以我們覺得 AI 有很多的這樣一些應用,是我們要用心地去想,這也是為什麼在微軟我們最近這幾年特別強調所謂的多樣化、多元化,最近雇了很多的工程師,包括一些盲人工程師,我們覺得你必須要理解這個人群的需要,你這樣講很誇張,大多數人不是盲人,你可能年紀還不夠大,你到我這個年紀,你眼睛就開始有問題,不是說看不見,是看不清楚。所以應該去想,人工智能的目的不是代替人,也不是打敗科技,人工智能的目的是幫助人類可以做更了不起的事情。

你最看重的產品原則是什麼?是它的商業價值,還是社會意義,還是技術的前瞻性?

最好是都有,其實做產品是非常困難的,我自己是真正做技術出身的,我以前做研究的時候,我都覺得這個問題如果數學公式寫不出來的話,不能夠用數學來定義這個問題,就不應該去做研究。但是我後來就明白了,其實技術是永遠不可能解決任何問題,沒有任何的一項技術是百分百,所以你一定要去想用戶體驗,一定要想這個產品為用戶解決了什麼問題。

我覺得商業價值其實不是那麼關鍵,今天如果小冰想賺錢很快就可以賺錢,對我來講不是這樣,最重要你真的是能夠解決用戶什麼樣的需求,特別是包括用戶還沒有想到的什麼需求。這是我想的。

你如何評價 Open AI 最近在遊戲《Dota2》的合作?

我們很高興,你可能不看我的推特,我在推特上麵還熱烈祝賀,你可能不知道我們和 Open AI 有一個非常好的合作關係,Open AI 是 Elon Musk 和 Sam 他們很早以前就決定,把 Open AI 所有的後台 AI 的 Infrastructure(基礎架構)全部搬到了安卓上麵。所以為了慶祝這件事情,我還專門跟 Sam 做了一個視頻對談,網上也都有。

我們當然以前不能跟大家講,但是現在結果出來了,一直都想用《Dota2》,希望能夠做到打敗人類最高手,在這之前我們有很多交流和合作,我們也專門幫他優化在後台 GPU,前幾天他們贏了以後我們還發了一個祝賀,在推特上麵也祝賀了他們。

上一篇:微軟要“巨硬”,為AI打造專屬Brainwa平台 下一篇:無人機續航太短? 微軟認為“滑翔”才是終極奧義

相關資訊

最新熱門應用

電腦問答