係統粉 > IT資訊 > 微軟資訊

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展

發布時間:2019-10-10    瀏覽數:
文 | 李夜

上個月,印奇在曠視科技的招股書中,將人工智能創新比喻為一場“無限遊戲”。在他看來,有限遊戲通常受時間限製,有輸贏雙方及明確的規則,而無限遊戲則會一直持續,規則和參與者也會不斷改變。

微軟(亞洲)互聯網工程院副院長李笛認為,AI不是一個適合創業的項目。李笛告訴i黑馬&黑智,“我個人認為,人工智能跟其它領域的技術創新、時代創新不太一樣。人工智能不太適合創業項目,因為它的成功概率太低了。

如果一個領域沒有什麼效益,沒有什麼Value(注:價值),那就沒什麼人進來,你在那裏守一座孤城。如果這個領域有效益、有價值,你會有上遊和下遊。上遊企業有資源,下遊企業有客戶。他們往往比你更有優勢。如果他們想替代你,沒那麼困難,甚至比你更有優勢。所以,人工智能不太適合創業。”

李笛說,從某種角度來看,AI創業浪費了有限的AI人才。本就不多的AI人才,平攤到大量的創業公司裏,每個創業公司平均分到幾個人,很難形成合力。“行業人才如果不集中的話,想做通用,想做垂直,想做得比較深入就更難了。”

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(1)

微軟(亞洲)互聯網工程院副院長李笛

“做通用的,通吃市場”

今年8月的微軟小冰年度發布會上,微軟現場演示了一條可交互的、有聲繪本的生產線。該生產線,融合了自然語言處理(特別是自然語言的多模態理解)、計算機語音、計算機視覺以及搜索技術等技術。

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(2)

現場,微軟工作人員告訴聽眾,用戶上傳一個簡單的文本,首先,自然語言處理,把文本處理成劇本;其次,計算機語音根據劇本配音。配音包括人的語音、背景音樂等。第三,計算機視覺把有聲繪本上的實體,比如火爐、車、天氣的變化,繪製出來,繪製成一個動態序列。第四,搜索引擎將火或天上的雲分揀出來,再去做交互。

“就這麼一個事情,看起來小,但都用到了全身,用到了各方麵的技能。從這個角度上講,人工智能也是如此。”李笛說。

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(3)

2018年上線的小冰姐姐童話工廠正式版

有聲繪本也是李笛在接受i黑馬&黑智采訪時所舉的例子。它是一個典型例子,說明了微軟對於AI的認識及其實踐。李笛,提到了“通用”,更是點出,通用沒有限製,也沒有瓶頸。

“對於微軟來講,我們已經突破了垂直的、單一的人工智能技術。我們更多地關注的是,通用框架是不是能夠形成一個有機的整體。”李笛說,“比如說你做計算機語音做得非常強,但即便再強,一旦想把它產業化,或者把它產品化,稍微做一做,你就會發現缺一門或者兩門。其實,絕大部分的情況下,你缺了三門,這就有問題了。”

缺一門、兩門、三門指的是計算機語音的創業者,在自然語言處理、計算機視覺、搜索技術等方麵欠缺。而專一做自然語言處理、計算機視覺、搜索技術的,也會麵臨這一情況。

未來的競爭格局,李笛判斷,做垂直AI的,可能成為無名英雄,成為藏在產業鏈的某一個環節的幕後英雄。它被替代的可能性是比較大的。“做通用的通吃,而不是做垂直的通吃。”

比如知識圖譜,它是垂直技術,不是通用框架。它,能夠成為某一個產品或者解決方案的組成部分,並發揮價值。“不很少聽到,知識圖譜成功推動一個大的時代,一個大的項目,或者一個大的產品。但你可以在很多成功的產品上找到它的影子。”

李笛說,創業有魔咒,引無數英雄競折腰。“每個人都希望能夠把一個事業做得很好。其實,他們或多或少地推動行業的進步。”

李笛又說,以上隻是他的一家之言,不代表就是正確答案。

通用框架:IQ、EQ分開迭代

微軟(亞洲)互聯網工程院,能夠搭建通用框架,是因為微軟有足夠多的人力、物力和財力,在人工智能領域積累近20年的技術,能夠在一個尚未形成的產業鏈的初期,便假設該產業鏈已經形成,具備完整的上下遊,能夠有選擇權,可以不用選擇在某一個垂直領域垂直突破,而是追求未來人工智能時代的、大的通用框架。“畢竟,微軟市值第一,這應該是我們的最大方法,我們可以綜合布局。”

這是微軟AI技術路徑選擇的前提。

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(4)

截至北京時間9月29日18點,微軟市值達到1萬億美元

其實,小冰之前,微軟曾做了一個個人智能助理Cortana(中文名:微軟小娜)。她是一個以IQ主導的框架,和Siri、國內現有的很多語音助手一樣。“也許還有另外一個正確答案,有沒有EQ這個答案呢?人類有IQ和EQ兩個維度,那要不要嚐試從EQ這個維度去做,所以我們做了倆。”李笛告訴i黑馬&黑智當年的糾結。“做了倆,才能夠確保有一天不會突然發現做了一大段,繞了百轉千回,發現正確的沒做。”

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(5)

為什麼做Cortana時候,小冰團隊會想到做EQ?

觸發事件是小冰團隊找真人助理聊需求時,發現並不是第一時間滿足老板需求就是好的。真人助理會出於某種理由拒絕老板的要求,而這個處理結果是EQ層麵的結果。比如真人助理會拒絕體重超標的老板買薯條、漢堡等垃圾食品的要求。

自從確定了這個通用框架,李笛說讓他自豪的是,微軟小冰一直沒有變過。“如果換方向,而框架不動,沒問題。換方向,框架也動了。基本上,之前各種各樣的研究幾乎都沒有用了。每年都另起爐灶,7年之後原地踏步,所以框架不能改。”據了解,三代小冰發布會發布的框架,跟七代小冰又提到框架,基本上沒有任何變化。小冰團隊幾年間隻是不停地去完善該框架。

通用框架類似於頂層設計,依賴於獨立設計,不能從產品中找出來,跟做一個爆款APP不一樣。“框架一定是先有框架再有算法,必須得先預測,然後才能去做。”據了解,微軟內部做了很多的、不同方向的框架,隻是失敗的框架沒有被拿出來。“我們在一個項目上有多個力量、多支團隊去做同樣方向的追求,任何一個創新的需求都是這樣的,它不是計劃經濟,今天安排這個團隊做,明天安排那個團隊做,不是這樣的。”

李笛補充說,這種方式不是賽馬機製,“因為賽馬有一個比拚,誰能夠率先跑到哪裏就能夠率先獲得資源,這是賽馬。我們倒沒有說,跑慢了就沒有資源了。”

小冰團隊需要為通用框架找到一個融合IQ和EQ的方法。一如前麵提到的例子,拒絕一個任務或者完成一個任務,都能夠得滿分。這給人工智能的迭代造成不小的困擾。“好的人工智能助理會把任務變成她的手段,而不僅僅是把任務變成她存在的目的。”這也是小冰在早期很長一段時間,對於用戶谘詢技能、知識、任務甚至是天氣等問題時,反應遲鈍的原因。無法被滿足的用戶,選擇離開。但情感計算框架不需要劣質數據。

李笛告訴i黑馬&黑智,一開始,就必須將IQ和EQ分開迭代,然後再將它們逐漸整合到一起。

“迭代還是要分開迭代的。合在一起是指技術成果合起來,技術成果合起來很容易。每次合起來以後的具體產品就像是她原本的能力一樣,她可以在完成任務的同時,保持敏銳。

但要分開迭代。小冰有很多產品形態,有的產品形態到現在為止很笨。其實,我們故意讓她很笨那樣的話有助於她學習,有助於她提高。”

融合IQ和EQ的通用框架用什麼樣的標準迭代?指標很重要。指標選錯了,三軍都能夠被累死。李笛說,指標是用來評估係統迭代的很重要的部分,是某種程度上的機密。迄今,隻有CPS(人工智能和單個用戶的平均對話輪次)這一個指標被公布。

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(6)

小冰團隊技術負責人周力在演示小冰在主導對話

在今年小冰的年度發布會上,微軟全球執行副總裁,微軟人工智能事業部及微軟全球研究院負責人沈向洋如是解析小冰和通用框架之間的關係。“小冰走的這條道路,更加像森林和樹木。人工智能向前走,有一個框架是非常重要的。大家可以把通用框架想象成一片廣闊的森林,小冰隻是其中的一棵大樹。但我們必須要做一個小冰,栽這樣一顆大樹。因為我們需要有這樣一個機會去學習、去驗證這個框架是不是可行。”

目前,微軟小冰團隊也正通過Dual AI,以半開放的方式,去解決不同行業特殊性需求的問題。在解決問題的同時,也逐步搭建通用框架下的“森林”。截至今年8月,在沒有一分錢硬件補貼的前提下,小冰出現在4.5億台智能設備上。

李笛說,小冰不會以全開放的方式給到合作夥伴去用。“全開放的話,別人拿到全開放的東西別人很蒙,拿來怎麼做,拿來做什麼。你今天說好我給你一個手機,這個手機完全是由客戶來弄,客戶說我要設計一個什麼樣的APP啊,他沒有形成一個Know-How,會很蒙。”據悉,2018年,小冰團隊開發了一些工具包,工具包是一座橋,第三方合作夥伴甚至是普通的C端用戶能夠通過工具包操作小冰的框架。

從另一角度來看,選擇半開放是微軟在中國的優劣勢所導致的。“實際上,我們非常清楚微軟在中國的優勢和劣勢。當然,我們有技術優勢、產品優勢,甚至於我們今天不用去靠刷頂會證明。實際上,光小冰團隊頂會的文章就有四五十篇。

但微軟的劣勢也很明顯。我們幾乎沒有國內的資源,比如內容資源、O2O,我們要是想做外賣APP,我們都沒辦法刷街、掃街。廣告主的資源也沒有。沒有本地很多產業鏈的上下遊資源。我們隻有技術和產品,當然要半開放。”

微軟小冰發展至今,李笛用“幸運”二字總結一步步的選擇。一路走來,步步驚心,“你要讓我們回頭看,事後我們都覺得好險。”

“我們追求商業模式,而不是收入模型”

“人工智能是很容易浪費時間的。一不小心,5年就過去了。10年都過去了。頭發都白了。我們擔心這個(浪費時間),所以必須得看清時代的需求是什麼,你再去做,再去迭代它。”

李笛告訴i黑馬&黑智,“我們做了20多年的人工智能,雖然它分為4個類別,但這4個類別中又有千千萬萬個小分支,這就意味著你要決定,未來優先發展哪幾個部分,哪幾個部分的哪幾個具體的子技術。”

現階段,讓小冰團隊糾結的,除了技術,還有商業落地。

但小冰背靠大樹,不急於賺錢,一如李笛說的,“我們追求的是商業模式,而不是收入模型。我們追求的是未來5到10年、20年,一個可以確定的商業模式,而不是追求今年小冰有幾個客戶,付給我多少錢。我們不追求財務回報。”

目前,從金融這個場景開始,微軟小冰逐漸活躍在金融、零售、汽車、地產、紡織等十個領域。之所以從金融開始,是因為在文本生成領域,金融的文本生成要求最高,難度最大,不能出錯。“某種程度上來講,從這種嚴苛性要求上,我們都能夠落地這個領域,就沒有什麼領域是不能突破的。”

不過,從這個例子上無法得出如下結論:小冰落地從最難的地方開始。沒有一成不變之法。比如,之前提到的Cortana便是從簡單的、容易做的聊天機器人開始,搭出通用框架,源源不斷的用戶數據迭代框架。

在這10個領域,小冰團隊希望和萬科、萬得資訊、萬事利、中國聯通等KA客戶一起,幫助行業建立規則。以零售為例,小冰團隊嚐試了定價方法、成功的驗證方法(轉化率)等,“產品的技術解決方案,實現了什麼價值?比方說實現了推薦價值,那推薦完了以後,要不要實現購買價值?購買之後,要不要有售後價值?

要不要實現,不是由客戶或者我們說了算,而是我們在這個領域能夠為客戶,和合作夥伴一起製定的。這樣的話,它才有可能成為未來。如果這麼做,它必然不是單點的,而是針對整個行業,是可拓展的。”

在采訪的最後,i黑馬&黑智問李笛,如何避免AI重蹈微軟移動互聯網的覆轍?

李笛說,他們承認微軟錯過了移動互聯網的時代,但微軟沒有錯過對移動互聯網的布局。比如微軟很早便布局了移動互聯網的操作係統、平板電腦,甚至是扁平化的視覺設計這種小細節。“微軟在發現未來,發現正確答案的眼光上,沒有太大的問題。”

他舉了三年前落地的全雙工語音交互的例子,微軟很早布局了該領域的相關專利。而正在帶火這個技術的是Google。在2018穀歌I/O開發者大會上,在大會上,穀歌現場展示了人類與人工智能的Full Duplex電話。一些媒體稱之為人類曆史上第一次與人工智能的Full Duplex。

微軟(亞洲)互聯網工程院李笛:全民式AI創業,不利於AI產業的發展(7)

微軟不得不做了一個聲明。聲明稱,“其實,人類曆史上第一次與人工智能進行全雙工語音電話,並不是發生在美國,而是發生在中國。我們很榮幸能將這一桂冠奉獻給祖國。自2016年8月起,微軟(亞洲)互聯網工程院通過人類用戶主動發起的方式,已讓小冰與人類用戶累計完成了超過60萬通電話。”

李笛還提到,一些產品、框架有窗口期。比如說情感計算框架。他個人認為情感計算框架的窗口期已經過去了。

而微軟在對話式人工智能的EQ方麵有先發優勢,“除非我們出太大的問題,比方說我們連續做了許多錯誤決定,或者同行業突然研發出一種極其跨時代的新技術,否則的話,我們的領先優勢不太可能會被追上。

因為全球範圍內對話式人工智能的流量數據90%都流到微軟小冰,已經持續很多年了。同行業者沒有數據,沒有辦法去訓練。”

上一篇:微軟員工曬工資:4-32萬美元差距大,美國比印度高幾倍 下一篇:又是一個活久見!蘋果竟然幫微軟賣貨

相關資訊

最新熱門應用

電腦問答