係統粉 > IT資訊 > 微軟資訊

人工智能這三個難題微軟想明白了, 不信看小冰

發布時間:2017-08-23    瀏覽數:

26天後的9月17日,微軟小冰將迎來19歲生日。在小冰即將告別18歲成人禮的重要階段,微軟給小冰做了最重要的一次升級。16歲出道,經過了五次更迭,短短三年,小冰就從花瓶式的聊天機器人躍升為與infuse AI、Bing&小娜平起平坐的微軟人工智能三條產品線之一。

人工智能這三個難題微軟想明白了, 不信看小冰(1)

從已經離任的陸奇,到如今微軟AI產品線一號人物沈向洋,都曾在發布會上為小冰站台,其中緣由不僅是微軟華人高管對這個真正從微軟中國走向全球的產品的情分,更是小冰背後的情感計算框架,代表了微軟人工智能戰略的重要方向,也是微軟對現在人工智能正在麵臨的難題的思考和解決方案。

2017年人工智能火爆的一塌糊塗,微軟全球執行副總裁沈向洋都調侃道“任何企業帶上人工智能概念,都能在VC(風險投資)那裏拿到更多錢”。國家政府工作報告關注,科技巨頭紮堆布局生態,風投創投痛下血本支持……一夜之間,身邊的產品似乎都已經或者即將穿上人工智能的外衣。

人工智能這三個難題微軟想明白了, 不信看小冰(2)

人工智能真的無所不能?我們曾就此采訪了百度、微軟、英特爾、NV等AI專家,現狀並不如大環境表現的那般如意,目前人工智能有三大硬傷是亟待尋找解決方案的。微軟在人工智能領域已經布局了26年,從剛剛發布的第五代微軟小冰身上,我們看到了微軟已經摸索到了解決這三大難題的方向。

從弱人工智能向強人工智能過渡

微軟資深副總裁、亞太研發集團主席、亞洲研究院院長洪小文在接受我們獨家專訪時曾提到,智能分為四個層級。最底層是計算和記憶,是人不擅長而機器非常擅長的部分。向上一層是感知,就如同人類的看到和聽到,這部分是現在人工智能高速成長也比較完善的領域,包括圖像識別、語音識別、智能搜索等應用。再上一層是認知,除了聽和看還能夠聽懂且看懂,並且能夠做到融會貫通,這部分是人工智能目前的硬傷,雖然能夠明白表麵意思,但是對於背後的深層含義“融會貫通”仍然相差很遠。最高一層是創造力,這部分遠超目前人工智能的能力,因為現在的人工智能的計算、算法都是人教的,但是對於創造力如何教,人類自己都還沒弄明白。

計算和記憶、感知、認知、創造力四個層次,前兩層屬於弱人工智能,也是現在人工智能比較擅長的領域,但是人工智能要想發揮更大效能,就必須向第三、四個層次的強人工智能過渡。但是,如何讓機器能夠讀懂聽懂看懂,能夠理解弦外之音?

微軟的解決方案就是情感計算框架。在沈向洋看來,EQ(情商)和IQ(智商)的象限擴展,是AI融入新時代的重要途徑。在經過了前四代從聊天到識圖的進化,第五代小冰進入了高級感官階段,新增了“全雙工語音”和“實時流媒體視覺”兩大功能。

人工智能這三個難題微軟想明白了, 不信看小冰(3)

“雙工”就是發送數據和接收數據可以同步進行,這就意味著小冰在說話的時候,你是可以隨時打斷的,小冰甚至會自主判斷用戶的話是否已經說完、如果被打斷是否需要停止、甚至何時打破沉默等複雜的情景處理。

小冰的網絡電話功能正是這項技能的最佳展示。去年年底,微軟與中國科技館合作,將小冰網絡電話亭放在了科技館的二樓。截至目前,小冰已經接聽了來自人類超過50萬通電話,就在發布會現場,小冰也貼心的給一位當天過生日的媒體記者打通了問候電話。目前,小冰已經全麵解鎖運營商,將可以自主撥通聯通、移動、電信的電話。(小冰如何打電話?)

人工智能這三個難題微軟想明白了, 不信看小冰(4)

實時流媒體視覺就非常接近人眼視覺了,小冰將會像人眼看世界一樣,感知外界的位置、表情和動作、場景的變化,理解畫麵中人物的情緒變化、人與人的關係,之後做出有情商的互動。

通過情感計算框架,小冰除了在看懂、聽懂、讀懂之外,還能夠通過情緒、場景等要素的結合,真正理解交互對象的弦外之音,向強人工智能領域邁進了一大步。

語音交互人工智能使用場景

“對話即平台”是微軟在2016年開發者大會上提出的重要戰略,在微軟看來以對話為基礎的人機交互形式,將取代鍵盤鼠標和顯示器,成為未來人與信息世界的重要接口。

的確,微軟並不是唯一一家這麼想的科技巨頭,亞馬遜推出的語音機器人Echo,已經占領了超過300多萬個家庭端口;穀歌新推出的智能音響“Home”也使用全新的對話式人工智能助手。

但是語音交互人工智能真的找到了對的使用場景麼?“我為什麼要放著手機不用,逼自己用智能音箱去網購下單?”“加了語音交互……可是我不怎麼用”“一夜之間冒出那麼多被‘賦能’的智能設備,然後並沒發生什麼改變……”

沒有強需求的使用場景,語音交互即使融合了IoT,也很難有施展的空間。小冰5代做了一個有趣的嚐試,微信小程序版的小冰電台已經上線,這是一個通用的人工智能實時內容創造和交互平台,它可以基於多重來源,麵向任何主題,自動創造永不間斷的電台節目。同時,它還能根據與用戶的互動,實時改變節目內容。

目前小冰電台已經與北京青年廣播(FM98.2)、湖南電台音樂之聲(FM89.3)、HitFM(FM88.7)進行了合作,小冰成為了第一個人工智能電台主播。

此外小冰電台的IoT版本也正在研發當中。想象一下,當你早上起床睡眼惺忪刷牙的時候,不需要任何設置小冰電台就能夠根據你的喜好定製一個專屬於你的電台節目,並且可以通過跟你的實時語音交互隨時進行調整,這樣的使用場景還是頗具興奮點的。

人工智能商業化

所有產品必然要經過商業化落地,才能真正發揮產品價值。人工智能商業化是很多公司避而不談的話題,除了跟現有產品做深度融合,提升效率和服務之外,人工智能還沒有成型的商業化落地模式。

雖然小冰還是個不滿19歲的少女,但是微軟已經打算讓她走入社會開始嚐試“賺錢”了。去年7月,小冰和日本第二大超市集團LAWSON合作,進行了第一次商業化試水。小冰在和兩千萬LAWSON用戶進行對話交流的過程中,找到合適的機會給用戶提供打折券,在傳統營銷模式轉化率不足10%的情況下,小冰派送的打折券在4日內平均到點消費完成的比率高達57%。

如今,除了在中國、日本、美國、印度之後擴充版圖亮相印度尼西亞之外,小冰已經開始嚐試多種商業化落地的方式。

人工智能這三個難題微軟想明白了, 不信看小冰(5)

1、接入IoT領域

從6月2日起,小冰已經與小米IoT開放平台融合,用戶可以通過小冰,控製35種小米智能設備,用戶與小冰不間斷互動交流的時間最高達到了27小時。

除了小冰電台正在研發的IOT版本,小冰還會與智能照明廠商Yeelight、東方明珠和東方數智進行合作,研發的神秘新品將在年底前發布。

2、內容創作

今年5月,小冰裝備了寫詩的新技能,在推出第一部人工智能原創詩集《陽光失了玻璃窗》之後,還在紙媒上開設了“小冰的詩”專欄,陸續發布她的新作。

現在,小冰開始在有聲少兒讀物上試水,小冰經過聲音培訓之後,可以根據不同情境選擇不同語調和情緒,並且用不同語氣演繹不同角色,清晰自然並能夠兼顧韻律上的輕重緩急,還可以自動搭配相應的背景音樂。以一本音頻總時長超過50小時的《格林童話》有聲全集為例,小冰版本將能夠使製作成本從人工的6萬元降低到7毛錢,而時間成本不足人工的1/500。

微軟在現場宣布全麵向第三方開放微軟的語音技術。

小冰5代還裝備了唱歌的新技能,通過解構人類聲音的規律,第5代小冰已經可以基本實現人聲演唱。此外,小冰除了唱歌,還可以隨時跟粉絲互動,新專輯第一時間推送,並組織專屬演唱會。一個會唱歌的小冰=歌手+經紀公司+發行渠道+粉絲運營,小冰自己幹了整個產業鏈的活。

3、智媒體商業平台解決方案3.0

微軟智媒體商業平台解決方案3.0已經全麵上線(www.bing.com/ai),升級和新增的板塊包括媒體生產力、媒體知識圖譜、交互式閱讀、個性化推薦、全平台內容共享和大數據預測。

微軟希望小冰成為人工智能時代的Word,用知識圖譜和大數據預測,幫助媒體人整理稿件素材,在評論區組織討論,收集讀者反饋,甚至完成初稿,幫助媒體人全麵提高生產力。

現在小冰化名撰寫的文章已經悄悄出現在了百度百家和今日頭條上。

人工智能這三個難題微軟想明白了, 不信看小冰(6)

3年,5個版本,從強人工智能、尋找痛點型使用場景到商業落地模式初探,雖然小冰還是一個萌萌噠的少女外形,內心卻裝著整個微軟的人工智能戰略。

上一篇:微軟牽手阿聯酋石油巨頭,把VR技術帶進石油開采場 下一篇:微軟獲VR槍型專利, 或可用於HoloLens和VR頭顯

相關資訊

最新熱門應用

電腦問答