微軟發布第五代小冰, 它都有什麼亮點?

發布時間：2017-08-25 瀏覽數：

8 月 23 日下午，在微軟第五代小冰的發布會上，有一個這樣的橋段：小冰通過電信網絡直接撥通了現場一位媒體觀眾的手機，在和他說了生日快樂，唱了幾句生日歌，又寒暄了幾句之後，用“你還在開會很忙吧”，結束了對話。

這種讓人工智能像人類一樣說話的技術，微軟亞洲研究院叫它“全雙工語音”，意思是 AI 不再隻能在聊天軟件裏你來我往的交流，現在可以像真人一樣，實時的在你說話之後給你一個回複。微軟說，小冰的模式不僅是回應你說的話，在你沉默不說話的時候，她也知道要說什麼來讓話題繼續下去。

微軟亞洲研究院曆來重視小冰發布會，這個研究項目三年半前立項，在發布之初，她被設定成一個 15 歲的少女，可以通過文字的方式和人聊天。如果從一個普通用戶的角度來看，幾年過去，小冰慢慢可以看懂圖片，聽懂你發的語音，回複語音，看懂更多的圖片和視頻，給你唱歌……現在終於可以和人直接聊天。

第五代發布會，小冰展示的最大亮點，是她的“創造”能力。

微軟發布第五代小冰, 它都有什麼亮點?(1)

小冰以後可以直接撥電話給你

從小冰這段示例語音來看，她每個字直接的連讀更像人，句、逗之間的語氣聽起來有上下文承接，和百度、科大訊飛、蘋果的其他語音助手最大的區別是，它能夠結合上下文把多音字讀出正確的讀音。

在一段“龜兔賽跑”的童話朗讀語音實例中，隻有小冰能沒有人工幹預的情況下準確識別“生長”和“伸長”中多音字的正確讀法，可以認為是小冰具有對中文上下文理解的能力。過去在小冰參加的電視綜藝節目裏，也可以看到她對自然語言的實時反應。

總得來說，可以認為小冰現在學會了說話。

微軟在發布會上宣布，從 9 月開始，小冰開始啟用全新的“生成模型”來生成對話。過去，基於大數據和深度學習的模式，實際上全世界“聊天機器人”這個類型的人工智能，他說的每一句話應該都是有另外的用戶曾經說過的。微軟把這種模式叫“檢索模型”。

但“生成模型”不一樣。在這個模式下，小冰說的每一句話都有可能是完全生成的。目前，微軟小冰和她的不同語言版本在中國大陸、日本、美國和印度已經上線，這個月也開始在印度尼西亞提供服務。微軟說，中國、日本、美國和印度的小冰采用了混合模式，也就是大部分回應是檢索出來的，小部分是全新生成的，但在印尼投入的新版本完全使用“生成模型”運轉，每一句話都是新的。

小冰實時對話之前就出現過。去年，微軟已經在發布會上展示了打電話的功能，但這次發布會宣布的是這項功能大規模測試的開始，以後所有普通用戶都可以在周三例行更新日的時候跟小冰預約，小冰可以直接把電話打到你的手機上，移動、電信和聯通都可以。

關於打電話這個能力，微軟還描述了一個令人細思恐極的場景：未來用戶在微博上如果對小冰出言不遜，她可能可以直接打電話給你聊一聊。

微軟說，小冰以後要從事內容創作

微軟在發布會上展示的讀童話故事，不僅僅是語音生成能力的展示，似乎也預示著未來小冰的商業模式。

過去幾個月，微軟已經用小冰來生成童話朗讀節目匿名發在蜻蜓 FM 和喜馬拉雅電台上累計播放數量約為 30 萬，而且從評論裏來看，似乎很多聽眾沒有分辨出這個朗讀是人工智能生成的。微軟說，一本 210 集的《格林童話》有聲讀物內容大概是 50 小時，人類配音演員需要 200 小時工作時間，成本大約 6 萬元。相比之下，小冰隻需要 24 分鍾，拋開研發之外，運行成本可以忽略不計。

和印花 T 恤衫這種看起來更像是營銷的項目相比，有聲讀物確實更像是一個可行的商業模式。在音樂和電台類應用裏，有很多虛構類文藝作品的聽書節目，基於聽書這種形式，這些節目大部分都是用來休閑和打發時間，人工智能也許可以勝任這種“敷衍”的娛樂。

“現在的智能音箱還不算是人工智能”，微軟也不做智能音箱

發布會主持人之一、小冰產品總監彭爽說，語音本身不是智能音箱產品的核心。更不應該逼迫用戶去和它說話。

微軟將和第三方合作，來研發內置小冰的硬件產品。目前宣布的有小米生態鏈企業 Yeelight，這家廠商之前做過智能台燈；合作方還有東方明珠，微軟說會做一款兒童取向的智能產品，幾個月內上市。

目前，小冰 FM 以微信小程序的方式上線。在實際體驗裏，小冰 FM 確實可以基於合作的咪咕音樂的版權內容不斷播放新的節目，比如熱門音樂排行榜之類。點擊“錄音”按鈕可以語音互動，告訴她“下一首”，她可以回應“你不喜歡這一首嗎？”然後切換新的歌曲。

但小冰 FM 似乎沒有視頻裏展示的那麼智能，比如說“我喜歡 XXX 歌手”，得到的回應更可能是“我也喜歡”，而不是換成這位歌手的歌曲。簡單的說，小冰 FM 現在還更像那個隨便聊天的小冰，而不是一個音樂主播。

還有一個問題來自小冰簽約的版權曲庫咪咕音樂：如果你恰好問道咪咕音樂沒有版權的歌曲，小冰就會開始比較生硬的岔開話題，不幸的是，咪咕音樂缺的歌挺多。

微軟想讓小冰接觸更多人，可似乎用力的方向不大對

微軟在推廣小冰這件事上做了不少事情，但看起來效果一般。

小冰在東方台《看東方》節目播了很長一段時間的天氣預報和客串主持，但視覺形象隻有一行字和一個麥克風圖標；在北京青年廣播和湖南電台音樂之聲做過客串主持，但聽收音機本來就是一件不再流行的事，更何況是要宣傳一個看不到形象的聲音。

最近在湖南衛視播出的《我是未來》看上去是小冰形象最突出的一次，節目給她設計了一個虛擬形象，節目的內容也和人工智能關係密切。

相比之下，百度做的人工智能在電視節目《最強大腦》裏的表現就要突出很多，不僅給這個人工智能設計了一個實體機器人，還在比賽環節裏給它拚命加戲：比如選手和人工智能比賽人臉識別的環節，百度這個機器人也假模假式地看著照片，實際上稍有了解的人就知道，這些數據是直接喂給人工智能的，根本沒有所謂“看”的環節。

微軟在發布會上說，接下來小冰會參與 CCTV 一檔《機智過人》的綜藝節目，估計以後 CCTV 的宣傳效果會相對好一些。

從微軟內部產品來看，它們會把 AI 慢慢加進產品序列。現在 Office 套件中已經集成了很多人工智能的組件，比如對幻燈片實時文字解說和實時翻譯的工具，Skype 裏麵也有人工智能翻譯工具等等。

微軟執行副總裁沈向洋說，微軟的人工智能主要兩個路線，一個是圍繞現有產品的人工智能化，比如 Windows 和 Office，一個是圍繞政府、醫療、交通行業的行業應用，另外還有人工智能倫理方麵的前瞻研究。

喜歡這篇文章？去 App 商店搜好奇心日報，每天看點不一樣的。