係統粉 > IT資訊 > 微軟資訊

微軟管震:基於神經網絡的語音合成(預覽版)正式上線

發布時間:2018-12-28    瀏覽數:

“我們聽到一個詞叫‘邊緣智能 ’或‘邊緣計算’,智能放在邊緣上麵,會產生很多有意思的事情。”

12月20日,微軟中國首席技術顧問管震在“2019智能終端 AI+技術峰會暨2018全球好手機最佳供應商頒獎典禮”上發表了題為《邊緣智能的力量》的演講,並表示,微軟目前在人工智能更新上有一些進展,其中包括語音合成、機器翻譯研究係統等。

“5G到來之前,邊緣計算是一個避不過去的話題。”


微軟管震:基於神經網絡的語音合成(預覽版)正式上線(1)

微軟中國首席技術顧問管震


12月,基於神經網絡的語音合成(預覽版)正式上線。

據介紹,此版本的語音合成質量更高,引擎性能也更為出色。

“我很驚訝,我以為人工智能應該不會發展這麼快。實際上,微軟的語音合成已經達到一個較高的水平。”管震表示。

隨後,管震現場播放了兩段音頻,“雖不至於詩與遠方都是幻想,但陌生的環境未知的生活,並非每個人都有能力、有心境、有底氣把日子過得開出花。”“為你找到以下列車,其中第一班是後天14:10從杭州出發,二等座價格是73元。”

“大家可以猜猜,哪個是錄音,哪個是AI合成。”管震笑了笑說道,“實際上,這兩段音頻都是AI合成。”而前一段音頻更具人性化。

管震指出,“客戶向我們提出了更高的要求。畢竟手機的語音合成如果像地鐵報站一樣,給人的感覺會不舒服。”

據介紹,微軟的定製化語音技術已經可以通過語音合成模仿人的說話、呼吸聲,甚至讀屏時有語氣有情感,以此表現出人的特性。

今年,微軟發布了一個參考設計,對於原場收音,可以單獨挑出每個人的語音。微軟的人工智能技術全部在雲端運用。“微軟擅長的是,在一定範圍內,把語音挑撿出來並做出分析。”

管震透露,今年微軟的目標,是在文本理解能力在標準的數據集、機器翻譯的能力上超越人類,語音合成以及語義理解能力達到人類水準,機器可以和人們暢通對話。其中機器翻譯的能力與語音合成技術已經落地。

上一篇:微軟75億美元收購GitHub獲批,市值超亞馬遜,成全球第二 下一篇:6寸的掌上遊戲機 GPD WIN2,還配win10操作係統?

相關資訊

最新熱門應用

電腦問答