係統粉 > IT資訊 > 穀歌資訊

穀歌用AI合成語音:真人難以辨別瑕疵

發布時間:2017-12-29    瀏覽數:

       12月29日消息,穀歌本月推出了一款名為“Tacotron 2”的全新文字轉語音係統,它具有驚人的發音準確性,且實際文本閱讀效果幾乎同真人聲音無法區分。

穀歌用AI合成語音:真人難以辨別瑕疵(1)
穀歌用AI合成語音(圖片來自baidu)

       “Tacotron 2”其實已經是穀歌的第二代類似技術,它由兩個深度神經網絡組成。目前,該係統隻進行了英語女聲的訓練(如要需要它發出男性聲音的話,穀歌則需要對其進行重新“培訓”)。

       穀歌的研究人員表示,“Tacotron 2”完全可以準確發音一些非常複雜的單詞和人名,並根據標點符號的不同而有所區分,甚至能夠完美地講完一段繞口令。舉例來說,“Tacotron2”會默認在讀到大寫單詞的時候加重語氣,也能夠處理少量的人為打字錯誤。

       “Tacotron 2”上所謂“語音合成技術”又稱文本轉語音(TTS)是如今很多移動產品和應用上不可或缺的技術模塊,例如語音交互應用、導航、語音控製以及為視力障礙者設計的產品中都需要語音合成技術的支持。在此之前很長一段時間內,語音合成技術都是采用拚接方式,需要記錄大量語料才能進行語音合成。這樣的方法不僅前期需要處理大量數據,而且一旦說話人有所改變就需要重新記錄和處理,所以業界一直在尋找可以實時生成語音的方式。

上一篇:5年反壟斷期限已到!穀歌:將繼續履行承諾 下一篇:猝不及防 穀歌最強安卓平板Pixel C今日正式停售

相關資訊

最新熱門應用

電腦問答