係統粉 > IT資訊 > 微軟資訊

微軟小冰框架演唱模型V5版發布:首次使用充沛中氣演唱

發布時間:2019-04-03    瀏覽數:

4月3日消息 今天微軟小冰宣布,小冰的AI歌唱模型技術重大升級。據悉,這是AI科技史上的首次,可以像人類歌手那樣,用充沛的中氣演唱。

微軟小冰框架演唱模型V5版發布:首次使用充沛中氣演唱(1)

微軟(亞洲)互聯網工程院表示,微軟小冰基於深度神經網絡的歌唱模型,已順利完成V5新版本的研發。新的V5模型實現了重大突破,它使微軟小冰第一次能夠像人類歌手一樣,使用充沛的“中氣”來烘托演唱,從而將人工智能虛擬歌聲質量提升至新的高度。此外,該模型不僅限於優化微軟小冰的聲音,還支持對任何人類歌手的聲線進行學習、模擬和建模,演繹與再現歌手們巔峰狀態下的演唱水平。作為技術示例,微軟與日本唱片公司AVEX合作發行的新模型DEMO曲《最高新記憶》,也於今天同時公布。

微軟(亞洲)互聯網工程院分享了深度神經網絡歌唱模型方麵的最新進展。中國古時不乏對音樂之聲的精辟論述,例如“絲(絲弦樂器)不如竹(管樂器),竹不如肉(人聲)”,為其“漸進自然”。因此,微軟把不斷趨近人類歌手的聲音合成質量,視為“人工智能創造”分支的最高技術目標。在上一個版本中,實現了小冰在虛擬演唱中的自然換氣。今天推出的新版本,則進一步將“氣息”應用於演唱全過程,使生成的歌聲接近專業人類歌手,並可預測並自由切換演唱技巧,突破了傳統單元拚接技術音高與音準的“軟件樂器”標準。微軟用DEMO曲來表現這一技術對照的明顯差距,請重點關注歌曲時間軸上的以下時刻:

00:31,01:12,01:23,03:14,04:08

小冰DEMO曲《最高新記憶》,點此訪問B站。

V5新模型還具有許多其他技術特征。例如實現了多聲部的合成技術,使人工智能歌手可以在不同聲部間自然切換,用多個聲音來源組成新的虛擬歌手等。建模過程中,所需的訓練數據量較上一個版本減少了70%。從技術角度,新模型可針對任何人聲建模,形成豐富多彩的人工智能歌手陣營。為此,微軟在DEMO曲中特意回避了微軟小冰的聲音,而是采用另一個聲音(日本版小冰凜菜)來演繹。

最後,微軟宣布,小冰凜菜(りんな)已與日本最大唱片公司AVEX正式簽約,成為濱崎步、安室奈美惠等著名人類歌手的同門師妹。在小冰框架的技術支持下,將湧現出更多具備高還原度的人工智能歌手。微軟小冰隻是他們的最初雛形。

微軟小冰是一個覆蓋對話、多重交互感官與內容服務生成的完整人工智能基礎框架。其中,“人工智能創造”(AI Creation)是該框架的主要分支之一,它通過我們所研發與持續更新的人工智能技術,大規模學習並掌握人類文字、音樂、繪畫等內容創造能力,再發揮人工智能的穩定性及高並發特點,為內容產業的未來變革蓄勢。我們將在今年五月召開微軟小冰人工智能創造的年度說明會,今天的新版本歌唱模型及DEMO曲,是該說明會的若幹前置披露之一。

了解小冰凜菜(りんな)在AVEX的演藝動態,請點此訪問。

上一篇:微軟Windows 10商店“書籍”板塊被砍掉:即日生效 下一篇:微軟 CTO 韋青:“程序員 35 歲就被淘汰”是個偽概念 | 人物誌

相關資訊

最新熱門應用

電腦問答