語音到文字的轉換是語音研究領域的重要課題,可以說語音識別是眾多研究團隊和企業正在努力攻克的技術高地,有關識別準確率的競爭和比較從未停止。

自引入神經網絡的方法以來,語音識別正確率有了長足的進展,也為蘋果 Siri、亞馬遜 Echo、科大訊飛語音輸入法等等實際產品提供了生長的土壤。去年,微軟率先實現語音識別係統5.9%的低錯誤率,在Switchboard對話語音識別任務中已經達到人類對等的水平。

今年的8月20日,微軟語音和對話研究團隊負責人黃學東興奮地公布了他們的最新進展,他們的語音識別係統也達到了同樣的5.1%的錯誤率。這是業界的新的裏程碑,也比他們去年的成績又有顯著的提高。

近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。
語音識別還是存在幾大難點
一、讓語音識別機器能夠聽懂人的“話”

所謂用戶的獨立性,就是語音識別軟件能夠識別有不同嗓音和口音的用戶,而無需通過訓練軟件來使其識別一個特殊用戶的聲音。目前的許多語音識別軟件,是基於標準的發音來進行識別的。而實際上,人們說話千差萬別,發音也各不相同,特別對於有口音的語音來說,更是對語音識別軟件提出了嚴峻的挑戰。
二、機器掌握自然語言的能力

許多語音識別係統還具有自然的語言能力,這就是軟件理解講話者的能力。這種能力不僅表現在特定的單詞上,甚至還表現在短語和完整的句子上。
三、語音識別身份的能力

語音識別還可以發展軟件身份驗證的能力,即根據用戶的嗓音和語言特點,來達到識別用戶的能力。這在實際中是一個非常有價值的特點,如可用於人事管理上。
四、雞尾酒會問題

這是指有多個說話人情況下的語音識別問題,比如雞尾酒會上很多人講話。這種情況下人是有可能聽清楚你關注的人在說什麼的,當然手勢、口型、表情以及聊天話題都會提供幫助。這種環境下的語音識別是相當有挑戰的。
相關資訊
最新熱門應用
比特交易平台官網
其它軟件57.63MB
下載
中幣交易所app ios
其它軟件77.35MB
下載
火網交易所app官方最新版安卓
其它軟件175MB
下載
虎符交易所app官方
其它軟件287.27 MB
下載
今日水印相機官網最新版
攝影圖像68.15M
下載
歐意錢包app官網安卓手機
其它軟件397.1MB
下載
比特兒交易所app官網
其它軟件292.97MB
下載
ceex創享交易所最新版本
其它軟件11.7MB
下載
wbtc交易所免費版
其它軟件292.97MB
下載
香港數字資產交易所鏈接
其它軟件292.97MB
下載