係統粉 > IT資訊 > 微軟資訊

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?

發布時間:2017-08-23    瀏覽數:

語音到文字的轉換是語音研究領域的重要課題,可以說語音識別是眾多研究團隊和企業正在努力攻克的技術高地,有關識別準確率的競爭和比較從未停止。

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(1)

自引入神經網絡的方法以來,語音識別正確率有了長足的進展,也為蘋果 Siri、亞馬遜 Echo、科大訊飛語音輸入法等等實際產品提供了生長的土壤。去年,微軟率先實現語音識別係統5.9%的低錯誤率,在Switchboard對話語音識別任務中已經達到人類對等的水平。

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(2)

今年的8月20日,微軟語音和對話研究團隊負責人黃學東興奮地公布了他們的最新進展,他們的語音識別係統也達到了同樣的5.1%的錯誤率。這是業界的新的裏程碑,也比他們去年的成績又有顯著的提高。

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(3)

近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。

語音識別還是存在幾大難點

一、讓語音識別機器能夠聽懂人的“話”

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(4)

所謂用戶的獨立性,就是語音識別軟件能夠識別有不同嗓音和口音的用戶,而無需通過訓練軟件來使其識別一個特殊用戶的聲音。目前的許多語音識別軟件,是基於標準的發音來進行識別的。而實際上,人們說話千差萬別,發音也各不相同,特別對於有口音的語音來說,更是對語音識別軟件提出了嚴峻的挑戰。

二、機器掌握自然語言的能力

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(5)

許多語音識別係統還具有自然的語言能力,這就是軟件理解講話者的能力。這種能力不僅表現在特定的單詞上,甚至還表現在短語和完整的句子上。

三、語音識別身份的能力

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(6)

語音識別還可以發展軟件身份驗證的能力,即根據用戶的嗓音和語言特點,來達到識別用戶的能力。這在實際中是一個非常有價值的特點,如可用於人事管理上。

四、雞尾酒會問題

微軟語音識別係統達到了5.1%的錯誤率, 那麼語音識別還有哪些難點需要攻破呢?(7)

這是指有多個說話人情況下的語音識別問題,比如雞尾酒會上很多人講話。這種情況下人是有可能聽清楚你關注的人在說什麼的,當然手勢、口型、表情以及聊天話題都會提供幫助。這種環境下的語音識別是相當有挑戰的。

上一篇:內存占用太滿, win10渣還是內存假? 下一篇:微軟Office Lens安卓版更新:掃描多個文檔合成一個PDF文件

相關資訊

最新熱門應用

電腦問答