8月21日消息,微軟日前宣布,其對話式語音識別係統的出錯率達到5.1%,創下目前為止的最低水平,達到了專業速錄員的同等水平。
微軟語音識別出錯率僅5.1%創新低(圖片來自baidu)
在此次研究中,專業速錄員具備重複收聽錄音等優勢。這兩次研究轉錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對話,自上世紀90年代以來一直被研究人員作為測試語音識別係統的樣本。
新研究由微軟人工智能及研究事業部的一組研究人員實施,目標是在出錯率上達到一組速錄員的同等水平,後者可以反複收聽錄音樣本,了解對話語境,與其他速錄員合作。
整體來說,通過改進微軟語音識別係統中基於神經網絡的聽覺和語言模型,實施最新研究的研究人員能夠在去年基礎上把出錯率降低大約12%。
顯然,他們還可以讓語音識別器了解整體對話,適應錄音樣本的語境,預測對話中很可能出現的下一個詞彙或短語。這正是人類在與其他人對話時的做法。
微軟的語音識別係統已被用於語音助手“小娜”、實時翻譯字幕功能Presentation Translator以及微軟認知服務中。
微軟的語音識別係統已被用於語音助手“小娜”、實時翻譯字幕功能Presentation Translator以及微軟認知服務中。
相關資訊
最新熱門應用
ambc交易所app
其它軟件34.95 MB
下載hopoo交易平台
其它軟件18.98MB
下載比特國際數字交易所app
其它軟件163.20M
下載安幣交易所app最新版官方
其它軟件178.1M
下載v8國際交易所app
其它軟件223.89MB
下載中幣交易app蘋果版
其它軟件223.89MB
下載歐意易交易所蘋果手機app
其它軟件397.1MB
下載biki交易所app蘋果版
其它軟件64.78MB
下載原子幣交易所安卓app
其它軟件223.89MB
下載幣贏交易所app手機版安卓
其它軟件52.2 MB
下載