對於一些視力缺陷者來說,日常生活的衣食住行中會存在相當多的麻煩。而現在,微軟推出了一款名叫Seeing AI的應用,可將視覺世界變成一種可聽見的語音體驗,這款應用或許能夠為他們提供一定的幫助。

Seeing AI 支持人物、短文、文本、條形碼以及場景的識別,用戶隻需要拿住iPhone設備在四周移動,應用會通過神經網絡技術,將這些信息轉化為語音,讓用戶可以“聽到”周圍的環境情況,從而為視力缺陷者進行服務,Seeing AI大大方便了視力障礙者的日常生活。

人物及周圍環境的掃描
對人物的識別是微軟利用圖像識別工具提供更深入的圖片解釋。識別人物之後,Seeing AI 不僅可以判斷此人的性別以及大概的年齡,甚至可以對此人的外貌以及麵部表情進行表述。
看看下圖Seeing AI對小哥的描述:一位滿頭黑發表情自然的男士,識別結果還是很準確的。

此外,使用Seeing AI對周圍環境進行掃描,還能了解到周圍有多少人,這些人所在的位置以及與你的距離,當然還可知道這些人的麵部表情。
Seeing AI還有一個新奇之處,你可以教Seeing AI去識別某個特定的人物。進入“臉部識別”功能,對某個人物的臉部進行三次拍攝,並做相應的姓名標注即可完成該人物信息的錄入,當你再次識別此人時,Seeing AI就會說出他的名字。
短文內容的自動識別
短文識別功能簡單來講就是哪裏看不清拍哪裏,這個功能結合了圖像識別技術與自然語言處理技術,將文本信息轉化為語音信息。這一功能可以幫助視障人士獲得對圖像的準確描述,還可能幫助那些需要圖像信息卻無法直接看到圖像的人——比如正在開車的司機。

在測試的過程中挖 App 君發現,在Seeing AI在“朗讀”文本的過程中,如果攝像頭捕捉到了更加清晰的文本圖像,那麼Seeing AI會從頭開始“翻譯”這段文本。
經過測試會發現Seeing AI識別效果很好,在識別讀出內容的過程中幾乎沒有錯誤。但在語言係統方麵有些遺憾,應用目前隻可以識別英文和阿拉伯數字,並不支持中文及其他語言的識別。
文件和條形碼的探測
文件識別的操作相對複雜一些,將攝像頭對準文本,Seeing AI 會引導你的手機放置,直到所選取的文本周圍出現邊緣,聽到“Hold steady”的聲音,然後拍攝進行文本識別。在文本識別之後,還可以使用 VoiceOver 功能對文本進行操作。

將手機攝像頭對準條形碼則可以對其進行識別,在掃碼的一瞬間會聽到嗶嗶的聲音,條形碼檢測成功後,Seeing AI 會說出產品的名稱。如果你想了解更多有關產品的信息,則可選擇點擊右下角的按鈕進行詳細的了解。
複雜場景的描述
場景的識別是讓計算機用更加人性化的方式去描述圖像,Seeing AI 會對識別的場景進行詳細的描述。比如下圖,Seeing AI 不僅會告訴你這是一台筆記本電腦,它還會告訴你這台電腦是以打開的狀態放置在桌上這樣詳細的描述。
不過場景識別的功能目前還處於測試階段,所以場景識別的結果並不總是正確的,相信微軟之後會完善這個功能。

小結
Seeing AI實現了“語音世界的魔法”,利用手機攝像頭將文字、人物、商品、場景等信息轉化為語音,讓更多的弱視群體盡可能的“獨立”,有助於為視障人士營造更公平的環境,與正常生活縮小差距。Seeing AI 的出現會在一定程度上讓更多的人利用人工智能技術來造福人類。
Seeing AI 的部分應用可在離線狀態下使用,但是在語音方麵暫時隻支持英文係統,對該應用感興趣的小夥伴可以前去美區App Store下載體驗。
相關資訊
最新熱門應用
歐意易交易所蘋果手機app
其它軟件397.1MB
下載
biki交易所app蘋果版
其它軟件64.78MB
下載
原子幣交易所安卓app
其它軟件223.89MB
下載
幣贏交易所app手機版安卓
其它軟件52.2 MB
下載
bitmart交易所官網app
其它軟件38.61MB
下載
比特交易所官網app
其它軟件57.63MB
下載
維克萊交易所app安卓
其它軟件81.97MB
下載
比特兒交易所app官網版安卓
其它軟件292.97MB
下載
mexc抹茶交易所app
其它軟件137MB
下載
熱幣交易所官方
其它軟件287.27 MB
下載