
微軟發布了一款基於計算機視覺技術的手機 APP “Seeing AI”(“視覺 AI”) ,能為有視力缺陷的殘障人士描述周圍的世界。
安裝該 APP 之後,用戶若把手機攝像頭對準某人,它就會說出這個人是誰,以及他的情緒(表情)。把手機攝像頭對準某個物體,Seeing AI 會說出這是個什麼東西。這通過在手機本地運行的 AI 算法實現。

去年三月的 Build 大會上,微軟展示了這款 APP 的原型。今天,它終於發布。美國 iOS 用戶已可免費下載。至於 Seeing AI 何時會登陸安卓、進入中國市場,尚沒收到任何消息。
核心功能
作為一款麵向殘障人士的生活輔助軟件,微軟把 Seeing AI 設計為能滿足一係列不同的生活場景需求。比如上麵提到的,進行麵部識別,猜測對方的年齡和情緒。它還能通過掃描二維碼識別家居物品,讀取、識別文件,識別美元鈔票。識別鈔票的功能是一個實用性極強的功能。所有美元紙幣都是相同大小、同樣顏色。對部分殘障人士,區分不同麵值的鈔票可能會十分困難,Seeing AI 這樣的 APP 則能解決該問題。

Seeing AI 的物體識別能力基於神經網絡來實現,其基本原理與自動駕駛汽車、無人機並無不同。它最基本的功能在本地實現。這有兩個好處:
網絡不穩定的情況下仍可使用;
反饋速度更快。
但是,Seeing AI 的試驗性功能,比如描述整個周圍環境,以及識別手寫文字,則需要連接到雲端。
人性化設計
Seeing AI 的技術帶頭人 Saqib Shaikh,向媒體透露了一個很有意思的細節:
Seeing AI 能夠指示用戶如何上下左右移動手機攝像頭,以看清楚目標物體。 這是一個相當人性化的功能,尤其考慮到視力有缺陷的殘障用戶,讓它們拿手機攝像頭“對準”某個物體本身就存在相當的難度。很顯然,對於 Seeing AI 來講,雖然光學物體識別技術是根本,但若沒有這類人性化功能設計,它究竟有多少實用價值就變得十分模糊。

從 Saqib Shaikh 他自己的使用經曆來講(他是一名盲人),他最經常把 Seeing AI 用來識別符號和菜單。至於 Seeing AI 和其他同類 APP 之間的差異,他表示,最大的區別神經網絡的運行速度:
“我們做到了在本地運行人臉識別,幾微秒的時間內你就能聽到結果。速度就是一切,我們試圖壓榨出在設備本地所能達到的極限。”
via the verge,編譯
相關資訊
最新熱門應用
智慧笑聯app官網最新版
生活實用41.45MB
下載
盯鏈app安卓最新版
生活實用50.17M
下載
學有優教app家長版
辦公學習38.83M
下載
九號出行app官網最新版
旅行交通28.8M
下載
貨拉拉司機版app最新版
生活實用145.22M
下載
全自動搶紅包神器2024最新版本安卓app
係統工具4.39M
下載
掃描王全能寶官網最新版
辦公學習238.17M
下載
海信愛家app最新版本
生活實用235.33M
下載
航旅縱橫手機版
旅行交通138.2M
下載
雙開助手多開分身安卓版
係統工具18.11M
下載