係統粉 > IT資訊 > 微軟資訊

微軟刪除了世界上最大的公開人臉識別數據庫MSCeleb

發布時間:2019-06-15    瀏覽數:


微軟刪除了世界上最大的公開人臉識別數據庫MSCeleb(1)


我們查看了MS Celeb 官網,發現該網站已經變成了 404,但是微軟關於該數據庫的相關介紹頁麵還存在,根據超神經(hyper.ai)顯示,MS Celeb 上次更新是在 3 周前。

為什麼要刪除 MS Celeb 數據庫?

MS Celeb 是世界上最大的公開人臉識別數據庫,其中包含的人臉圖像基本都來自公眾人物。但是據英國《金融時報》報道,數據庫中采集的很多圖像的主人並沒有授權這一行為,MS Celeb 數據庫是通過“知識共享”(Creative Commons )許可證來抓取和搜索圖像的。

另外,雖然 MS Celeb 方稱數據庫中照片均來自於名人,但是柏林研究員 Adam Harvey 認為這裏“名人”的定義相當廣泛,該數據庫中還包含了很多記者、藝術家、音樂家、活動家、決策者、作家和學者的照片。《金融時報》聯係了存儲在該數據庫中的照片的當事人,他們表示並不知道自己的照片已經被收錄,其中科技類作家 Adam Greenfield 表示:“我絕不是一個公眾人士,沒有辦法放棄自己的隱私權。”

由於數據庫所使用的照片,沒有征得照片當事人的同意,所以微軟根據《知識共享許可協議》已將他們的麵部數據信息從搜索引擎和視頻中刪除。微軟方麵表示:“當初建立該網站的目的是為了學術需求。後來該網站交由不再與微軟合作的員工運營,而現在該網站已被移除。”

MS Celeb 是什麼?

MS Celeb 數據集是由全世界的 100 萬位名人的圖像組成的數據集,主要用於身份鑒定研究。MS Celeb 的訓練數據集會從這 100 萬名人中,根據受歡迎程度挑選排名在前 10 萬的名人,然後利用公共搜索引擎為每個名人搜索大約 100 張圖片,最終產生 1000 萬張網絡圖像。

MS Celeb 數據集是微軟於 2006 年發布的,主要發布人包括 Yandong Guo、Lei Zhang、Yuxiao Hu 、Xiaodong He、 Jianfeng Gao。如果想更加深入的了解 MS Celeb 數據庫,可以查看該論文。

MS Celeb 真的會被徹底刪除嗎?

雖然 MS-Celeb 數據庫現在已經被微軟移除,但是在被移除之前,已經被廣泛應用於麵部識別程序。據了解,目前有多個商業組織使用了 MS Celeb 數據庫,包括 IBM、鬆下電氣、阿裏巴巴、輝達、日立、商湯科技、曠視科技等等。

此次微軟移除 MS Celeb 數據庫,是否意味著它再也不能被使用了?其實並不是這樣,據了解之前下載過 MS Celeb 的研究人員和公司仍可正常使用,而且用於處理數據庫的工具也可被正常訪問。柏林研究員 Adam Harvey 表示:“雖然 msceleb.org 網站關閉了,但該數據集仍然存在於 GitHub 上的存儲庫中,這是無數研究人員的硬盤驅動器,並且可能會繼續用於世界各地的研究項目。”

隱私安全 VS 人臉識別

除了微軟移除 MS Celeb 數據庫,還有另外兩個學術單位也刪除了相關的數據庫,分別是由杜克大學研究人員建造的 Duke MTMC 監控數據庫和斯坦福大學的 Brainwash 數據庫。

Duke MTMC 數據集是一個大規模標記的多目標多攝像機行人跟蹤數據集。它提供了一個由 8 個同步攝像機記錄的新型大型高清視頻數據集,具有 7000 多個單攝像機軌跡和超過 2700 多個獨立人物,Duke MTMC-reID 是 Duke MTMC 數據集的行人重識別子集,並且提供了人工標注的 bounding box。

Brainwash 數據庫使用的信息來自舊金山下海區的 Brainwash 咖啡館的顧客,他們通過直播相機拍攝登門的消費者。斯坦福大學發言人表示,在其中一位研究者提出要求後,已經刪除了數據庫,該校致力保護學校和社區的個人隱私。

事實上,關於隱私安全和人臉識別的討論早已有之,人臉識別的反對方更注重隱私安全,他們認為隨著 AI 技術的發展,人臉識別的應用已經超過了實際用途,甚至變成了實時監控公民隱私的危險工具。2019 年 5 月,美國舊金山立法機構通過了禁止官方使用人臉識別技術的新法令,舊金山成為了全球首個官方被禁止使用人臉識別技術的城市。

而支持方則認為大家對人臉識別技術過度擔心了,我們應該監管人臉識別,而不是完全禁止。根據國際權威調研機構 Gen Market Insights 發布了《全球人臉識別設備市場研究報告 2018》顯示:“2017 年,全球人臉識別設備市場價值為 10.7 億美元,到 2025 年底將達到 71.7 億美元,在 2018 年至 2025 年期間將以 26.8% 的速度增長。”

所以,在人臉識別發展的道路上,我們要更加重視數據的共享和開放,相關研究單位、企業更要主動積極推動行業標準規範,維護采集、存儲的數據安全。

推薦閱讀

《服務器端 WCF 開發計劃不明,開發者表示遺憾》

《超 18000 項!微軟 AI 專利全球第一,超穀歌 2 倍、英特爾 4 倍》

......

點擊了解更多,查看更多相關文章

上一篇:群聯發布PS5017 SD Express主控:支持SD 7.1規範 下一篇:E3:微軟和育碧、任天堂接連發大招,幹貨大作快玩不過來了

相關資訊

最新熱門應用

電腦問答