· 本文內容分為:語音版+圖文版(了解什麼是【美女與IT獸】)
· 應用場景:人工智能、物聯網如何在行業中落地,產生商業價值?
· 收聽/閱讀時間:10分鍾
· 掌握難度:★★★☆☆
Long time no see(一段時間不見都開始飆英文了)~
這段時間你們是不是在低調奢華地搞大事?
我們的主播反正搞了一件兩件不大不小剛剛好的事情,待會兒讓她自己告訴你們。
總之,【美女與IT獸】又回來了!
看(聽)過之前11期的IT獸們都知道,我們一直說的是物聯網、人工智能、大數據...的那些事兒!
今天的華麗返場,就一次把人工智能說個夠!
大家晚上好!我是Grace·好久不見·終於忙完微軟物聯網·人工智能大會·剛喘了口氣·又要開始忙上海站·Peng。
肯定有好多IT獸“肉身”或在線參加了我們第二屆微軟物聯網大會——Empower
今天要跟IT獸們分享的內容,就是基於“Empower”大會上Alan IP博士分享的主題而延展的:《微軟人工智能都能做啥?》
Alan博士真相:
是不是玉樹臨風瀟灑倜儻飽讀詩書氣自華......?
好了,我們進入正題:
首先,我們先理清楚微軟對人工智能這件事的態度:
人工智能,微軟不是第一天搞,5位圖靈獎得主坐鎮不是吹的。但微軟一貫的調性是默默站在小夥伴們身後。
比如:馬斯克的Open AI和Dota 2世界冠軍打遊戲,差點把世界冠軍打哭。
然後Open AI就火了,可你們都不知道這背後其實是Azure在支持,直到馬斯克同誌發了一條推文:
再舉個栗子:微軟把對人工智能的通用研究都開放了出來,可以讓人工智能應用開發者直接使用的(微軟認知服務)API就有30項!
☞ 如果你在電腦邊,趕緊收藏這個鏈接:https://azure.microsoft.com/zh-cn/services/cognitive-services/
接下來,我們就來開始深扒這些微軟的人工智能API都在做啥!三十項我當然不可能全念一遍,你們的耳朵一次也吃不下。
那麼,就按著我的愛好來劃!重!點!
熱度排名第一的當然是:已經在國內Azure落地的——
計算機視覺服務微軟的人臉識別、情緒識別和計算機視覺三項服務已經在國內Azure上落地。
☞ 複製以下鏈接至服務器,查看國內Azure上的認知服務API
https://www.azure.cn/home/features/cognitive-services/
人臉識別效果怎麼看?
“LFW”都造吧?就是那個被各家廠商用來測試自家人臉識別引擎好壞的圖片庫。
從95%的識別準確率到98%...99%...99.6%...99.7%!
世界紀錄一再被不同時期的不同技術公司一遍遍刷新~
以前,我覺得這個指標好牛啊——微軟在2015年起就一路領先,LFW識別率一路向上,當然後來居上者也挺多,國內就好幾家。
可是有不少小夥伴拿著世界第一99.x%識別率的微軟認知服務上,放到實際項目中一看——咦,不是這麼回事兒啊!
比如:在零售領域,便利店的攝像頭辨別成功率不到80%,這是怎麼回事兒呢?(我也很苦惱啊難道我吹的牛要破了麼)
後來才知道,原來大家競相用來刷世界紀錄的LFW識別率是一組靜態的成對圖片,相當於老師劃了重點,“來來來我們要考這些啊,你們回去自己好好準備。”
所以學霸當然就高分了。
但是就算學霸也不是出校門就直接工作的,比如實際的應用場景裏可不都是靜態圖片,而是有黑黑的人,有模糊的人,有帶著口罩的人,還有剛化了妝美過顏的......
所以在實際應用中人臉識別的LFW識別率再高,就算是100%,也需要根據場景來調整應用人臉識別的姿勢。
再舉個實際的例子:有時候一張照片裏有很多人,想統計一下大概有多少,但如果僅用人臉識別就很苦惱…你看:
這時候計算機視覺其實就不應該用人臉了(都是後腦勺用什麼人臉啊),用人形或者頭肩,才能識別:
人臉識別目前用在哪兒?高度敏感或者涉及安全的事兒,還是再等等吧。
現在雖然有很多輔助的方式來讓刷臉識別看起來更安全可靠,但是保不齊哪兒有這樣的漏洞或者技術還不完善的坑呢?
(別的都不說了,XX那個人臉識別,讓我一直眨眼睛 然後一直說沒識別到我眨眼睛 我眨了啊!!!眨了啊!!!!!眼睛小也歧視啊!!!)
所以人臉識別目前比較尷尬的問題:核心不是技術,而是怎麼變現;或者是大家能不能一起努力支撐到成為主流生產力的問題。
在一些不是那麼敏感的方向上,有一些交互的需求正在實現。
比如,今年四月微鯨發布係列新品,其智能兒童鎖功能與微軟人臉識別技術強強聯合,通過特征識別人臉,就能判斷用戶的性別、年齡。
如果是兒童就會自動跳轉到適合兒童觀看的動畫片、益智類節目;可以設定觀看時長,超過了設定期限,就會自動鎖屏,隻有通過大人刷臉才能再次進入。
又比如,Uber驗證司機是不是同一個人,用的也是微軟認知服務:
再比如,很多做家庭存儲的IT獸用計算機視覺API生成智能縮略圖,無論圖片怎麼縮小,Azure認知服務都會自動找到這張照片的重點然後按照縮略圖的形狀大小來智能調整:
(如果你縮的都隻剩條邊了我也沒有辦法)
例子好多我們今天講不完,反正可以看到——計算機視覺的未來很可能是計算機可以識別所有東西。
下麵,是微軟在今年的Build大會上放的視頻截圖:
當你找不到錢包、鑰匙的時候就喊一嗓子:“我的錢包呐?”很可能你的管家機器人就去找到然後給你拎過來了。
(講到這裏突然發現...我才剛開場!本來隻想略略帶過耳熟能詳的計算機視覺服務...略了這麼多,我也很絕望!)
這樣吧,接下來我用一個現在很熱、應用麵很廣的場景來挽尊:
智能客服廣不廣?無論你是電商、呼叫中心、還是金融企業...都會需要智!能!客!服!
傳統客服&初代智能客服
傳統的客服…大家應該都很熟悉,反正就是培訓禮貌用語,然後給話術,寫好路徑跳轉,然後就開始接電話…...
後來有些企業發現:留存在係統中的數據可以用於智能客服,可以更精準地預測用戶的行為模式和應答可能性,關鍵是可以減少人工!
於是,第一和第二代的智能客服就華麗麗地出現了。
然而,保不齊有些調皮顧客會出現:
- 銀行電話:因近期盜竊信息案件頻發,根據您在餐飲店的消費記錄,有可能存在安全隱患,您尾號XXXX信用卡需要更換新卡以確保資金安全...
- 我:那我以後不刷卡都用微信支付好了
- 銀行:......(你怎麼不按腳本說話呢我思路都亂了)
對麵的客人一旦開始不按寫好的跳轉路徑來回答問題或者進行反問,智能客服的腦子就不夠用了。
如:“我說大妹子啊我想知道微軟Azure在人工智能這個territory四不四能meet到我客戶想要智能客服的expectation啊?”
天呀!方言、中、英文夾雜還帶錯字的,智能客服們立馬亂了陣腳,隻能給出諸如:“對不起,我還不懂您的問題,請換個方式重新提問”、“提問失敗,請重試”的回答。
所以,首先你得要有一個能理解對方說了什麼意思的人工智能,在微軟,這個服務叫LUIS。
理解對方意思的人工智能語言理解智能服務 (LUIS) 提供了一些簡單工具,可讓IT獸們構建自己的語言模型(目的/實體),這可讓所有應用程序或機器人,都能理解用戶的命令並執行相應的行動。
#做個示範#
第一步:進入網址(https://azure.microsoft.com/zh-cn/services/cognitive-services/language-understanding-intelligent-service/)
第二步:你看這個燈是不亮的對吧?
第三步:輸入“switch all lights to green“;好了,LUIS(下圖看右邊)就意識到了我的Intent(意念)是要把燈都打開,並調到綠色,於是(好有趣有沒有?):
使用 LUIS 可快速部署到一個應用的入口(或者叫End Point),它將獲取你發送到這個End Point的句子,並按其傳達的意圖對這些句子和存在的關鍵實體進行解釋。
如果遇到剛才那種“不講方言和English就會die”星人呢?
在處理了幾十個交互後,LUIS 就會開始主動學習,並弄清楚什麼是對的,什麼是不對的,以及什麼是自己還弄不清,需要人工來幹預的。
理解說話情緒的文本分析API如果你還想更進一步:了解這個對麵正在跟你說話的哥們是生氣臉在投訴,還是很滿意寫表揚信,或者情緒是否正在變化...
辣麼,“文本分析 API”就起作用了。
你看啊,左邊輸入一段話,文本分析API不僅幫你弄清楚人家是哪國,還弄清楚對方說話的情緒是否穩定。
左:I had a wonderful experience! The room was wonderful and the staff was helpful.
右(文本分析API):
- 語言:英語
- 關鍵詞語:wonderful experience staff room(這是誇我們房間和員工都棒棒噠~)
- 情緒:100%(嗯,客人情緒很不錯)
能不能支持中文?
hmmm…這個LUIS是支持的,不過文本分析的中文支持還在加班加點呢。當然各位IT獸們做的都是全球生意,文本分析會11國外語呢!
智能斷句能力
有意思的是,LUIS也好,文本分析API也好,其實都有個智能斷句的能力。
給他一段話他能弄清楚你想表達的主要意思,API 會返回一個字符串列表,指示輸入文本中的關鍵要點,你的App或者機器人在回答對方問題的時候就可以自動去除掉一些口誤。
還是剛剛那個“三語用戶”提出的關於Azure服務的問題,現在擁有一定語義理解能力的智能客服就會回答:
“您好,不同的客戶對雲計算的服務要求也會不同,您可以在www.Azure.cn頁麵查看其具體介紹”。
因為你的智能客服已經識別出來對方的整體意圖。不過因為沒有解決客戶的問題,用戶仍免不了切換頁麵再次搜索的操作。
那要怎麼讓客服機器人不僅能認識到對方說什麼,還要能對應上知識體係呢,這時候第三項人工智能研究成果出現了:
Microsoft Concept Graph微軟亞洲研究院去年10月27日正式發布Microsoft Concept Graph知識圖譜 和 Microsoft Concept Tagging 模型,用於幫助機器更好地理解人類交流並且進行語義計算。
什麼是知識圖譜?
知識圖譜旨在描述真實世界中存在的各種實體或概念,按照輸入問題的難易程度,分為簡單類和複雜類兩種。
對於簡單問題:隻需要一個三元組就能搞定,即實體A-關係B-實體C,如夏天-適合穿的-裙子。
對於複雜問句:需要多個三元組,有時需要進一步的推理或者做一些計算,可以用“實體A-關係B-實體C;實體C-關係D-實體E”表現A與E的關係。
如用戶的問題是:“微軟Grace喜歡的口紅色號是什麼?”
用知識圖譜表現就是:微軟-Grace Peng-口紅;Grace Peng-最喜歡的-口紅色號
你肯定要問了,我的天呀,世界辣麼大,知識辣麼多,我怎麼知道怎麼歸納呀。
好了,我要說微軟做了一件大大的好事兒:我們亞研院發布的知識圖譜和標簽模型可以為機器提供文本理解的常識性知識,其中,知識圖譜包含了540萬條概念。
微軟亞太研究院 閆博士“
理解是萬事萬物的基礎,我們用計算機抓取過去這些不成文的開放領域的常識,能夠幫助計算機更具象地了解這個世界。
”
完整地說就是:Microsoft Concept Graph是一個大型的知識圖譜係統。
其包含的知識來自於數以億計的網頁和數年積累的搜索日誌,可以為機器提供文本理解的常識性知識。
除了包含一些被絕大部分通用知識庫包含的概念,例如“城市”、“音樂家”等;Microsoft Concept Graph還包含數百萬長尾概念,例如“抗帕金森治療”、“名人婚紗設計師”、“基礎的水彩技巧”等,而這些概念在其他的數據庫中很難被找到。
除了概念,Microsoft Concept Graph同樣包含了大量數據空間(每條知識概念都包含一係列的實體或者子概念,例如“太陽係”底下可能就會包括“水星”、“火星”、“地球”等等)。
於是知識結構就變成這樣了:
☞ 複製以下鏈接至瀏覽器打開,就可以下載!
https://concept.research.microsoft.com/Home/Download
好了,你的客服機器人現在已經完成了:理解用戶說了什麼,了解TA的情緒,知道用戶想要幹什麼...
接下來,就要去實際做事情了,比如訂票,選衣服款式,開個Azure測試賬號啊什麼的。
這部分誰做呢?
Bot Service,Azure上的對話即服務的API。
不過,這部分我們想稍等等,有幾個項目正在歡快的進行中,希望很快能更大家分享。
今天可以去探索的,有很多。
探索後請告訴我們你的感受,好的不好的...我們都歡迎!
最後總結今天的內容主要就是:先講人工智能應用路上我們趟過和填好的那些坑;然後再給大家挖幾個新坑哈哈哈哈哈哈…
好了不鬧了(正經臉)
強烈建議:對人工智能有興趣的IT獸們,參加10月底在北京舉辦的微軟Tech Summit,這可是微軟一年中唯一一場收門票的活動,主題都是經過千挑萬選的。
☟ 複製鏈接至瀏覽器打開,立即報名 ☟
https://www.microsoft.com/china/techsummit/2017/?wt.mc_id=AID642533_TechSummit_Social_WeChat_SMBMarketing
*本文轉自公眾號:微軟商業視角
相關資訊
最新熱門應用
貨拉拉司機版app最新版
生活實用145.22M
下載全自動搶紅包神器2024最新版本安卓app
係統工具4.39M
下載掃描王全能寶官網最新版
辦公學習238.17M
下載海信愛家app最新版本
生活實用235.33M
下載航旅縱橫手機版
旅行交通138.2M
下載雙開助手多開分身安卓版
係統工具18.11M
下載得間小說極速版官方最新版
閱讀資訊54.43M
下載趣看小說app免費版
閱讀資訊16.89 MB
下載qq瀏覽器2024最新版本官網
係統工具95.4M
下載點點穿書安卓免費版
閱讀資訊67.39MB
下載