係統粉 > IT資訊 > 微軟資訊

兩位微軟一年半新兵如何拿下KDD Cup 2017雙料冠軍

發布時間:2017-09-25    瀏覽數:

2017-09-25 14:58:32 作者:魏景芳

淩晨三點,胡可還在修正數據模型中存在的Bug,而網絡的另一頭,和他並肩作戰的黃攀也在忙著對數據噪音進行校正。每天睡眠不超過4小時,這樣的狀態在KDD Cup挑戰賽開始後已經持續了整整一個月。

兩位微軟一年半新兵如何拿下KDD Cup 2017雙料冠軍(1)

KDD Cup 2017雙料冠軍團隊部分成員:胡可(圖左)和黃攀(圖右)

雙料冠軍是怎樣煉成的?

每年3月的KDD Cup挑戰賽被看做是大數據領域的“奧運會”,各國的“最強技術大腦”們都會報名參賽,今年報名隊伍史無前例的達到了3582支,競爭異常激烈。同在微軟必應廣告團隊的胡可、黃攀和北京航空航天大學計算機碩士在讀的陳歡,以及在美團點評工作的高級技術專家燕鵬組成的“Convolution”團隊正是這3582分之一。

今年的賽題分為兩個任務,預測車輛從路口到收費站的平均用時和預測高速收費站車流量,雖然之前也出現過機場、公路的流量預測的賽題,但是今年賽題中路網結構的不確定性,加上車輛故障、交通管製等數據噪音的摻雜,對於參賽選手針對新問題進行快速建模的能力提出了很大考驗。

四個成員很快就找到了第二個賽題的規律,一直鎖定了TOP3的排名優勢。但是第二賽題的經驗並沒能在第一賽題上取得收益,第一賽題一度排名在前一百開外。盡管不斷校正數據模型,但是成績仍是小幅波動,沒有太大進展。

賽程眼看到了尾聲,模型在多種驗證過程中表現仍不穩定,這讓胡可和黃攀非常棘手。到了周末,正是團隊集中調整建模架構的時候,胡可提議,幹脆放棄有過擬合風險的提高模型複雜度的方式,轉向構建更多模型複雜度不那麼高的子模型來解決問題。

改進後的模型讓成績迅速提升,最終,“Convolution”團隊的成績超越了KDD Cup多年的冠軍隊伍台灣大學,拿下了兩個賽題的雙料冠軍。

“人才要到真正的戰場上去打才能練出來”

胡可和黃攀一下就在微軟乃至數據挖掘領域闖出了名頭,不過在微軟亞洲互聯網工程院副院長張祺的眼中,這樣的成績並不意外。“人才要到真正的戰場上去打才能練出來”,這是張祺也是微軟的用人之道。

兩位微軟一年半新兵如何拿下KDD Cup 2017雙料冠軍(2)

微軟的技術人才並沒有生活在“象牙塔”裏的習慣,張祺看來無論是廣告創新還是AI商業化,各領域的人員都需要通過“上一線”的方式來練手,“才能真正練出來”。微軟也給了技術人才在創新層麵的“絕對自由”,不會因為某個課題看上去成功的希望渺茫而去叫停或否定。

雖然胡可和黃攀都是通過校招的方式加入微軟,但是之前他們都已經以實習生的身份在微軟摸爬滾打了一段時間。微軟有明確的導師製度,雖然還是實習生的身份,但是他們都已經在導師的帶領下參與過很多國際化的核心項目,在擅長的項目中甚至會扮演相當重要的角色,實際建模和架構上手能力得到快速提升。

無論是內部技術創新活動“駭客馬拉鬆(Hackathon)”的推動,還是外部的KDD Cup一類的技術挑戰賽和學術會議上的活躍表現,微軟的技術創新精神和兼容並包的文化滲透到了每個員工身上,哪怕是胡可和黃攀為代表的“新兵”。微軟研發會被業界冠以IT“黃埔軍校”的名號,正是源於微軟成熟的人才培養和成長機製所帶來的持續創新力。

AI賦能開始場景化、商業化落地

隨著人工智能AI的紅利,越來越多的領域開始嚐試使用機器學習來解決現實問題,從KDD Cup賽事命題方向的變化就可以反映這種趨勢。以往的賽題多集中在推薦係統的設計,近年來開始轉向機器學習技術在教育、交通等傳統行業的實際應用問題。

人工智能已經從技術概念逐步開始了場景化、商業化的落地,在AI領域布局超過26年的微軟身上,這樣的轉變趨勢更加明顯。長久以來人工智能技術一直作為“發展方向”和“技術理念”存在於微軟研究院裏。但是僅僅一年多的時間,AI就已經貫穿了微軟的全部產品和服務,在各種應用場景中落地,激發新的生產力。

在微軟AI產品的第一線上:必應搜索通過大數據挖掘和深度學習,構建用戶畫像和知識圖譜,使廣告業務營收尤其是RPS(revenue per search每次搜索營收)指標顯著提升;智能助理Cortana(小娜),已經在Windows10平台上回答了超過120 億條問題,擁有超過1.33 億活躍用戶;情感機器人小冰,已經被全球超過1億用戶“領養”,對話輪次超過300億……微軟AI產品的落地正在逐步改變人機交互方式。

在微軟其他的產品和服務中,AI的融入也激發了全新的生產力。Office正變得越來越智能, Word和Outlook會自動找出與你正進行的工作相關的資料,PowerPoint會自動圍繞特定主題來製作計劃大綱,Excel則會自動繪畫不同的圖表。此外,微軟通過Azure智慧雲的認知服務將人工智能的積累變成API接口,開發者隻需要采用程序接口調用,就能簡單快速地給應用程序加入智能。

此外,微軟還明確了AI商業化的路徑,縱向比如零售、醫療、金融等領域提供行業解決方案,橫向比如人力資源、客服、銷售、市場營銷等模塊提供業務流程方案,老牌科技巨頭微軟希望在“數字轉型”的新浪潮中搶占先機,在微軟全球資深副總裁洪小文看來“數字轉型是我們現在看到的,業界也是微軟接下來最大的機會。”

去年9月,微軟成立了“人工智能和微軟研究事業部”與核心的Office事業部、Windows 和設備事業部、雲計算和企業事業部,成為微軟四大業務之一。微軟人工智能業務的帶頭人沈向洋給這塊業務製定了“3-5年實現100億美元營收”的目標。如果這個目標實現,人工智能的營收規模將與現在微軟最賺錢的雲業務並重。

肩上扛著這份重任的重要人物之一正是張祺,他所在的微軟亞洲互聯網工程院正是肩負著互聯網廣告、大數據、人工智能商業應用的使命。從2011年成立之初的16個人,迅速擴張到如今的500人,可見微軟對於AI商業化落地的重視,張祺提到“我們的重要性不可替代”。

對於100億的商業目標,微軟人工智能商業化的圖景已經全麵鋪開。

【精彩推薦】人工智能,微軟打了一場“暗戰”

上一篇:金山wps衰敗,微軟word主宰百分之九十市場;wps對比word完勝 下一篇:微軟win10應用商店升級, 不止賣軟件還賣電腦了!

相關資訊

最新熱門應用

電腦問答