Flitto翻易通是一個為機器學習提供語料庫的公司,為自然語言處理提供口語及日常生活類的翻譯數據,幫助機器進行學習。目前全球可以出售語料庫供機器進行學習的公司大概在15家左右,在中國則隻有5家。
我想下班 —— I want to work,Google翻譯什麼都好就是翻譯不好。
Google翻譯最初上線時,一句簡單的錯誤翻譯,引來了不少用戶的調侃,但內行看門道,外行看熱鬧。這看似輕鬆的調侃背後隱藏的卻是人工智能翻譯這一門大生意。
“在中英翻譯中,如果使用機器翻譯,正確率最高的是高精專用語,最容易出錯的反而是日常用語的翻譯,例如:我想下班,在英文的語境中,並沒有對應詞的表達方式,所以Google翻譯就會出現錯誤。這也反應了當機器翻譯遇到亞洲日常用語翻譯時,人工智能便成了人工智障。”Flitto翻易通中國區總裁黃海在接受騰訊創業采訪時說到。
要改善這個問題,則要依靠人工智能中的自然語言處理技術。讓機器翻譯通過學習大量的日常短語翻譯數據,在翻譯時觸及一句話中的所有詞彙,再結合語境完成正確翻譯。
而這種能讓機器學習的翻譯數據,在行業內被稱為語料庫。
Flitto翻易通便是一個為機器學習提供語料庫的公司,其主要致力於“服務”人工智能業務線內的NLP項目,為自然語言處理提供口語及日常生活類的翻譯數據,幫助機器進行學習。
目前全球可以出售語料庫供機器進行學習的公司大概在15家左右,在中國則隻有5家,而在2年之前,這家公司卻因資金短缺而瀕臨退出中國市場。
醉翁之意不在酒
靠給B端翻譯養活自己,打的卻是收集數據的主意
Flitto翻易通於2012年在英國倫敦的TechStars孵化問世,共有4位創始人,目前融資輪次已經達到B輪,累計獲得了1400萬美金的融資。
在成立之初,Flitto翻易通便瞄準了機器翻譯不夠準確的缺陷,主打多對一的眾包人工翻譯,同時為了避開高精專的專業翻譯,翻易通把產品定位放在了碎片化的生活語句翻譯上。
除了作為翻譯平台為用戶鏈接翻譯家,Flitto翻易通將平台內產生的所有數據,進行收集與校對處理。最終將積累到的用戶翻譯數據,變成了可供機器學習的語料庫。經過5年的積累,如今翻易通可供機器學習的語料庫,已達到超過1.5億條的規模。
但在2015年時,Flitto翻易通卻並不被投資人看好,一度因為資金問題而瀕臨解散。
2015年初入中國,Flitto翻易通的眾包人工翻譯模式便得到了許多同行的認可,許多創業公司紛紛開始進行模仿。
但這些模仿者不知道的是,Flitto翻易通一開始走的雖然是眾包翻譯、1對1專業翻譯的路線。但這一切都是為了能夠實時收集用戶在日常生活中會遇到的翻譯問題,通過收集與整理這些數據形成語料庫,向人工智能企業服務才是Flitto翻易通真正的目的。
同時,在商業模式上,Flitto翻易通也並未把對接個人用戶的翻譯需求當做收入來源。目前,在一筆眾包互助翻譯的交易中,翻易通隻會抽取交易金額的30%,用於支付應用市場付費分成、稅金等等費用,基本不在用戶身上賺取任何費用。
而能讓Flitto翻易通盈利的商業模式主要有兩個:1、出售語料庫 2、向企業提供各類翻譯服務。
在這兩種商業模式中,向企業提供翻譯服務時,翻易通會更像一家翻譯公司,積極響應各類翻譯需求。
據Flitto翻易通中國區總裁黃海介紹,目前Flitto翻易通在中國地區的企業翻譯服務上,已經服務過科大訊飛、新浪微博、百度地圖、聯合國網絡公開課、中國藝術研究院等企業,在企業服務上的收入已經可以保持公司良性運轉。
而作為利潤增長點的語料庫生意也開始步入正軌,Flitto翻易通已經開始向微軟、百度、NAVER、NTT docomo、SYSTRAN等國際公司出售語料庫。
那麼這樣一門看似知識付費,又踩著人工智能風口的生意,是不是人人都能做呢?
時間是一道跨不過去的門檻
語料庫的積累看似簡單,但處理起來卻特別麻煩
在Flitto翻易通中國區總裁黃海看來,語料庫這門生意,門檻主要有兩個:
1、需要長時間的積累數據
2、從翻譯數據到能被機器使用的語言資料,中間需要大量的人力進行校對
在機器翻譯中,錯誤率最高的便是人類生活中碎片化的語言翻譯,而可供機器學習的這類語言資料又是目前市場上最為稀缺的資源。
據黃海介紹,生活類的語言翻譯,因為場景不同,語言組合不同,翻譯的結果便完全不同,而要擁有這種類型的語言資料,不僅需要長時間的積累,還需要不斷的收集用戶在不同的生活場景下遇到的翻譯問題。
同時,在收集到這些信息後,從翻譯結果到機器能夠學習的語言資料,還需由各國的語言專家團隊來進行校對。在校對確保無誤後,還要將它修改為可供機器學習的標準語言對資料。才能最終成做為語料庫,提供給人工智能產品進行學習。而這類語言專家不僅需要精通2~3門語言,還需要精通對應國家的風土文化。
龐大的人力資源消耗,和需要長時間的數據積累,不僅成為了人工智能公司和其他翻譯公司缺少語料庫的原因,也讓語料庫成了目前市場上的稀缺資源。
用戶規模小,付費意願不夠高
語料庫數據增速不夠快,目前還處於虧損狀態
不管是從賽道,還是從目前的經營狀況來看,Flitto翻易通都算一個發展較為不錯的創業公司,但就用戶規模上來看,Flitto翻易通卻並不像一個成立於2012年的公司。
截至2017年,Flitto翻易通全球注冊用戶隻有800萬,在產品中的兼職和全職的翻譯家共有160萬,在中國地區有50萬。
同時,由於Flitto翻易通的語料庫增長全部來自於付費用戶。用戶付費使用眾包翻譯功能,以提交文字、圖片或語音的翻譯需求,在采納了翻譯家的譯文後,所產生的相關數據才會被語言專家團隊進行收集與整理,作為新的語料收入到語料庫中。
但由於Flitto翻易通的用戶體量較小,付費用戶較少,導致其收集語料變得較為緩慢。
在這樣的情況下,2017年Flitto翻易通做出了改變,通過與全球成立時間最長的機器翻譯公司SYSTRAN進行合作,引入了神經元翻譯係統,用免費的機器翻譯功能來吸引用戶,希望擴大用戶體量。通過基量的增加,來換取付費用戶的增加,從而收集更多數據。
據Flitto翻易通中國區總裁黃海介紹,翻譯與語料庫市場上,在2014年全球已經達到370億美元的規模。隨著人工智能需求的激增,加上傳統的翻譯需求。預計到了2018年,全球市場將達到480億美元的規模,其中,中國將占到90億美元。
而目前引入神經元翻譯器後,翻易通月均用戶增長已經超過20%,盈利方麵,韓國公司今年能賺到1,000萬美金(目前已賺到600萬美金,已經高於年中預期);中國公司預計今年能做到盈虧平衡(2016年賺了516萬虧了30萬),不排除盈利可能。
相關資訊
最新熱門應用
樂速通app官方最新版
生活實用168.55MB
下載墨趣書法app官網最新版
辦公學習52.6M
下載光速寫作軟件安卓版
辦公學習59.73M
下載中藥材網官網安卓最新版
醫療健康2.4M
下載駕考寶典極速版安卓app
辦公學習189.48M
下載貨拉拉搬家小哥app安卓版
生活實用146.38M
下載烘焙幫app安卓最新版
生活實用22.0M
下載喬安智聯攝像頭app安卓版
生活實用131.5M
下載駕考寶典科目四app安卓版
辦公學習191.55M
下載九號出行
旅行交通133.3M
下載