隨著機器學習不斷向縱深發(fā)展,越來越多的傳統(tǒng)企業(yè)也開始應用機器學習進行業(yè)務創(chuàng)新,實現(xiàn)業(yè)務重塑。麥肯錫此前刊發(fā)的針對人工智能對世界經(jīng)濟的影響專題報告顯示,預計到2030年,人工智能將為全球經(jīng)濟貢獻13萬億美元。零售、運輸、物流、制造業(yè)和農(nóng)業(yè)等傳統(tǒng)領域在人工智能和機器學習賦能之后,帶動的經(jīng)濟貢獻或?qū)⑦h超軟件和信息服務業(yè)。而且,對比軟件與信息服務業(yè),這些行業(yè)也更需要被賦能,以幫他們更好地部署和使用人工智能和機器學習。
結合亞馬遜全球20年機器學習的創(chuàng)新實踐,以及亞馬遜云科技幫助逾10萬客戶在云上使用機器學習的經(jīng)驗,我們對傳統(tǒng)企業(yè)成功應用機器學習總結了四點建議。
一、制定明確的數(shù)據(jù)策略
機器學習三要素包括數(shù)據(jù)、算法和算力,三者缺一不可。
對于多數(shù)行業(yè)來說,收集和處理數(shù)據(jù)是一個難題。因此,企業(yè)開始應用機器學習之前,首先需要充分了解自己的數(shù)據(jù)現(xiàn)狀并制定數(shù)據(jù)策略。什么數(shù)據(jù)現(xiàn)在可用?什么數(shù)據(jù)通過一定的工作可以變得簡單易用?如果已經(jīng)確定幾個想嘗試利用機器學習的場景,就可以采用逆向工作法,根據(jù)目標進行倒推,推算出需要的數(shù)據(jù)、目前已經(jīng)具備的數(shù)據(jù)和依然缺失的數(shù)據(jù),以及從現(xiàn)在開始需要搜集的數(shù)據(jù)。解決了這些問題,制定了明確的數(shù)據(jù)策略,才會有真實、準備充分的數(shù)據(jù)去應對基于機器學習的業(yè)務創(chuàng)新需求。
部分客戶雖然搜集了很多數(shù)據(jù),但數(shù)據(jù)的就緒程度較低,數(shù)據(jù)質(zhì)量不高。例如,如果傳感器送過來的數(shù)據(jù)有異常值或缺失值,那么以此為基礎應用機器學習,訓練出來的模型大概率是不夠精準的。
二、從合適的場景切入
企業(yè)在應用機器學習的時候往往千頭萬緒,那么開展機器學習應該從什么項目切入呢?這里給大家一個決策參考框架,可以從數(shù)據(jù)就緒狀態(tài)、業(yè)務影響和機器學習適用性三個維度進行評估。企業(yè)可以選擇數(shù)據(jù)就緒度高、有業(yè)務價值但是業(yè)務影響低、機器學習適用性高的應用場景作為機器學習試點和示范項目。
具體從三個方面入手。第一,在開展機器學習的早期階段,公司內(nèi)部可能對其帶來的作用還有些疑惑,因此需要從一個投入相對小的創(chuàng)新項目開始實驗,它不會影響公司的核心業(yè)務,一旦成功可以幫助企業(yè)積累經(jīng)驗,同時贏得內(nèi)部的信任。
第二,這個項目既需要有業(yè)務價值,還要適用于機器學習,取二者的交集。第三,找到一個場景機器學習只是作為輔助去自動化加速工作的某一個環(huán)節(jié),而不是替代人。例如,醫(yī)生對病人的診斷由非常多的環(huán)節(jié)組成,其中看心電圖、X光片的過程可以利用機器學習實現(xiàn)自動化,加速醫(yī)生的診斷過程,但機器學習不會取代醫(yī)生的工作,對治療過程本身帶來的影響比較小,更容易得到醫(yī)生的支持和配合。
在成功交付了幾個3到6 個月可以完成的小型項目后,企業(yè)就會有足夠的信心和動力去獲得領導團隊的支持,加大機器學習項目投入,逐步應用機器學習來改造核心業(yè)務。
以嘉實財富管理有限公司為例,它是嘉實基金旗下的獨立財富管理機構,在全國主要城市均設有財富管理服務中心,2020年為客戶創(chuàng)造回報超過31億元。作為金融企業(yè),嘉實財富以媒體平臺作為切入點,借助亞馬遜云科技提供的標準AI 能力,包括開箱即用工具以及機器學習服務平臺上定制的 AI模型,形成了集媒資入庫、語音轉(zhuǎn)錄、短視頻生成、個性化推薦為一體的媒體處理平臺,讓金融企業(yè)有機會將客戶需要的金融視頻,精準的推薦給客戶,從更多的渠道觸達客戶。
三、數(shù)據(jù)科學家業(yè)務化
針對企業(yè)成功應用機器學習的第三個建議是要讓數(shù)據(jù)科學家業(yè)務化。以亞馬遜構建機器學習團隊為例,在亞馬遜,我們沒有將數(shù)據(jù)科學家單獨放到一個中央團隊,而是將數(shù)據(jù)科學家與產(chǎn)品、業(yè)務團隊放在一起,讓數(shù)據(jù)科學家業(yè)務化。亞馬遜致力于以客戶為中心,我們的機器學習科學家首先要以提高客戶體驗為出發(fā)點,而不是從研究機器學習算法開始。
數(shù)據(jù)科學家業(yè)務化是亞馬遜的重要經(jīng)驗。我們把這一經(jīng)驗復制到亞馬遜云科技的客戶項目中。當客戶缺乏數(shù)據(jù)科學家時,亞馬遜云科技的數(shù)據(jù)科學家和工程師會加入項目團隊,與客戶的業(yè)務開發(fā)團隊一起工作,凝聚數(shù)據(jù)科學家和領域?qū)<业牧α?,為提高客戶體驗而進行創(chuàng)新發(fā)明。
傳統(tǒng)企業(yè)通常沒有既精通業(yè)務又精通機器學習技術的專家和數(shù)據(jù)科學家,因此也可以把數(shù)據(jù)科學家/機器學習技術專家與業(yè)務領域?qū)<曳旁谝黄饘崿F(xiàn)技術創(chuàng)新。山東淄博市熱力集團就成功地通過亞馬遜云科技的賦能,將其業(yè)務領域?qū)<液蜋C器學習技術專家擰成一股繩。淄博熱力利用亞馬遜云科技豐富的人工智能和機器學習技術和服務,雙方聯(lián)合研發(fā)一套基于機器學習的智慧供熱專家系統(tǒng),根據(jù)氣象、SCADA工控數(shù)據(jù)、建筑物維護結構等信息計算出最佳的供熱模式,并給出具體的操作指令,實現(xiàn)精準供熱,既讓用戶室溫始終保持人體最佳熱舒適溫度,又做到節(jié)能增效。
四、應對技能差距
當前,多數(shù)企業(yè)部署和應用機器學習最大的瓶頸之一是機器學習人才的缺口。新興公司爭搶機器學習人才,同時各類傳統(tǒng)企業(yè)也需要機器學習人才。在這種情況下,企業(yè)尋找能夠?qū)ζ涮峁椭?、為企業(yè)賦能的服務商是解決這一問題的最佳途徑。
我們在與行業(yè)客戶交流中發(fā)現(xiàn),很多行業(yè)問題需要對算法進行大量的迭代和優(yōu)化,不斷提高精準度。一些行業(yè)難題,甚至需要研究新的算法進行破解。面對這些復雜的行業(yè)問題,不能停留在只教會客戶使用工具上。亞馬遜云科技的做法是“扶上馬、送一程”。我們集合了解決方案架構師、人工智能實驗室、數(shù)據(jù)實驗室、快速開發(fā)團隊和專業(yè)服務團隊,根據(jù)客戶的項目需要,參與到項目的生命周期當中,與客戶共同尋找適用于機器學習的業(yè)務場景,跟業(yè)務人員、技術人員在一起開發(fā)出產(chǎn)品原型,然后快速迭代進行實施。讓客戶以盡可能小的試錯成本完成產(chǎn)品原型開發(fā),彌補客戶的技能差距。
通過這樣的方式,我們授人以漁,賦能客戶創(chuàng)新,并且一直堅持平臺思維,讓更多的人使用亞馬遜云科技進行創(chuàng)造和發(fā)明,讓人工智能和機器學習普惠。亞馬遜創(chuàng)始人杰夫?貝佐斯說過,創(chuàng)新有多種形式和各種規(guī)模,最激進和最具變革的創(chuàng)新是幫助他人釋放創(chuàng)造力,實現(xiàn)其夢想。
亞馬遜云科技的一大核心目標,就是將機器學習能力交付至每一位開發(fā)人員手中。借助Amazon SageMaker能夠幫助客戶快速構建、訓練以及部署機器學習模型的能力,我們得以更進一步,將機器學習能力交付至更多希望基于機器學習創(chuàng)新的用戶手中。
總之,企業(yè)客戶應用機器學習大有可為,建議企業(yè)制定好明確的數(shù)據(jù)策略,尋找適合機器學習的應用場景作為切入點,先突破創(chuàng)新業(yè)務,再改造核心業(yè)務。同時讓數(shù)據(jù)科學家深入業(yè)務,避免閉門造車。希望越來越多的企業(yè)通過機器學習實現(xiàn)不斷創(chuàng)新和發(fā)展,在激烈的競爭之中立于不敗之地。