作者:鮑勃·羅杰斯(Bob Rogers),英特爾首席數(shù)據(jù)科學家
數(shù)據(jù)對于現(xiàn)代企業(yè)的重要程度不言而喻,擁有卓越的數(shù)據(jù)分析能力可在市場上擁有更大的競爭優(yōu)勢。然而企業(yè)用戶和一些決策者對于數(shù)據(jù)分析仍然有一些誤解和偏見。
比如
“我們企業(yè)并不需要機器學習這樣的高級分析工具?!?/p>
“我們有很多數(shù)據(jù),但是分析沒啥用?!?/p>
“我們要進行數(shù)據(jù)分析就必須要聘請一批數(shù)據(jù)科學家!”
接下來我們一一揭開這些對于數(shù)據(jù)分析迷之誤解背后的真相。
1,“為了部署像機器學習(ML)這樣先進的分析技術,我們必須購入新硬件和大量投資專用基礎設施。”
真相:部署高級的數(shù)據(jù)分析其實沒你想象中那么遙遠。
許多公司已經擁有大量的高級分析基礎設施。例如,工廠車間通常有數(shù)千個傳感器,但通常不是所有的傳感器都被使用,因為它們產生的數(shù)據(jù)是紛雜的,那么能夠很好的管理,存儲和集成所有的數(shù)據(jù)就是一個很好的起點。
如果沒有可用于分析的大量現(xiàn)有硬件,也不用太擔心,許多云服務提供商 https://www.ferolabs.com/(CSP)就可以提供現(xiàn)成的高級分析功能。利用這些資源運行一些試驗項目,并由此制定有效的使用案例,然后可以制定一個長期投資路線圖,并清楚了解投入產出比。
如果選擇內部運行,則可以使用現(xiàn)有的基于英特爾技術的平臺來經濟高效地支持新項目。
2,“我們不需要像機器學習這樣的高級分析工具?!?/p>
真相:無論企業(yè)規(guī)模大小,每個企業(yè)都需要高級分析。
很多企業(yè)都在做數(shù)據(jù)分析,也不乏很多企業(yè)還在用excel或者簡單的在線系統(tǒng)報告來做“數(shù)據(jù)分析”。
真正的數(shù)據(jù)分析當然沒有那么簡單,不過分析數(shù)據(jù)的第一步是要知道手中到底掌握什么數(shù)據(jù),在分析之前就要組織好。簡單的在線系統(tǒng)報告顯然已經過時了,拜托,現(xiàn)在可是在數(shù)據(jù)爆炸的時代。
要跟上競爭的步伐,了解數(shù)據(jù)的實時趨勢,使用當前的數(shù)據(jù)來預測和影響 <https://www.intel.com/content/www/us/en/analytics/you-dont-need-analytics-myth-video.html>明天會發(fā)生的事情,這一點很重要。運用先進的機器學習和其他人工智能技術,可以更快速地理解更多類型和更大量的數(shù)據(jù)。例如,人工智能技術可以幫助企業(yè)在業(yè)務流程中自動處理來自文本和圖像的信息,這有助于更高效的決策。隨著這些數(shù)據(jù)分析方式變得更加主流,那些不接受它們的人就肯定out啦。
3,“我們有很多數(shù)據(jù),但分析不起作用?!?/p>
真相:分析數(shù)據(jù)當然是有用的,但是分析的必須是有效的數(shù)據(jù)。
在一個高級數(shù)據(jù)分析的項目中,經常會遇到這樣的抱怨“費功夫分析了這么大量的數(shù)據(jù),最后得出的怎么還是錯誤的結果?
這與數(shù)據(jù)的質量有關。企業(yè)在分析數(shù)據(jù)之前需要有效的方式來收集數(shù)據(jù),并進行去重和實時更新。AI(人工智能)和ML(機器學習)算法只能處理給定的數(shù)據(jù),所以低質量的數(shù)據(jù)意味著低質量的結果。所以正確的使用數(shù)據(jù)管理策略,才會獲得真知灼見。
4,“要做數(shù)據(jù)分析,我們需要聘請一批數(shù)據(jù)科學家!”
真相:遠在天邊,近在眼前。
其實不是每個公司都需要一個常駐博士或者數(shù)據(jù)科學家。了解業(yè)務需求和掌握有效數(shù)據(jù)對決策者才是至關重要的。填補一個數(shù)據(jù)科學家的職位可能會非常棘手,特別是有特定產品或對專業(yè)知識要求極高的行業(yè),并不一定有非常匹配的數(shù)據(jù)科學家可以有效地發(fā)揮作用。所以說借助一些數(shù)據(jù)分析工具或者開展一些專業(yè)培訓,在企業(yè)內部可能已經培養(yǎng)出了所需的專家。
另一種方法是讓運營業(yè)務人員直接運用數(shù)據(jù)分析工具。借助基于云的服務可以清理和處理企業(yè)的數(shù)據(jù),并提供出展示洞察的算法,這可以使得企業(yè)的業(yè)務專家轉變?yōu)閿?shù)據(jù)專家。
5,“要去分析每一個數(shù)據(jù)”
真相:分析每一個數(shù)據(jù)是不可能的,也是不必要的。衡量什么是戰(zhàn)略才是至關重要的。
當企業(yè)開始收集和整合數(shù)據(jù)時往往會遇到一個很大的誘惑--使用它的一切。但是這種方法可能會變得笨重和昂貴,而且大量不相關的信息會對結果產生不利影響。不斷自省正在分析哪個數(shù)據(jù)集是非常重要的。如果正在分析的這一部分數(shù)據(jù)是沒有商業(yè)需求的,那大可以去分析更重要的數(shù)據(jù)。
這里要強調的就是數(shù)據(jù)分析要基于業(yè)務需求。企業(yè)正在部署什么?企業(yè)一旦知道了這一點就可以設定可衡量的目標,基于這個目標去開展數(shù)據(jù)分析工作。
6,“高級數(shù)據(jù)分析意味著企業(yè)需要雇用額外的IT人員?!?/p>
真相:現(xiàn)有團隊其實足以迎接挑戰(zhàn)。
對于一個企業(yè)來說,如果有自己的IT團隊,那么數(shù)據(jù)分析方面是有基礎的,也可能已經取得一些進展。數(shù)據(jù)分析最初的工作更多的是充分利用現(xiàn)有的數(shù)據(jù)。在有基礎且有數(shù)據(jù)分析能力的情況下,企業(yè)就有機會吸引才華橫溢的IT專家,他們會津津樂道地組織分析創(chuàng)新領先的機會。
還有一種方法就是盤點公司內部已有的數(shù)據(jù)分析能力,并與外部顧問(如行業(yè)分析師或供應商)合作,獲取他們的建議并開展相關培訓。如企業(yè)選擇內部開發(fā)算法,可以通過FaaS模型(Function as a Service,功能即服務,是一種無服務器計算,是IaaS演進的下一個階段,它將底層基礎架構從開發(fā)人員中分離出來,基本上虛擬化了運行和運營管理,無服務器架構允許開發(fā)者執(zhí)行給定的任務,而不必擔心服務器、虛擬機或底層計算資源,可極大地減少操作開銷和周期。)將其提供給組織內的其他人,以最大限度地減少開發(fā)時間。
所以無論企業(yè)規(guī)模大小,都應該開展數(shù)據(jù)分析,數(shù)據(jù)分析也并不是遙不可及,企業(yè)要激發(fā)自有IT團隊的能力,充分釋放數(shù)據(jù)潛力,讓企業(yè)增強市場競爭力。