1 數(shù)據挖掘技術
數(shù)據挖掘的主要技術手段包括關聯(lián)規(guī)則挖掘、分類分析、聚類分析、估計、預測、時序模式和偏差分析等。支持上述技術的核心研究內容是相應的數(shù)據挖掘算法研究,包括貝葉斯算法、決策樹、時序算法、聚類算法、關聯(lián)算法、神經網絡算法和回歸算法。
2 數(shù)據挖掘的核心價值與應用分析
在企業(yè)客戶管理中應用數(shù)據挖掘技術,不僅使客戶管理更高效、更實用,還能預測客戶將來的各種消費行為,為企業(yè)實施更精確的客戶管理和市場營銷提供決策依據??蛻艄芾硎荂RM系統(tǒng)的一部分,但比CRM系統(tǒng)有關客戶部分的功能更詳細、更齊全、更完善、更符合企業(yè)的實際需要。
客戶管理的目標非常明確,防范老客戶流失,從老客戶那里獲取更大的價值。
目前企業(yè)客戶管理應用比較混亂,大致分為3種情況:①以業(yè)務系統(tǒng)為主,客戶管理為輔的信息系統(tǒng),如進銷存系統(tǒng)、ERP系統(tǒng)等,以實現(xiàn)業(yè)務為核心內容,但往往會涉及到一部分客戶信息,嚴格來講,這部分軟件不屬于客戶管理范疇。②以銷售、市場營銷為核心內容的信息系統(tǒng),如銷售管理系統(tǒng)等,以實現(xiàn)銷售計劃為核心,重點最大限度的促進銷售,更多的關注客戶的消費心理、消費行為,注重提升客戶的忠誠度,但這不是客戶系統(tǒng)的全部內容。③CRM系統(tǒng),它是一個比較龐大的客戶關系管理信息系統(tǒng),主要包括銷售、銷售過程、客戶管理、客戶分析等若干模塊,相對于大多數(shù)企業(yè)而言,成本較高。同時,操作型CRM較多,分析型CRM較少。
客戶管理的混亂,為企業(yè)利用客戶關系帶來了不便,也為挖掘客戶關系中的有價值信息增加了難度。
3 挖掘算法的選擇與建模
當企業(yè)建立起數(shù)據倉庫后??刹捎貌煌臄?shù)據挖掘算法為客戶管理提供直接、有效的數(shù)據與參考。企業(yè)活動中,與客戶管理相關業(yè)務大多與銷售過程有關,包括客戶購物、企業(yè)營銷、客戶分類管理和銷售預測等。對客戶購物行為的分析,可以為個性化營銷提供客觀依據,最有效的營銷是針對有消費興趣潛力的客戶群,通過挖掘關聯(lián)關系,尋找有價值的客戶分類,能夠提高客戶管理的有效性。
數(shù)據挖掘雖然是一個智能的數(shù)據分析工具,但其準確性會受到多個方面因素的影響,如數(shù)據的準確性、合法性、算法選擇的準確性、輸人選擇的正確性等,在實際應用中,不同的人、不同的挖掘策略與方案將會有不同的結果,應用業(yè)務人員和數(shù)據挖掘人員一起。共同探討正確性。下面針對上述具體應用,提出可行的挖掘方案,以供參考。
3.1 挖掘客戶購物行為信息的算法與模型
用戶在挑選商品時,往往存在一個習慣:先挑選最需要的商品,然后根據商品推薦或興趣來挑選其他商品,市場營銷人員中可以分析每個用戶的購物行為和愛好,為將來的個性化營銷提供依據,并為每個客戶提供最具人性化的營銷方式,這要使用序列聚類算法。
實現(xiàn)此功能需要兩個基本信息,一是訂單信息,關注客戶的一次購物行為;二是訂單產品明細,主要關注商品放入訂單的先后順序。
在業(yè)務庫中,有客戶企業(yè)表、客戶訂單表、訂單產品明細表、產品信息表4個業(yè)務表,如圖1所示,在創(chuàng)建數(shù)據倉庫后,客戶企業(yè)表、產品信息表將變成維表。訂單表、訂單產品明細將變成事實表,把不需要的字段刪除,并把不合理的數(shù)據進行清理、轉換,采用微軟序列聚類算法即可實現(xiàn)此功能需求。
其數(shù)據挖掘模型如下:
根據以往的銷售歷史,分析用戶的銷售行為,其重點在于歷史數(shù)據中每個訂單要有產品購買的先后順序,結合序列聚類算法即可完成,此模型的輸入列是訂單編號,預測列是一個嵌套表,包括產品序號和產品編號(或名稱)兩個可預測試列。
3.2 挖掘消費興趣實現(xiàn)有效營銷的算法與模型
企業(yè)進行新產品宣傳或促銷時,有效做法是把信息發(fā)送給感興趣的客戶,而不是發(fā)給所有人,基于以前所做的客戶檔案和客戶對產品調查的反饋結果,采用數(shù)據挖掘算法可以找出那些感興趣的客戶,即節(jié)省成本,又提高效率。
此功能的關鍵是根據以前所做的產品調查反饋信息,預測哪些因素影響客戶的購買,并分析愿意購買客戶的特征,基于這些特征,把客戶表里的所有信息重新篩選一遍,只向那些具有購買特征的客戶發(fā)送營銷信息。
實現(xiàn)此功能的算法有4個:貝葉斯、決策樹、神經網絡、聚類,基于驗證考慮,盡可能采用每一種算法來測試,以獲得更準確的分析數(shù)據,如圖2所示,其數(shù)據模型如下:
也可以采用決策樹、聚類、神經網絡算法,分別對應如下:
(1)Microsoft_Decision_Trees:決策樹
(2)Microsoft_Clustering:聚類
(3)Microsoft_Neural_Network:神經網絡
根據以往的調查數(shù)據,可以分析出這些輸入列與可預測列(是否購買)之間的關系,找那些已購買產品或愿意購買產品的客戶重要特征,然后把促銷信息、新產品信息發(fā)給具有這些重要特征的客戶。