數據分析最核心的工作,就是對數據進行分析,以找出數據中蘊含的業(yè)務規(guī)律和業(yè)務問題,從而能夠輔助決策。 圍繞業(yè)務問題,采用合適的分析方法,分析模型,以及分析工具,這是數據分析師的必備技能。 為了便于理解,我將數據分析分為三個層次,從低到高,由淺入深,分別是統(tǒng)計分析,基本分析,數據挖掘。 統(tǒng)計分析 一般情況下,企業(yè)有80%的分析工作都只需要掌握統(tǒng)計分析方法就可以完成,僅僅需要對業(yè)務數據進行匯總,然后利用簡單的分析方法,就可以充分了解企業(yè)整體運營狀況。 比如說,企業(yè)經營分析,其實主要是對一些KPI指標進行分析,這一類的分析基本上只需要對數據進行基本的統(tǒng)計和計算,就可以得到,然后利用一些簡單的分析方法就可以描述數據的特點,發(fā)現數據的變化,從而可以確定業(yè)務的發(fā)展情況。 統(tǒng)計分析中,最常用的基本分析方法如下。 簡單分析方法
綜合分析方法
基本數據分析 除了統(tǒng)計之外,還有一些常用的數據分析方法,可以找到更深層的業(yè)務規(guī)律。比如說,如下的業(yè)務問題:
這些業(yè)務問題,不是統(tǒng)計分析就能夠完成的,需要用到一定的數據模型。常用的分析方法包括相關分析、方差分析、回歸分析等等。
高級數據分析(數據挖掘) 當前,大數據應用最多的領域是市場營銷。 市場營銷中,最為關注的是客戶,即如何獲取客戶?如何挖掘客戶的需求?如何挖掘客戶的行為特征、消費特征、興趣偏好?這些更深層次的業(yè)務規(guī)律及業(yè)務模式,需要更復雜的數據分析模型來支撐。 比如,市場細分,客戶特征提取,客戶價值評估,客戶流失預警等等,就需要數據挖掘來發(fā)現數據的隱含模式及規(guī)律。 聚類,可以用于市場細分,發(fā)現不同的用戶群; 決策樹分類,可以用于客戶特征提取,比如發(fā)現流失客戶的特征,預測客戶流失的傾向; 關聯分析,可以用于發(fā)現產品套餐設計、交叉/捆綁銷售等等。 RFM模型,可以用于客戶價值評估,將客戶分組,采用不同的營銷策略。 當然,還有更多的方法,比如神經網絡、SVM、貝葉斯分類等等,可以用于解決更復雜的業(yè)務問題。 數據挖掘方法
是復雜的業(yè)務問題,越需要復雜的分析模型來支持,越需要復雜的分析方法。所以,先明確分析目的,圍繞業(yè)務問題,收集數據,找到最合適的分析方法,才能最快速最有效的完成分析任務。 |
|