業(yè)務(wù)數(shù)據(jù)復(fù)雜且多,如何通過海量數(shù)據(jù)定義出核心關(guān)注的指標(biāo),用以指導(dǎo)用戶增長(zhǎng)和轉(zhuǎn)化? 如何通過數(shù)據(jù)知道用戶體驗(yàn)產(chǎn)品的核心路徑?如何設(shè)計(jì)產(chǎn)品的新手引導(dǎo)來提升用戶的體驗(yàn)?引導(dǎo)更多用戶體驗(yàn)到產(chǎn)品核心,成為“高轉(zhuǎn)化可能”的用戶? 用戶運(yùn)營時(shí)候,如何通過數(shù)據(jù)清晰現(xiàn)有用戶的畫像,找到各個(gè)行業(yè)用戶的核心關(guān)注點(diǎn),來進(jìn)行精細(xì)化的運(yùn)營以提升用戶的復(fù)購? 這些可能是很多運(yùn)營在面對(duì)海量數(shù)據(jù)的時(shí)候都想知道的。我們都知道數(shù)據(jù)有強(qiáng)大的能力,清洗后的數(shù)據(jù)更加能夠指出一條清晰的前進(jìn)道路。俗話說,一個(gè)不會(huì)看數(shù)據(jù)的運(yùn)營不是一個(gè)好產(chǎn)品經(jīng)理,作為一個(gè)主要通過看數(shù)據(jù)和用戶訪談定性定量分析,然后產(chǎn)出相應(yīng)策略指導(dǎo)增長(zhǎng)的用戶增長(zhǎng)產(chǎn)品運(yùn)營,今天要講幾個(gè)硬核的能力,幫助通過數(shù)據(jù)提升運(yùn)營能力,制定運(yùn)營策略 運(yùn)營在數(shù)據(jù)分析的路上,有幾道關(guān),埋點(diǎn),拿數(shù)據(jù),分析,產(chǎn)出可行運(yùn)營策略,每一關(guān)都困難重重 以下可能是運(yùn)營去提取數(shù)據(jù)的真實(shí)場(chǎng)景:
這是很普遍的情況,也是可以理解的情況,因?yàn)檫\(yùn)營的角度,是業(yè)務(wù)的角度,但開發(fā)的角度,是數(shù)據(jù)的角度,這個(gè)字段里沒有你說的是不是活躍用戶。這時(shí)候肯定就會(huì)想,好像要一套數(shù)據(jù),能夠清晰告訴我,這個(gè)用戶是什么行業(yè),使用了什么功能,是什么商業(yè)模式,處在什么狀態(tài)?。。?/p> 這就引出了一個(gè)問題,如何將數(shù)據(jù)清晰梳理,整理出這些可以實(shí)際指導(dǎo)業(yè)務(wù)的指標(biāo)呢? 如何通過數(shù)據(jù)定義用戶畫像?
指標(biāo)定義——場(chǎng)景化定義便于明確需要提取的指標(biāo) 在和數(shù)據(jù)或者開發(fā)溝通提取數(shù)據(jù)之前,首先需要思考希望得出一個(gè)什么樣的畫像結(jié)果,這里可以大膽使用假設(shè),例如
這樣就很明確,一般我會(huì)分出兩類型數(shù)據(jù),然后再根據(jù)兩個(gè)類型數(shù)據(jù)細(xì)化相關(guān)指標(biāo)。 這里每一類數(shù)據(jù)都可以再細(xì)分出細(xì)化的數(shù)據(jù)指標(biāo),比如說用戶基礎(chǔ)數(shù)據(jù)可以如此細(xì)化,其他指標(biāo)類型也可以如此,根據(jù)產(chǎn)品屬性和需要了解的內(nèi)容選取指標(biāo)。 數(shù)據(jù)提取——多維數(shù)據(jù)的降維處理 清晰了指標(biāo)定義,會(huì)發(fā)現(xiàn),有一些指標(biāo),可能會(huì)涉及多維,沒有辦法進(jìn)行比較和分析。 例如,用戶使用成功創(chuàng)建了某種類型的商品,每個(gè)商品的售賣量和銷量都不相同,在考慮該商品功能的使用時(shí)候如何進(jìn)行綜合處理?這里需要降維處理一下數(shù)據(jù),可以加權(quán)平均,或者取眾數(shù),中位數(shù)進(jìn)行代表,從而降低對(duì)比評(píng)價(jià)出現(xiàn)多維對(duì)比的情況。 數(shù)據(jù)分析——發(fā)現(xiàn)到底什么才是“最重要的指標(biāo)” 一條用戶記錄,關(guān)聯(lián)的數(shù)據(jù)字段是非常多的,一個(gè)用戶,付費(fèi)和不付費(fèi)的核心差別點(diǎn)是什么?到底什么是讓用戶付費(fèi)的關(guān)鍵?用戶到底關(guān)注什么? 這可能需要借助分析來看清楚,這里的因變量(用戶的付費(fèi))和哪些自變量是相關(guān)聯(lián)的。在這里推薦一個(gè)算法,CHAID決策樹,這類決策樹專門用來找出這里面核心影響最終結(jié)果的變量是什么,也就是說,這么多功能,用戶這么多行為,這么多屬性,到底哪種屬性類型的用戶,哪種行為類型的用戶,更容易轉(zhuǎn)化! 決策樹算法是如何計(jì)算的? 假定我們需要了解的是用戶如何能夠付費(fèi),那付費(fèi)與否就是要考察的因變量,也是需要決策樹根據(jù)變量情況預(yù)測(cè)的值 我們把整個(gè)數(shù)據(jù)集按照20%,80%分成訓(xùn)練集和驗(yàn)證集,即為一部分拿來訓(xùn)練模型,讓模型從數(shù)據(jù)里找出特征因素,一部分用來印證和預(yù)測(cè),判斷模型和挑選的特征變量是不是有效的,擬合度如何 從自變量里抽取2個(gè)既定值,與因變量進(jìn)行卡方檢驗(yàn);如卡方檢驗(yàn)顯示2者關(guān)系不顯著,正面2個(gè)既定值可以合并。不斷減少自變量的取值數(shù)量,知道該自變量所有取值均呈現(xiàn)顯著性。 例如,我們的數(shù)據(jù)里有130個(gè)自變量,其中很多我們都不知道是否和用戶是否付費(fèi)相關(guān),不知道用戶每周活躍次數(shù)和用戶付費(fèi)是否相關(guān),不知道用戶嘗試了某個(gè)功能是否和用戶付費(fèi)相關(guān),這時(shí)就通過決策樹的卡方檢驗(yàn)通過距離來判斷自變量和因變量之間是否相關(guān) 通過比較找出最顯著的自變量,并按照自變量的最終取值對(duì)樣本進(jìn)行分割,也就是形成多個(gè)不同的樹(一般CHAID生成兩個(gè)樹節(jié)點(diǎn)) 最終展示出所有和用戶付費(fèi)與否相關(guān)的決策點(diǎn),其中可能是,直播功能創(chuàng)建超過3個(gè),付費(fèi)的概率高達(dá)80%,決策樹就幫助我們剔除了不相關(guān)或關(guān)聯(lián)性不顯著的自變量,告訴了我們,到底什么才會(huì)導(dǎo)致用戶的轉(zhuǎn)化付費(fèi)。 |
|