不過(guò)現(xiàn)實(shí)還是要從理想說(shuō)起,【理想】經(jīng)常都會(huì)和一些時(shí)髦的東西沾邊,就像10年前無(wú)線熱的時(shí)候,我就在做無(wú)線?!?span style="max-width: 100%; word-wrap: break-word; box-sizing: border-box !important; font-weight: 700;">其實(shí)我們所說(shuō)的大數(shù)據(jù),就是公眾數(shù)據(jù)分析,擁有最大的公眾行為數(shù)據(jù)的公司就是中國(guó)移動(dòng)】。我發(fā)現(xiàn)問(wèn)題都是一樣的,歷史就是不斷的重演,當(dāng)時(shí)中國(guó)移動(dòng)碰到的問(wèn)題跟今天我們做大數(shù)據(jù)碰到的問(wèn)題一模一樣,因?yàn)槟軌驅(qū)τ脩舻男袨樽龊芗?xì)跟蹤和分析了,以前做不到的現(xiàn)在能做到了,那么我們就有了一個(gè)理想,就是我們對(duì)一個(gè)用戶的理解比用戶自己都深入,他自己都不知道他的需求是什么,我們能告訴他有這樣的需求,讓他恍然大悟,我果然想要這個(gè)。 移動(dòng)當(dāng)時(shí)就是這樣的夢(mèng)想,但是很快大家知道這個(gè)夢(mèng)想不真實(shí)。不是因?yàn)榧夹g(shù)做不到,而是因?yàn)檫@些數(shù)據(jù)根本沒(méi)有整合。我給大家舉個(gè)例子,大家學(xué)市場(chǎng)【營(yíng)銷(xiāo)】或者說(shuō)企業(yè)經(jīng)營(yíng)的時(shí)候一定會(huì)讀故過(guò)一本書(shū),叫《引爆流行》,我們現(xiàn)在做市場(chǎng)不是靠過(guò)去的八十二十法則了,不是20%的人貢獻(xiàn)80%的收益,現(xiàn)在是社會(huì)化時(shí)代,我們?nèi)巳寒?dāng)中有高影響力人群,這些人只占整個(gè)人群的1%,但如果能讓這1%的人說(shuō)你的好話,剩下的99%都會(huì)跟隨,都會(huì)來(lái)買(mǎi)你的東西。 但是怎么找到這個(gè)1%?《引爆流行》書(shū)里面沒(méi)講,但我們研究了。我們當(dāng)時(shí)跟移動(dòng)談,我們一起來(lái)設(shè)計(jì)一個(gè)方案,首先我們研究有沒(méi)有這1%。我們?cè)O(shè)立了一個(gè)很有趣的指標(biāo),我們都知道雖然未來(lái)很多電話可能是跟機(jī)器人通話,但今天打電話還基本是跟真人的通話。所以我們當(dāng)時(shí)就取了一個(gè)數(shù)據(jù)來(lái)研究:即每個(gè)人每個(gè)月和多少個(gè)不同的電話號(hào)碼通話,什么意思呢,一個(gè)號(hào)碼后面是一個(gè)人,通過(guò)號(hào)碼就可以了解一個(gè)人每個(gè)月跟多少人有實(shí)際的接觸。 移動(dòng)從來(lái)沒(méi)有去計(jì)算這個(gè)數(shù),世界最頂尖的咨詢公司、營(yíng)銷(xiāo)公司、IT公司也好等等都沒(méi)有這個(gè)參數(shù)。我們拿了一批移動(dòng)的全球通用戶數(shù)據(jù)做研究,結(jié)果我們發(fā)現(xiàn),絕大多數(shù)手機(jī)用戶沒(méi)有想象的這么活躍, 50%的左右的用戶每月只跟少于20個(gè)號(hào)碼接觸,說(shuō)明他每月通過(guò)電話接觸的少于20人;80%左右的用戶每月和少于50個(gè)手機(jī)號(hào)碼溝通,這還算符合80/20定律。但是很有趣的現(xiàn)象出現(xiàn)了,就是確實(shí)有這個(gè)1%存在,有少于1%的人每月和多于150個(gè)電話號(hào)碼通話,意思就是說(shuō)我們當(dāng)中確實(shí)存在一些高影響力的人,他們不停的接觸別人、聯(lián)系別人。 你再深入的想一下,就會(huì)發(fā)現(xiàn)這些人是寶貝,這些人如果你抓到了,你就做好營(yíng)銷(xiāo)了。他是影響力高端,他說(shuō)好,剩下的99%都會(huì)說(shuō)好。(當(dāng)然天天往外打電話推銷(xiāo)的人肯定是除外的,從技術(shù)上通過(guò)分析打入和打出的差異也很好識(shí)別) 既然確實(shí)有這些人存在,如果能利用好這些人的話,假如中移動(dòng)把這些人哄的開(kāi)心了,他們天天說(shuō)中國(guó)移動(dòng)好,移動(dòng)每年給中央電視臺(tái)多少億的廣告費(fèi)都可以省了。進(jìn)而,還可以再?gòu)倪@1%里面挑出他聯(lián)系的150個(gè)人每個(gè)人都和150以上的人有聯(lián)系的,也就是高端中的高端,這樣的人你抓住一個(gè),第一輪他就能夠影響150人,第二輪這150個(gè)人再影響150個(gè),可見(jiàn)影響力有多么巨大。 但這個(gè)只是我們當(dāng)初的設(shè)想,因?yàn)楫?dāng)時(shí)我是用了很多關(guān)系來(lái)挖數(shù)據(jù)、做分析的,真到中國(guó)移動(dòng)去實(shí)施這個(gè)系統(tǒng)的時(shí)候,遭到了他們中移動(dòng)后臺(tái)運(yùn)營(yíng)者的抵制,說(shuō)我不可能為了你的一個(gè)應(yīng)用而改變我的整個(gè)數(shù)據(jù)結(jié)構(gòu)。 其實(shí)做大數(shù)據(jù)也好,數(shù)據(jù)挖掘也好,最核心的是對(duì)潛在用戶的理解,這個(gè)都是依靠數(shù)據(jù)整合的。過(guò)去我們就是看這個(gè)用戶到底想說(shuō)什么,做什么,你對(duì)這個(gè)用戶的理解。我們當(dāng)初提了一個(gè)方案,建議說(shuō)我們應(yīng)該去收集異地開(kāi)關(guān)機(jī)的數(shù)據(jù),如果你在本地關(guān)機(jī)了,過(guò)一陣再打開(kāi)如果是異地這個(gè)就叫異地開(kāi)關(guān)機(jī),如果你現(xiàn)在在杭州關(guān)機(jī),然后你在北京開(kāi)了機(jī),這個(gè)數(shù)據(jù)我就要收集了,為什么?很顯然你不可能像哈利波特一樣一下子就飛過(guò)去了,你肯定是用某種交通工具過(guò)去的,而去我可以知道你在什么時(shí)間用什么工具過(guò)去的。 當(dāng)然問(wèn)題還是在于中國(guó)移動(dòng)的體制問(wèn)題,后臺(tái)部門(mén)會(huì)說(shuō),我為什么因?yàn)槟闱芭_(tái)部門(mén)想出成績(jī)而來(lái)改變我這個(gè)部門(mén)的設(shè)計(jì)結(jié)構(gòu)呢。其實(shí)在類(lèi)似事情也同樣存在于其它公司,我們當(dāng)時(shí)在產(chǎn)業(yè)里面做演講比較多,多年以后我在一個(gè)互聯(lián)網(wǎng)公司內(nèi)部做講座,又講到這個(gè)事,結(jié)果下來(lái)以后他們公司的一個(gè)員工跟我談,他說(shuō)我們當(dāng)初試過(guò)了,我們發(fā)現(xiàn)我們公司里有這個(gè)數(shù)據(jù),就做了一個(gè)提案報(bào)上去,想用這個(gè)數(shù)據(jù)做差旅項(xiàng)目,結(jié)果被另一個(gè)部門(mén)否定了,這個(gè)部門(mén)說(shuō)什么呢,他說(shuō)涉及到個(gè)人隱私和信息安全了。 個(gè)人隱私這個(gè)問(wèn)題看似嚴(yán)重,但往往擁有大數(shù)據(jù)的都是大公司,大公司對(duì)數(shù)據(jù)的態(tài)度很有趣,沒(méi)人在乎的時(shí)候他們也不在乎,但大數(shù)據(jù)熱了,他們不知道能拿大數(shù)據(jù)做什么,卻知道把著自己的數(shù)據(jù)不放,不和別人共享。比如說(shuō)新浪微博沒(méi)熱的時(shí)候,利用新浪數(shù)據(jù)做分析、做業(yè)務(wù)還比較方便,一熱了以后,他們自己也意識(shí)到了這個(gè)數(shù)據(jù)是好的,不能讓人家用,所以現(xiàn)在大家都知道在新浪上爬數(shù)據(jù)越來(lái)越難。 為什么,你天天喊大數(shù)據(jù)重要,現(xiàn)在所有的公司的老總都被灌輸了數(shù)據(jù)重要,而且我自己是一個(gè)大平臺(tái),我的數(shù)據(jù)自己用,如果我不給別人你是拿不走的,這樣變成什么情況?就跟當(dāng)初中國(guó)移動(dòng)一模一樣。這個(gè)是我們家的自留地,如果這個(gè)數(shù)據(jù)大家都幫著開(kāi)放,很多應(yīng)用就出來(lái)了,但是如果我不交給你們,我雖然搞不出來(lái),但是你也肯定搞不出來(lái)。 所以大數(shù)據(jù)一點(diǎn)都不開(kāi)放,公眾還天天擔(dān)心隱私問(wèn)題,他都不開(kāi)放你還擔(dān)心什么隱私啊,所以我不認(rèn)為數(shù)據(jù)隱私是最大的問(wèn)題,我覺(jué)得不開(kāi)放才是最大的問(wèn)題。 另外還有我們的防騷擾的力度不大,目前發(fā)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)遠(yuǎn)不如騷擾營(yíng)銷(xiāo)來(lái)的有效而且更低成本。如果你是做公司短信批量購(gòu)買(mǎi)的話,一條短信成本3分錢(qián),意味如果覆蓋100個(gè)人,我的成本才3塊錢(qián),但是我要精準(zhǔn)營(yíng)銷(xiāo)打動(dòng)這1個(gè)人,這100人里假設(shè)有一個(gè)目標(biāo),我要精準(zhǔn)營(yíng)銷(xiāo)打中他,3塊錢(qián)絕對(duì)不止。那我這樣還不如全都覆蓋得了,因?yàn)榇騽?dòng)這個(gè)一個(gè)人得罪了另外99個(gè)人,那就是反正那個(gè)99個(gè)不是我的客戶,而且又不很多。這樣的話誰(shuí)還會(huì)去做精準(zhǔn)營(yíng)銷(xiāo),所以我有很多做精準(zhǔn)營(yíng)銷(xiāo)很棒的企業(yè)、研究人員,但是活得很艱難,為什么呢,因?yàn)闆](méi)有需求。所以不要以為說(shuō)數(shù)據(jù)整合理解就好了,我們?yōu)榭蛻籼峁┓?wù)就好了,現(xiàn)實(shí)不是這樣的。 我們天天講大數(shù)據(jù)的思維,甚至上升到思想的高度。在這里我想提”海妖服務(wù)器”,我們老說(shuō)互聯(lián)網(wǎng)好,但是不好的地方是什么,就是人人知道大數(shù)據(jù)很強(qiáng)、很重要、很有用,所以人人都做,但是做到最后就變成一個(gè)像核武器的競(jìng)賽,這個(gè)大數(shù)據(jù)是不是對(duì)用戶有好處可能就慢慢的覺(jué)得不重要了。 有一個(gè)很著名的笑話,在森林里面兩個(gè)人碰到了一個(gè)熊,一個(gè)人拼命的跑,另一個(gè)蹲下來(lái)系鞋帶。那個(gè)人就問(wèn)你跑得比熊還快嗎,這個(gè)系鞋帶人就說(shuō)我的目的是超過(guò)你。所以你發(fā)現(xiàn)沒(méi)有,現(xiàn)在最熱的高頻交易導(dǎo)致很多在整個(gè)市場(chǎng)上沒(méi)有任何負(fù)面的消息情況下,股市會(huì)出現(xiàn)大幅度波動(dòng),他們會(huì)大量的拋售或者買(mǎi)進(jìn),為什么?因?yàn)樗麄兌⒌哪繕?biāo)并不是市場(chǎng),而是盯著別人的服務(wù)器,你的服務(wù)器如果有波動(dòng),他就把這個(gè)波動(dòng)加倍了再還回來(lái),所以你看市場(chǎng)的波動(dòng)其實(shí)跟市場(chǎng)本身沒(méi)有關(guān)系,你發(fā)現(xiàn)是這兩個(gè)人在互相比賽,至于熊在哪兒根本不重要。 所以這種情況下,會(huì)造成一個(gè)CEO對(duì)大數(shù)據(jù)產(chǎn)生非常復(fù)雜的心情,就是我不得不上,因?yàn)槲也簧狭藙e人上了我就會(huì)處于劣勢(shì),但是上的也不見(jiàn)得有優(yōu)勢(shì),甚至是沒(méi)有優(yōu)勢(shì),而且大數(shù)據(jù)的成本是很高的,變成了一個(gè)很大的負(fù)擔(dān)。至于說(shuō)有多少人真正利用好大數(shù)據(jù)做了更加理性的決策,坦白講真的沒(méi)看到多少。 包括我們自己,我原來(lái)做研究出身的,市場(chǎng)分析,當(dāng)時(shí)我們做市場(chǎng)咨詢的時(shí)候,最恨的就是客戶對(duì)我們不理解,你看這個(gè)市場(chǎng)決策者對(duì)市場(chǎng)這么不了解,我給你提供了這么多復(fù)雜的信息,你千萬(wàn)不能在沒(méi)看清這個(gè)市場(chǎng)的情況下做決策,那樣簡(jiǎn)直太不負(fù)責(zé)了;可是現(xiàn)在這幾年我轉(zhuǎn)行做投資,當(dāng)我做了投資之后我也經(jīng)常對(duì)市場(chǎng)數(shù)據(jù)不屑一顧。 最近我們想投一個(gè)美國(guó)非常棒的能源企業(yè),很多數(shù)據(jù)證明他的經(jīng)營(yíng)情況不是很好,但是我不是很相信,因?yàn)槲覀兌贾来髷?shù)據(jù)在整個(gè)趨勢(shì)出現(xiàn)拐點(diǎn)的時(shí)候,是沒(méi)有辦法去預(yù)測(cè)未來(lái)的,而所有的企業(yè)如果是勻速增長(zhǎng)的話,一定長(zhǎng)不太大,就像阿里一樣,回顧這十幾年艱苦創(chuàng)業(yè)過(guò)程一定不是每年晉升30%,一定在某個(gè)時(shí)間點(diǎn)實(shí)現(xiàn)了爆發(fā)性增長(zhǎng),而這個(gè)時(shí)點(diǎn)是沒(méi)有辦法預(yù)測(cè)到的。 那我根據(jù)什么預(yù)測(cè),其實(shí)很簡(jiǎn)單,這個(gè)CEO是個(gè)連續(xù)創(chuàng)業(yè)者,他前面創(chuàng)了兩個(gè)公司,但是他還愿意創(chuàng)第三個(gè)公司,說(shuō)明他覺(jué)得這個(gè)業(yè)務(wù)機(jī)會(huì)非常棒,另外一個(gè)創(chuàng)始人是MIT的教授,他把教授辭了,到這個(gè)公司做CTO,說(shuō)明他對(duì)自己的技術(shù)非常的有信心,要不然就可以直接掛個(gè)首席科學(xué)家,不需要跳槽做CTO的。所以基于這兩個(gè)人這樣的背景,他們決定要聯(lián)手做一個(gè)事情,肯定能做好的。因?yàn)榻裉熵?cái)務(wù)很差,明天可能就到了拐點(diǎn)。所以你會(huì)看到說(shuō)我們?cè)诂F(xiàn)實(shí)生活中如果我們只是根據(jù)一些數(shù)據(jù)做決策的話,你永遠(yuǎn)是個(gè)參謀。 再說(shuō)一個(gè)很著名的笑話,有一個(gè)在歲數(shù)大了準(zhǔn)備談戀愛(ài)了,準(zhǔn)備選女朋友了,因?yàn)樯韮r(jià)巨富所以有權(quán)力去挑選別人,然后若干個(gè)女孩來(lái)應(yīng)征,有一個(gè)女孩特別會(huì)照顧家,有一個(gè)女孩特別會(huì)做飯,有一個(gè)女孩特別會(huì)理財(cái),他做了綜合評(píng)價(jià)了以后選了胸最大的一個(gè),所以大家發(fā)現(xiàn)了沒(méi)有,其實(shí)我們做半天大數(shù)據(jù)分析,綜合評(píng)價(jià)了以后,決策者還是用自己的規(guī)律做的決定。 回到大數(shù)據(jù)上來(lái),移動(dòng)業(yè)務(wù)走下坡路以后,社交網(wǎng)絡(luò)熱起來(lái)了,這個(gè)理想就更高大上了,因?yàn)橐苿?dòng)的業(yè)務(wù)還只是對(duì)個(gè)人進(jìn)行持續(xù)的數(shù)據(jù)跟蹤、分析、積累來(lái)確定這個(gè)人到底是什么特征,有什么需求。社會(huì)化就不一樣了,可以從A了解B的需求,我們基于新浪數(shù)據(jù)做了很多的實(shí)驗(yàn),一些初步實(shí)驗(yàn)也驗(yàn)證了,就是你的一度強(qiáng)關(guān)系對(duì)你的影響能夠達(dá)到50%,因此可以把你的某些特性50%賦予到你的一度強(qiáng)關(guān)系身上,比如說(shuō)你喜歡某種音樂(lè),你的一度強(qiáng)關(guān)系有50%的可能性喜歡這種音樂(lè)。 50%影響力的規(guī)律能夠在社交網(wǎng)絡(luò)里做大范圍的應(yīng)用,可以彌補(bǔ)傳統(tǒng)的個(gè)人數(shù)據(jù)跟蹤分析的樣本不夠的問(wèn)題。因?yàn)樵趥鹘y(tǒng)分析里,一個(gè)人沒(méi)有某種行為就沒(méi)法分析他的特征和喜好,而利用影響力法則,知道這個(gè)人的一度強(qiáng)關(guān)系的行為或特征,就可以給這個(gè)人打上50%可能性的標(biāo)簽了。 為了更深入地研究社交網(wǎng)絡(luò),我們還在網(wǎng)絡(luò)上做了很多社會(huì)實(shí)驗(yàn),當(dāng)然我們只能做小范圍的事情,一到大范圍,沒(méi)有新浪的支持,數(shù)據(jù)和實(shí)驗(yàn)需要的支持就都跟不上了。社會(huì)網(wǎng)絡(luò)上的行為本質(zhì)上還是真實(shí)社會(huì)行為的反應(yīng),所以我們還對(duì)社會(huì)做跟蹤分析,希望把社會(huì)行為放到社交網(wǎng)絡(luò)里來(lái)研究。 其中有一個(gè)角度就是從線上數(shù)據(jù)分析個(gè)人行為,看是否能夠體現(xiàn)線下看到的行為規(guī)律,每個(gè)人都是有身份地位的,而社會(huì)地位可以換來(lái)某種利益,根據(jù)傳統(tǒng)的行為學(xué)研究,性別不同,社會(huì)地位換取的利益是不同的,對(duì)于一個(gè)女性而言,如果她的社會(huì)地位較高,利益就是她會(huì)認(rèn)識(shí)更多的同樣社會(huì)地位比較高的人,往往是歲數(shù)比較大的男性,但是對(duì)于男性來(lái)說(shuō)不是這樣的,一個(gè)社會(huì)地位高的男性,其利益不是認(rèn)識(shí)更多的社會(huì)地位也高的女性,而是更多漂亮、年輕的女性。當(dāng)然,我們只是做了小范圍的驗(yàn)證,還沒(méi)有辦法做大范圍、全網(wǎng)的驗(yàn)證。 另外,傳統(tǒng)社會(huì)學(xué)研究發(fā)現(xiàn),如果一個(gè)人更友善、更樂(lè)于助人,那么這個(gè)人在社交圈子里面容易處于中心地位,因?yàn)樗麜?huì)有更多的連接;如果一個(gè)人容易對(duì)別人產(chǎn)生敵對(duì)情緒,就會(huì)因?yàn)闆_突多而丟掉很多現(xiàn)有連接,從而處于社交網(wǎng)絡(luò)的邊緣。 我們想在社交網(wǎng)絡(luò)上驗(yàn)證這個(gè)理論,首先要確定網(wǎng)絡(luò)上一個(gè)人到底是更友善還是更敵對(duì),因?yàn)槟阒苯佑^測(cè)是測(cè)不到的,所以我們用了一個(gè)辦法去替換,就是分析他的微博里面的話的褒義詞跟貶義詞分別是多少,根據(jù)國(guó)外的分析,在英文字典里面褒義詞和貶義詞的比例大約是1:2,字典收錄的褒義詞少貶義詞多。我們都知道語(yǔ)言是用來(lái)對(duì)別人的,貶義詞更多,可見(jiàn)我們多數(shù)時(shí)間是批評(píng)別人更多。但是字典是死的,每個(gè)人發(fā)的微博卻是活的。我們確實(shí)發(fā)現(xiàn)微博里面連接越多的人,他的褒義詞使用的比例就越高,我不知道因果關(guān)系,但我們知道是有相關(guān)性的,就是你的社會(huì)地位高低和你說(shuō)話的友善與否是有相關(guān)性的。 我們當(dāng)時(shí)還想要再繼續(xù)做研究,又提出問(wèn)題:假設(shè)一個(gè)人他在網(wǎng)絡(luò)當(dāng)中沒(méi)有處于核心結(jié)點(diǎn),在邊緣結(jié)點(diǎn)的時(shí)候,他就經(jīng)常說(shuō)褒義詞,經(jīng)過(guò)一段時(shí)間,他能否慢慢的變成核心結(jié)點(diǎn)?假如不管一個(gè)小結(jié)點(diǎn)說(shuō)了褒義詞還是貶義詞,他未來(lái)都不能變成核心結(jié)點(diǎn)沒(méi)有相關(guān)性,就說(shuō)明不是因?yàn)槟愀焉扑赃M(jìn)入到了核心結(jié)點(diǎn),而是因?yàn)槟阍诤诵慕Y(jié)點(diǎn),所以你說(shuō)話被迫友善??上鄙傩吕说闹С?,沒(méi)法在全網(wǎng)鋪開(kāi)做這個(gè)實(shí)驗(yàn)。 所以說(shuō)在理想面前現(xiàn)實(shí)還是很殘酷的,所以我們認(rèn)為現(xiàn)實(shí)還是擁有海量數(shù)據(jù)還是不容易的。我們看到很多的數(shù)據(jù)科學(xué)家跳槽到公司里面,比如說(shuō)前一陣比較出名的事件,著名的社交網(wǎng)絡(luò)研究學(xué)者、密執(zhí)根大學(xué)的Lada Adamic就跳到了Facebook。你要繼續(xù)去做研究一定要有數(shù)據(jù),數(shù)據(jù)在哪里,數(shù)據(jù)在公司里面,但是數(shù)據(jù)又不對(duì)外公開(kāi)怎么辦,科學(xué)家只好加入公司里去研究了。現(xiàn)在看來(lái),阿里還是不錯(cuò)的,既有很好的跟科學(xué)家的合作,又給科學(xué)家自由。 還有一個(gè)很著名的例子,《奇點(diǎn)臨近》的作者,著名的人工智能專(zhuān)家Ray Kurzwell,他也知道未來(lái)人工智能需要海量的數(shù)據(jù)來(lái)支持才能有突破,但是他跟谷歌談合作研發(fā),谷歌的創(chuàng)始人非常的支持,但是堅(jiān)持谷歌數(shù)據(jù)不可以對(duì)外,勸他加入谷歌。他加入谷歌后只得到了一個(gè)Director的頭銜,翻譯過(guò)來(lái)才是總監(jiān),其實(shí)他是非常有名的科學(xué)家和成功的企業(yè)家,為了得到谷歌的數(shù)據(jù)完全不在乎頭銜。我一度看了非常的好笑,因?yàn)檫@是拿數(shù)據(jù)做要挾的結(jié)果。 《大數(shù)據(jù)時(shí)代》說(shuō)簡(jiǎn)單的數(shù)據(jù)比復(fù)雜的算法對(duì)我們有用的多,我很認(rèn)同。很多時(shí)候我們過(guò)度強(qiáng)調(diào)算法了,但是算法遠(yuǎn)沒(méi)有比我們想的重要,因?yàn)槎鄶?shù)人沒(méi)有辦法進(jìn)入擁有數(shù)據(jù)的公司,所以沒(méi)有辦法解讀,而公司擁有這些人不放心讓你解讀,我寧留著所以沒(méi)有辦法。 我們都知道開(kāi)普勒發(fā)現(xiàn)行星的運(yùn)行規(guī)律之前,是丹麥天文學(xué)家第谷把所有的行星運(yùn)行數(shù)據(jù)收集了起來(lái),開(kāi)普勒只是基于這些數(shù)據(jù)做了一個(gè)解讀,就此產(chǎn)生了我們對(duì)宇宙的第一次清晰的基于現(xiàn)代物理學(xué)的研究。 大數(shù)據(jù)我們知道原來(lái)只能做觀測(cè),現(xiàn)在已經(jīng)進(jìn)化了到了實(shí)驗(yàn)階段,最著名的就是社交網(wǎng)絡(luò)上的實(shí)驗(yàn),比如Dancon Wattz做的給音樂(lè)網(wǎng)站里的音樂(lè)做排名的“平行世界”實(shí)驗(yàn)。但是我后來(lái)回頭想好像不對(duì),后來(lái)我看了一下歷史,原來(lái)開(kāi)普勒拿到第谷的數(shù)據(jù)也是偷來(lái)的,我覺(jué)得歷史又在重演了,所以今天你要說(shuō)科學(xué)家要得到開(kāi)普勒那樣的成績(jī),你還得從像第谷這樣的方法把數(shù)據(jù)偷來(lái),如果拿不來(lái)數(shù)據(jù)怎么研究。 當(dāng)然還有人說(shuō)我們有數(shù)據(jù)可以研究,比如說(shuō)我們拜訪了另外一個(gè)人叫彭特蘭教授,我看他寫(xiě)的書(shū)《社會(huì)物理學(xué)》,我就感覺(jué)回到了20年前上大學(xué)的時(shí)候,上大學(xué)的時(shí)候我們大四學(xué)細(xì)胞生物學(xué),是一個(gè)非常復(fù)雜的科學(xué),有無(wú)數(shù)的實(shí)驗(yàn),但是你發(fā)現(xiàn)什么問(wèn)題呢,基本上一堆事實(shí)的羅列而對(duì)整體的規(guī)律列不出來(lái)。 所以你會(huì)發(fā)現(xiàn)我們可以做很多這樣的實(shí)驗(yàn),我們?cè)谶@個(gè)學(xué)校里做這個(gè)實(shí)驗(yàn)是這樣的,但是在另外一個(gè)學(xué)校做這個(gè)實(shí)驗(yàn)是不是這樣的呢就不知道,很多結(jié)果是沖突的,大一統(tǒng)的系統(tǒng)理論還很遠(yuǎn)。 最后給大家留點(diǎn)希望,畢竟我們還要往前走。 第一,為什么往前走,因?yàn)榇髷?shù)據(jù)一定是未來(lái)。大數(shù)據(jù)我們不得不做,它不是一個(gè)充分條件,但是一個(gè)必要條件,沒(méi)有大數(shù)據(jù)不行,但是有了大數(shù)據(jù)也不必然成功。怎么辦呢,還是要繼續(xù)做啊。 第二,怎么走,我更寄希望于新興的企業(yè)可以重新整合數(shù)據(jù),把大數(shù)據(jù)整合到自己的整個(gè)運(yùn)營(yíng)系統(tǒng)當(dāng)中去,從而獲取更新的優(yōu)勢(shì),尤其是有了移動(dòng)應(yīng)用等等,在數(shù)據(jù)獲取上獨(dú)立于以前這些更封閉的數(shù)據(jù)平臺(tái),這樣會(huì)更現(xiàn)實(shí)。我們相信現(xiàn)有的數(shù)據(jù)平臺(tái)包括騰訊、阿里,他們的大數(shù)據(jù)是很難開(kāi)放的,與其等他們開(kāi)放,不如干脆另起爐灶重新獲取大數(shù)據(jù),然后再重新分析,更容易成功。 第三,大數(shù)據(jù)的核心一定是對(duì)用戶行為的深度掌握,大數(shù)據(jù)預(yù)測(cè)專(zhuān)家、《信號(hào)與噪聲》的作者nate Silver認(rèn)為大數(shù)據(jù)出來(lái)以后不是要替代這些真正理解用戶的專(zhuān)家,而是把專(zhuān)家的知識(shí)升華,用大數(shù)據(jù)驗(yàn)證專(zhuān)家到底是對(duì)的還是錯(cuò)的,到底可以不可以把專(zhuān)家的經(jīng)驗(yàn)復(fù)制到系統(tǒng)里面去,所以專(zhuān)家反而更被需要,他們和我們做數(shù)據(jù)的人是互補(bǔ)的,如果我們做數(shù)據(jù)的人不懂市場(chǎng)、不懂用戶,被淘汰的一定是我們。 最后,對(duì)于做數(shù)據(jù)的人,第一不要看輕自己,未來(lái)你是企業(yè)成功的必要條件;第二個(gè)也別高看自己,光有我們不行,我們要把自己整合到整個(gè)生態(tài)環(huán)境當(dāng)中去,這樣才能夠大家都共同發(fā)展,謝謝。 |
|
來(lái)自: 容得草堂 > 《職場(chǎng) 公務(wù)》