大數(shù)據(jù)時(shí)代,催生了各種各樣的數(shù)據(jù)分析和數(shù)據(jù)挖掘崗位,讓使得越來越多人投身到大數(shù)據(jù)分析和大數(shù)據(jù)挖掘的行列。對(duì)于大數(shù)據(jù)的未來發(fā)展,大家都是秉持著樂觀的心態(tài)的,而且當(dāng)前的互聯(lián)網(wǎng)金融和各個(gè)公司都開始重視和運(yùn)用大數(shù)據(jù)來給自己的集團(tuán)增添利益和名譽(yù),其中最為出名的就當(dāng)屬阿里巴巴、百度和騰訊了。無論未來大數(shù)據(jù)的發(fā)展會(huì)如何,我們都是走在當(dāng)下的人,走好當(dāng)下的每一步,未來的大數(shù)據(jù)分析和大數(shù)據(jù)挖掘之路才會(huì)有我們的身影和腳印。了解當(dāng)前中國大數(shù)據(jù)的發(fā)展現(xiàn)狀,既是對(duì)自己的警醒,也是對(duì)未來的把握。今天,小編就來好好和大家說說當(dāng)前中國大數(shù)據(jù)的現(xiàn)狀——以阿里巴巴、百度和騰訊為例。 Zara主打的是中高層次的服飾品,LV主要面對(duì)高端人群,但是為什么Zara毛利率比LV高呢?也許以前很少人可以用比較科學(xué)客觀準(zhǔn)確的說法來給出了結(jié)論。不過大數(shù)據(jù)的作用就開始凸顯了。正是因?yàn)榇髷?shù)據(jù)的客觀科學(xué),才使得Zara的市場(chǎng)目標(biāo)定位和客戶人群更加準(zhǔn)確到位,自然利潤(rùn)也會(huì)高人一籌。對(duì)于我國當(dāng)前的大數(shù)據(jù)現(xiàn)狀,最為走在前頭的當(dāng)然還是百度、騰訊和阿里三大巨頭。當(dāng)百度“大數(shù)據(jù)引擎”等互聯(lián)網(wǎng)巨頭向社會(huì)開放大數(shù)據(jù)基礎(chǔ)設(shè)施,敢用、會(huì)用就能創(chuàng)造更多商業(yè)奇跡和民生福利,當(dāng)然這本身給自己帶來的收益也是非常巨大的。 大數(shù)據(jù),是不是“大忽悠”?當(dāng)Zara這家零售企業(yè)將大數(shù)據(jù)運(yùn)用于創(chuàng)新經(jīng)營(yíng)時(shí),它創(chuàng)造了比奢侈品巨頭LV稅前毛利率更高的奇跡!要知道,Zara平均服飾價(jià)格只有LV的四分之一。 隨著百度開放“大數(shù)據(jù)引擎”,超級(jí)互聯(lián)網(wǎng)公司們正在向全社會(huì)提供大數(shù)據(jù)的基礎(chǔ)設(shè)施服務(wù)。敢用、會(huì)用,就可以創(chuàng)造更多類似的商業(yè)突破和民生福利。 為什么Zara毛利率比LV高?據(jù)悉, Zara堅(jiān)信在網(wǎng)絡(luò)上搜尋時(shí)尚資訊的人,對(duì)服飾的喜好、對(duì)資訊的掌握、催生潮流的能力,比一般大眾更前衛(wèi)。而且,在網(wǎng)上搶先得知Zara資訊的人,進(jìn)實(shí)體店消費(fèi)的比率也很高。所以Zara會(huì)將網(wǎng)上海量資料看作實(shí)體店面的“前測(cè)”指標(biāo)。以此幫助找到迎合網(wǎng)民喜歡的產(chǎn)品或趨勢(shì),從而在實(shí)體店增加銷售。 事實(shí)上,越來越多像Zara這樣精明的企業(yè),已經(jīng)開始利用大數(shù)據(jù)驅(qū)動(dòng)商業(yè)和管理創(chuàng)新。然而最大的問題是,面對(duì)看似高深的“大數(shù)據(jù)”,大部分傳統(tǒng)企業(yè)一“缺”數(shù)據(jù),既缺乏行業(yè)基本數(shù)據(jù);二不會(huì)“用”,缺乏大數(shù)據(jù)處理能力,即數(shù)據(jù)存儲(chǔ)與管理的規(guī)模、數(shù)據(jù)分析挖掘技術(shù)與能力、數(shù)據(jù)智能技術(shù)與相關(guān)能力。 怎么辦?商業(yè)發(fā)展的本質(zhì)在于社會(huì)專業(yè)分工。大數(shù)據(jù)的基礎(chǔ)服務(wù),可以由擁有海量數(shù)據(jù)及數(shù)據(jù)處理能力的大型互聯(lián)網(wǎng)公司。它們做大數(shù)據(jù),企業(yè)“用”大數(shù)據(jù)。 在中國互聯(lián)網(wǎng),有百度Baidu、阿里巴巴Alibaba、騰訊Tencent“三座大山”。李彥宏圈流量,馬云圈產(chǎn)業(yè)鏈,馬化騰圈用戶,三巨頭勢(shì)力最強(qiáng)、市值最高,被行業(yè)稱之為BAT。 以百度為例,隨著最近其“大數(shù)據(jù)引擎”的開放,號(hào)稱為傳統(tǒng)產(chǎn)業(yè)升級(jí)裝上了數(shù)字動(dòng)力引擎,降低企業(yè)應(yīng)用大數(shù)據(jù)的門檻,幫助拓展新的商業(yè)機(jī)會(huì)。 市場(chǎng)這么大,大家要么不懂,要么沒實(shí)力,這給了BAT在國內(nèi)大數(shù)據(jù)應(yīng)用領(lǐng)先的機(jī)會(huì)。以BAT為代表的互聯(lián)網(wǎng)陣營(yíng)幫助傳統(tǒng)企業(yè)將數(shù)據(jù)“資產(chǎn)化”,已經(jīng)成為不爭(zhēng)的事實(shí)。 BAT三家大數(shù)據(jù)比較百度、阿里巴巴、騰訊,三家都把大數(shù)據(jù)升級(jí)為集團(tuán)級(jí)戰(zhàn)略。但是,如果略作比較,還是存有很大差異。它不僅與其擁有的數(shù)據(jù)性質(zhì)有關(guān),也與技術(shù)基因、戰(zhàn)略優(yōu)先級(jí)和生態(tài)系統(tǒng)能力有關(guān)。 馬云曾公開說,“阿里管理好,騰訊產(chǎn)品好,百度技術(shù)好”。確實(shí)高,切中要害。在BAT中,以搜索引擎為核心的百度技術(shù)積累最深厚。作為大數(shù)據(jù)領(lǐng)域的“技術(shù)派”,這讓它幫助企業(yè)實(shí)現(xiàn)“數(shù)據(jù)資產(chǎn)化”有了相對(duì)優(yōu)勢(shì)。 “我們有一整套在世界上都不遜色的大數(shù)據(jù)技術(shù),包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、人工智能等方面。這十幾年,也有了全網(wǎng)數(shù)據(jù)、用戶查詢數(shù)據(jù)的積累。相對(duì)來說,更容易打造大數(shù)據(jù)引擎,并將能力開放出來?!卑俣葍?nèi)部人士表示。 從三大巨頭的數(shù)據(jù)源看,百度是基于用戶搜索行為的需求數(shù)據(jù),阿里掌握著交易及信用數(shù)據(jù),騰訊則掌握著社交關(guān)系數(shù)據(jù)?!捌鋵?shí)深入分析就會(huì)發(fā)現(xiàn),搜索已經(jīng)成為網(wǎng)民最普遍的行為,它包含的數(shù)據(jù)層面是非常廣、非常深的。阿里的數(shù)據(jù)相對(duì)只聚焦于交易數(shù)據(jù),騰訊只聚焦社交關(guān)系數(shù)據(jù),其實(shí)缺乏立體維度,實(shí)用面不如我們。”上述人士表示。 當(dāng)然,也不是誰擁有最多的用戶、流量或數(shù)據(jù),誰就在大數(shù)據(jù)領(lǐng)域最牛。所有關(guān)于大數(shù)據(jù)的論斷都認(rèn)為,大數(shù)據(jù)并不在于大,質(zhì)量、性質(zhì)以及誰擁有它,將決定大數(shù)據(jù)能被挖掘出來的價(jià)值和難度。 大數(shù)據(jù)必成“終極技術(shù)之爭(zhēng)”再大的數(shù)據(jù)沒分析技術(shù)也不行,利用大數(shù)據(jù)的難點(diǎn)歸根結(jié)底在于技術(shù)。 簡(jiǎn)單說,從數(shù)據(jù)的收集到存儲(chǔ)到清洗,再到脫敏,歸類,標(biāo)簽化、結(jié)構(gòu)化,以及最后的建模分析、挖掘利用,均是技術(shù)活兒。需要服務(wù)器集群、數(shù)據(jù)利用模型和數(shù)據(jù)處理算法來保障,然后才是挖掘出來的結(jié)果的包裝、變現(xiàn)。 來看一個(gè)例子,最近讓業(yè)界印象深刻的是“百度遷徙”這樣的公益項(xiàng)目,將其應(yīng)用在民生、新聞等領(lǐng)域。在去年4月24日的百度技術(shù)開放日上,李彥宏宣布百度首次開放核心數(shù)據(jù)能力。計(jì)劃通過大數(shù)據(jù)引擎的“開放云”、“數(shù)據(jù)工廠”、“百度大腦”三大組件,為傳統(tǒng)產(chǎn)業(yè)提供大數(shù)據(jù)存儲(chǔ)、分析及處理的能力。 阿里巴巴則對(duì)外宣稱已經(jīng)擁有100PB數(shù)據(jù),并“以令人欣喜的速度”增長(zhǎng)。在技術(shù)層面阿里也有飛天計(jì)劃、Apsara分布式計(jì)算系統(tǒng),還有數(shù)據(jù)委員會(huì)這樣的架構(gòu)。馬云最新內(nèi)部郵件將阿里戰(zhàn)略闡述為“云端+大數(shù)據(jù)”,要整體進(jìn)入大數(shù)據(jù)時(shí)代。但在深度學(xué)習(xí)、智能語言和圖像識(shí)別方面還要加速突破。 而在三大互聯(lián)網(wǎng)巨頭中,消息人士認(rèn)為,“騰訊這塊進(jìn)展相對(duì)慢,大數(shù)據(jù)云能力剛起步,大數(shù)據(jù)計(jì)算能力尚未完全形成,深度學(xué)習(xí)等高級(jí)機(jī)制仍是空白,甚至自有數(shù)據(jù)在各產(chǎn)品都還沒有打通?!钡云簌Z的體量和資源,一旦發(fā)力決不容小視。只是去年戰(zhàn)略性放棄搜索,或多或少讓人們有一些疑慮。 巨頭們?cè)诖髷?shù)據(jù)領(lǐng)域的競(jìng)爭(zhēng),一定會(huì)演變成一場(chǎng)技術(shù)的終極較量。相對(duì)而言,百度在大數(shù)據(jù)技術(shù)方面的積累和投入決心最大。但在商言商,大數(shù)據(jù)商業(yè)化成功需要一個(gè)過程,面對(duì)騰訊、阿里在其他領(lǐng)域的攻伐,百度得耐得住寂寞。 未來一切皆有可能來暢想一下,醫(yī)院可以將新生嬰兒的哭聲在云端存儲(chǔ)下來,并與互聯(lián)網(wǎng)的語音庫進(jìn)行比對(duì),理解嬰兒每一次啼哭聲的不同涵義,從而協(xié)助醫(yī)院及年輕的父母對(duì)新生兒進(jìn)行更好的看護(hù)。公安系統(tǒng)追捕逃犯,可以在海量監(jiān)控視頻中通過圖像識(shí)別技術(shù)找出犯罪嫌疑人,提升破案率。 這些不是故事,而是百度“大數(shù)據(jù)引擎”在傳統(tǒng)行業(yè)中的創(chuàng)新應(yīng)用場(chǎng)景。 以醫(yī)療機(jī)構(gòu)為例,它可以利用百度大數(shù)據(jù)引擎實(shí)現(xiàn)這樣的應(yīng)用圖景——通過“開放云”存儲(chǔ)個(gè)人電子病歷,通過“數(shù)據(jù)工廠”進(jìn)行數(shù)據(jù)挖掘和分析,最終通過百度大腦得出對(duì)個(gè)人健康的分析預(yù)測(cè),從而為每個(gè)人提供“數(shù)字化醫(yī)生”的服務(wù)。 其實(shí),物聯(lián)網(wǎng)傳感器、視頻監(jiān)控設(shè)備時(shí)時(shí)刻刻都在收集海量數(shù)據(jù),但價(jià)值沒有微博大,因?yàn)閿?shù)據(jù)難以變現(xiàn)。運(yùn)營(yíng)商擁有用戶通信相關(guān)數(shù)據(jù),從語音到短信再到位置,量大過任何一個(gè)互聯(lián)網(wǎng)巨頭。因?yàn)檫\(yùn)營(yíng)商不被允許也無能力去利用這些數(shù)據(jù),只能白白浪費(fèi)。 數(shù)字時(shí)代,用戶越來越多的日常行為從線下轉(zhuǎn)移到線上,并產(chǎn)生了大量非結(jié)構(gòu)化的數(shù)據(jù)。這讓互聯(lián)網(wǎng)公司在大數(shù)據(jù)領(lǐng)域有了機(jī)會(huì),因?yàn)樗軌驅(qū)@些沉淀數(shù)據(jù)進(jìn)行深度分析和解讀,挖掘其中蘊(yùn)含的社會(huì)、經(jīng)濟(jì)和民生價(jià)值。 結(jié)束語:互聯(lián)網(wǎng)誕生時(shí),號(hào)稱“在網(wǎng)上,沒人知道你是一條狗?!贝髷?shù)據(jù)時(shí)代,我們不但知道你是一條狗,而且知道公母、你愛吃什么、什么時(shí)候睡。 任何技術(shù)趨勢(shì),一旦開始就是不可逆轉(zhuǎn)的。你所要做的,就是順應(yīng)潮流。利用巨頭們開放出來的基礎(chǔ)設(shè)施,找到屬于你的機(jī)會(huì)。 |
|