《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》是大數(shù)據(jù)相關(guān)主題的暢銷(xiāo)書(shū)之一,作者是維克托·邁爾-舍恩伯格【英】,他被譽(yù)為“大數(shù)據(jù)時(shí)代的預(yù)言家”,現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專(zhuān)業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人,新加坡國(guó)立大學(xué)信息政策研究中心主任。他的咨詢(xún)客戶包括微軟、惠普和IBM等全球頂級(jí)企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的定制者和參與者,還先后擔(dān)任新加坡商務(wù)部高層、文萊國(guó)防部高層、科威特商務(wù)部高層、迪拜及中東政府高層的智囊。 這次的主題報(bào)告主要和大家分享一下書(shū)中作者關(guān)于大數(shù)據(jù)的一些觀點(diǎn)和想法,也希望大家能夠?qū)@些觀點(diǎn)提出自己的看法。 以下是我做的關(guān)于這本書(shū)的思維導(dǎo)圖:
正如從思維導(dǎo)圖中可以看到的,整本書(shū)的結(jié)構(gòu)分成三部分:大思維變革,商業(yè)變革與管理變革。個(gè)人覺(jué)得和我們比較相關(guān)的可能是思維變革與商業(yè)變革兩部分,因此這次主題報(bào)告主要和大家分享了這前面兩部分的內(nèi)容。 第一部分:思維變革 在這一部分的內(nèi)容中,作者主要提出了三個(gè)觀點(diǎn):更多,更雜,更好。一下是提煉出的作者的一些觀點(diǎn): 1. 更多:不是隨機(jī)樣本,而是全體數(shù)據(jù) 小數(shù)據(jù)時(shí)代的隨機(jī)采樣,最少的數(shù)據(jù)獲得最多的信息 采樣分析的精確性隨著采樣隨機(jī)性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大。 隨機(jī)采樣取得了巨大的成功,成為現(xiàn)代社會(huì)、現(xiàn)代測(cè)量領(lǐng)域的主心骨,但這只是一條捷徑,是在不可收集和分析全部數(shù)據(jù)的情況下的選擇,它本身存在許多固有的缺陷。 大數(shù)據(jù)是指不用隨機(jī)分析法這樣的捷徑,而采用所有數(shù)據(jù)的方法。(大數(shù)據(jù)時(shí)代:樣本==總體) 在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像是汽車(chē)時(shí)代騎馬一樣。在某些特定情況下,我們依然可以使用樣本分析法,但這不再是我們分析數(shù)據(jù)的主要方式。慢慢地,我們會(huì)完全拋棄樣本分析。 2. 更雜:不是精確性,而是混雜性 允許不精確 大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效 紛繁的數(shù)據(jù)越多越好 混雜性,不是竭力避免,而是標(biāo)準(zhǔn)途徑 大數(shù)據(jù)要求我們有所改變,我們必須能夠接受混亂和不確定性。 3. 更好:不是因果關(guān)系,而是相關(guān)關(guān)系 知道“是什么”就夠了,沒(méi)必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原理,而是要讓數(shù)據(jù)自己“發(fā)聲”。 建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。 相關(guān)關(guān)系很有用,不僅僅是因?yàn)樗転槲覀兲峁┬碌囊暯牵姨峁┑囊暯嵌己芮逦?。而我們一旦把因果關(guān)系考慮進(jìn)來(lái),這些視角就有可能被蒙蔽掉。
第二部分:商業(yè)變革 在商業(yè)變革這部分中,作者主要從四個(gè)方面來(lái)講述了大數(shù)據(jù)時(shí)代對(duì)商業(yè)社會(huì)產(chǎn)生的影響與變化,分別是:數(shù)據(jù)化、數(shù)據(jù)價(jià)值、數(shù)據(jù)創(chuàng)新與角色定位。 1. 數(shù)據(jù)化:一切皆可量化 數(shù)據(jù)可以從最不可能的地方提取出來(lái);文字可以變成數(shù)據(jù);方位可以變成數(shù)據(jù);溝通可以變成數(shù)據(jù)。 2. 數(shù)據(jù)價(jià)值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新,數(shù)據(jù)具有潛在價(jià)值。 作者用兩個(gè)案例來(lái)講述如果挖掘數(shù)據(jù)的潛在價(jià)值。 ReCaptcha與數(shù)據(jù)再利用:垃圾郵件促使驗(yàn)證碼的發(fā)明,然而為了能夠使人的計(jì)算能力得到更有效的利用,發(fā)明者對(duì)驗(yàn)證碼改進(jìn), 人們需要從計(jì)算機(jī)光學(xué)字符識(shí)別程序無(wú)法識(shí)別的文本掃描項(xiàng)目中讀出兩個(gè)單詞并輸入。后來(lái)谷歌收購(gòu) 了該公司,并用于圖書(shū)掃描項(xiàng)目。 IBM,電動(dòng)汽車(chē)動(dòng)力與電力供應(yīng)系統(tǒng)優(yōu)化預(yù)測(cè):為了解決電動(dòng)車(chē)應(yīng)在何時(shí)何地獲取動(dòng)力的問(wèn)題,IBM利用汽車(chē)的電池電量、汽車(chē)的位置和一天中的時(shí)間以及附近可用插槽等信息,開(kāi)發(fā)了一套復(fù)雜的預(yù)測(cè)模型,并將誒是充電站的最佳設(shè)置點(diǎn)。 這兩個(gè)案例的共同點(diǎn)在于數(shù)據(jù)并不是以其本身的作用被利用的,如汽車(chē)電池的電量等本來(lái)是設(shè)計(jì)來(lái)給駕駛者了解汽車(chē)本身電量情況的指標(biāo),但在案例中被用以分析和預(yù)測(cè)。這是數(shù)據(jù)的二次利用,挖掘出了數(shù)據(jù)的潛在價(jià)值。 總結(jié)來(lái)說(shuō)就是:數(shù)據(jù)的真正價(jià)值就像漂浮在海洋上的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。 3. 數(shù)據(jù)創(chuàng)新: 數(shù)據(jù)的再利用 重組數(shù)據(jù):數(shù)據(jù)的總和比部分更有價(jià)值 可擴(kuò)展數(shù)據(jù):盡可能收集多的數(shù)據(jù)并考慮到各種潛在的二次用途 數(shù)據(jù)的折舊值:數(shù)據(jù)的有效性隨著時(shí)間推移而下降 數(shù)據(jù)廢氣:描述人們?cè)诰W(wǎng)上留下的數(shù)字軌跡 開(kāi)放數(shù)據(jù):開(kāi)放政府?dāng)?shù)據(jù),取之于民,用之于民 4. 角色定位:數(shù)據(jù)、技術(shù)與思維的三足鼎立 基于數(shù)據(jù)本身的公司:擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。 基于技能的公司:通常是咨詢(xún)公司、技術(shù)供應(yīng)商或者分析公司,它們掌握專(zhuān)業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途的才能。 基于思維的公司:創(chuàng)新思維,有挖掘數(shù)據(jù)的新價(jià)值的獨(dú)特想法。所謂大數(shù)據(jù)思維,是指一種意識(shí),認(rèn)為公開(kāi)的數(shù)據(jù)一旦處理得當(dāng)就能為錢(qián)百萬(wàn)人急需解決的問(wèn)題提供答案。 大數(shù)據(jù)時(shí)代會(huì)出現(xiàn)的兩種新角色: 全新的數(shù)據(jù)中間商:它們從各種地方搜集數(shù)據(jù)進(jìn)行整合,然后再提取有用的信息進(jìn)行利用。 例如:交通數(shù)據(jù)處理公司:Inrix,它匯集了來(lái)自美洲和歐洲近1億輛汽車(chē)的實(shí)時(shí)交通數(shù)據(jù),包括私家車(chē)和商用車(chē)。同時(shí),私家車(chē)主的移動(dòng)電話也是數(shù)據(jù)的來(lái)源。通過(guò)為用戶提供一個(gè)免費(fèi)的智能手機(jī)應(yīng)用程序,一方面為用戶提供免費(fèi)的交通信息,另一方面也為了自己收集同步的數(shù)據(jù)。通過(guò)這些數(shù)據(jù)和歷史交通數(shù)據(jù)進(jìn)行比對(duì),在考慮天氣和其他諸如當(dāng)?shù)貢r(shí)事等信息來(lái)預(yù)測(cè)交通狀況,并將數(shù)據(jù)軟件分析出的結(jié)果同步到汽車(chē)的導(dǎo)航系統(tǒng)中。 崛起的數(shù)據(jù)科學(xué)家:行業(yè)專(zhuān)家和技術(shù)專(zhuān)家的光芒都會(huì)因?yàn)榻y(tǒng)計(jì)學(xué)家和數(shù)據(jù)分析家的出現(xiàn)而變暗,因?yàn)楹笳卟皇芘f觀念的影響,能夠聆聽(tīng)數(shù)據(jù)發(fā)出的聲音。他們的判斷建立在相關(guān)關(guān)系的基礎(chǔ)上,沒(méi)有收到偏見(jiàn)和成見(jiàn)的影響。 例如:Coursera,一家網(wǎng)上教育公司,深度地研究它收集的所有數(shù)據(jù),比如學(xué)生重放過(guò)講座視頻的哪個(gè)片段,從而找出不明確或者很吸 引人的地方,然后反饋給設(shè)計(jì)課程的團(tuán)隊(duì)。這在以前是做不到的,所以老師的教育方法一定會(huì)改變。
以上就是這次主題報(bào)告的內(nèi)容。 對(duì)《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書(shū)感興趣的讀者可以查看該書(shū)相關(guān)的書(shū)評(píng)等book.douban.com/subject/20429677/
|
|
來(lái)自: 看見(jiàn)就非常 > 《tip》