序言 有人說,數(shù)據(jù)可視化不就是把數(shù)據(jù)展示成圖嘛,看不出來研究的價(jià)值在哪。我原來也天真的以為,數(shù)據(jù)可視化就是把數(shù)據(jù)從冰冷的數(shù)字轉(zhuǎn)換成圖形,頂多就是表現(xiàn)形式豐富一些,看起來更酷炫,逼格滿滿。其實(shí)不然,優(yōu)秀的數(shù)據(jù)可視化案例,能夠帶給人們不僅僅是視覺上的沖擊,還能夠揭示蘊(yùn)含在數(shù)據(jù)中的規(guī)律和道理。 一、什么是數(shù)據(jù)可視化 數(shù)據(jù)可視化,是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究。其中,這種數(shù)據(jù)的視覺表現(xiàn)形式被定義為,一種以某種概要形式抽提出來的信息,包括相應(yīng)信息單位的各種屬性和變量。 數(shù)據(jù)可視化的目標(biāo)是洞悉蘊(yùn)含在數(shù)據(jù)中的現(xiàn)象和規(guī)律,這里面有多重含義:發(fā)現(xiàn)、決策、解釋、分析、探索和學(xué)習(xí)。 二、數(shù)據(jù)可視化分類 數(shù)據(jù)可視化包含三個(gè)分支,科學(xué)可視化、信息可視化和可視分析。 科學(xué)可視化面向的是科學(xué)和工程領(lǐng)域數(shù)據(jù),比如空間坐標(biāo)和幾何信息的三維空間測量數(shù)據(jù)、計(jì)算機(jī)仿真數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù),重點(diǎn)探索如何以幾何、拓?fù)浜托螤钐卣鱽沓尸F(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)律。 信息可視化的處理對象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù),如金融交易、社交網(wǎng)絡(luò)和文本數(shù)據(jù),其核心挑戰(zhàn)是針對大尺度高維復(fù)雜數(shù)據(jù)如何減少視覺混淆對信息的干擾。 可視分析學(xué)被定義為由可視交互界面為基礎(chǔ)的分析推理科學(xué),將圖形學(xué)、數(shù)據(jù)挖掘、人機(jī)交互等技術(shù)融合在一起,形成人腦智能和機(jī)器智能優(yōu)勢互補(bǔ)和相互提升。 三、麥肯錫的20張數(shù)據(jù)可視化圖表 數(shù)據(jù)可視化是科學(xué)、藝術(shù)和設(shè)計(jì)的結(jié)合,當(dāng)枯燥隱晦的數(shù)據(jù)被數(shù)據(jù)科學(xué)家們以優(yōu)雅、簡明、直觀的視覺方式呈現(xiàn)時(shí),帶給人們的不僅僅是一種全新的觀察世界的方法,而且往往具備藝術(shù)作品般的強(qiáng)大沖擊力和說服力。本文介紹的20個(gè)數(shù)據(jù)可視化圖表,將新冠病毒的發(fā)展與就業(yè)、數(shù)字化轉(zhuǎn)型、企業(yè)管理、、甚至市政數(shù)據(jù)以可視化的方式展示出來,讓人耳目一新,趨勢盡覽。 2020年初,COVID-19病例的迅速蔓延及其對人類生活和生計(jì)的毀滅性影響將永遠(yuǎn)存在。傳播和死亡率是較早出現(xiàn)的問題。很快也很明顯,該病毒對整個(gè)人群產(chǎn)生了不平等的影響,我們看到,冠狀病毒也基于社會(huì)經(jīng)濟(jì)地位進(jìn)行區(qū)分?;加袊?yán)重住房問題的人,或失業(yè),監(jiān)禁或貧窮的人,比普通人群更容易感染該病毒。
脆弱的族裔和 社會(huì)經(jīng)濟(jì)群體更有可能患有潛在的健康狀況,這可能使COVID-19病例更加嚴(yán)重甚至更致命。因此,很明顯,解決這些疾?。òǚ逝职Y,糖尿病和高血壓)可以保護(hù)數(shù)百萬人免于未來的大流行。 迫切需要控制慢性病。世界人口正在老齡化,我們關(guān)注的許多狀況都與年齡和生活方式有關(guān)。當(dāng)前的趨勢表明,這些疾病的發(fā)病率將在未來20年內(nèi)上升,而傳染病可能會(huì)下降。 對人與人接觸對健康的威脅的擔(dān)憂使世界上幾乎每個(gè)國家都陷入某種形式的封鎖。在世界衛(wèi)生組織宣布大流行的一個(gè)月之內(nèi),現(xiàn)在有191個(gè)國家的學(xué)生(16億兒童)正在家里學(xué)習(xí)。 廣泛的學(xué)校停課使各地工人特別是上班的母親的生活變得復(fù)雜,這些母親首當(dāng)其沖地承擔(dān)著育兒責(zé)任。根據(jù)我們最新的《職場女性》研究,這些挑戰(zhàn)以及職場中持續(xù)出現(xiàn)的不平等現(xiàn)象使多達(dá)200萬女性考慮離開職場。我們還發(fā)現(xiàn),如果在危機(jī)期間不采取任何措施解決性別均等問題,到2030年可能會(huì)使世界損失1萬億美元。相比之下,現(xiàn)在就此問題采取行動(dòng)可能會(huì)使同期的全球GDP增加13萬億美元,與“不采取任何行動(dòng)”方案相比。 即使對于那些沒有育兒問題的人,如果需要任何形式的共享出行,上下班也成為一個(gè)問題。在我們5月份的消費(fèi)者調(diào)查中,只有5%至8%的受訪者表示,這樣乘車上下班很安全。 封鎖也對消費(fèi)者的行為產(chǎn)生了近乎直接的影響。在歐洲,回應(yīng)我們4月中旬消費(fèi)者信心調(diào)查的購物者說,他們希望減少在雜貨和在線娛樂方面的支出。 亞洲國家是第一個(gè)進(jìn)入鎖定狀態(tài)的國家?,F(xiàn)在,普通的人類接觸已經(jīng)威脅到生命,生計(jì)和整個(gè)經(jīng)濟(jì)。數(shù)字化成為完成許多事情的方式-從拜訪醫(yī)生,購物到社交。亞洲各國政府和企業(yè)對六種數(shù)字和移動(dòng)技術(shù)的依賴將成為世界的典范。 全世界的政府很早就意識(shí)到與健康有關(guān)的封鎖將導(dǎo)致廣泛的經(jīng)濟(jì)損失。隨著企業(yè)的關(guān)閉以及(在某些國家)失業(yè)率創(chuàng)紀(jì)錄,他們迅速采取行動(dòng)以支撐經(jīng)濟(jì)并支持其人民。在全球范圍內(nèi),政府在短短兩個(gè)月內(nèi)就撥出了驚人的10萬億美元用于經(jīng)濟(jì)刺激。這是他們在整個(gè)2008-09年金融危機(jī)中花費(fèi)的三倍。 這種大流行的教訓(xùn)之一是,世界需要為下一個(gè)大流行做好更好的準(zhǔn)備。在7月份,當(dāng)對流感大流行造成的經(jīng)濟(jì)損失估計(jì)在9萬億至33萬億美元之間時(shí),我們估計(jì),相對較小的預(yù)防措施投資可能會(huì)大大限制未來的影響。 盡管這種流行病造成的經(jīng)濟(jì)損失已經(jīng)而且仍將是巨大的,但與造成的生命損失以及人們的幸福感和心理健康所造成的損失相比,卻相形見絀 。當(dāng)我們試圖估算與歐洲人幸福感相關(guān)的經(jīng)濟(jì)損失時(shí),我們發(fā)現(xiàn)歐洲人4月份的生活滿意度下降了0.38點(diǎn)(以10點(diǎn)為單位),相當(dāng)于歐洲大陸的3.5倍。人均收入減少。 轉(zhuǎn)向私營部門,大流行的影響在各個(gè)行業(yè)之間是不均衡的。其中某些是不可避免的,因?yàn)椴煌愋偷奈C(jī)對行業(yè)的影響不同。我們分析了23個(gè)行業(yè)價(jià)值鏈,以評(píng)估它們所遭受的大流行,網(wǎng)絡(luò)攻擊,地球物理事件,熱應(yīng)力,洪水和貿(mào)易爭端。 不過,對公司而言,好消息是,他們的命運(yùn)并不受所在行業(yè)的支配。我們對上次金融危機(jī)期間和之后的公司績效的分析表明,那些盡早采取措施提高彈性的人仍然表現(xiàn)出色他們的同齡人-并擴(kuò)大他們的領(lǐng)導(dǎo)力-至少十年。 問題在于,至少有一些高管沒有立即獲得備忘錄。那些在四月份通過危機(jī)對創(chuàng)新進(jìn)行調(diào)查的人告訴我們,他們已經(jīng)優(yōu)先考慮效率,并且保持核心業(yè)務(wù)穩(wěn)定而不是創(chuàng)新。他們希望在危機(jī)過去后重新安排創(chuàng)新的優(yōu)先級(jí)。 但是,對組織而言,一線希望是向數(shù)字化的快速轉(zhuǎn)變。公司將許多活動(dòng)數(shù)字化的速度比以前想象的快20到25倍。當(dāng)涉及到遠(yuǎn)程工作時(shí),公司的遷移速度比預(yù)期的快43倍。 另一個(gè)積極的發(fā)展是向敏捷領(lǐng)導(dǎo)力的轉(zhuǎn)變,許多人期望這種領(lǐng)導(dǎo)力將永久化。例如,我們接受調(diào)查的消費(fèi)者和零售業(yè)高管越來越多地表示,與那些行使權(quán)威或咨詢型領(lǐng)導(dǎo)能力的人相比,他們更喜歡賦予他人權(quán)力并促進(jìn)開放環(huán)境的領(lǐng)導(dǎo)者。 全年中,許多人質(zhì)疑世界是否可以控制大流行,同時(shí)還要應(yīng)對其他全球挑戰(zhàn),尤其是氣候變化。從COVID-19危機(jī)中復(fù)蘇的低碳議程能否創(chuàng)造就業(yè)機(jī)會(huì)并幫助經(jīng)濟(jì)?根據(jù)一項(xiàng)研究,是的。報(bào)告認(rèn)為,政府在可再生能源方面的支出每投資一千萬美元,就會(huì)比在化石燃料上創(chuàng)造50個(gè)就業(yè)機(jī)會(huì)。 隨著世界進(jìn)入北半球的冬季,人們開始擔(dān)心對COVID-19測試的需求可能會(huì)增加兩倍。在某種程度上,這是因?yàn)殡S著天氣轉(zhuǎn)冷并且人們在室內(nèi)度過了更多的時(shí)間,預(yù)計(jì)該病毒會(huì)再次流行。但這也是因?yàn)榱鞲屑竟?jié)臨近。類似于流感樣癥狀(類似于COVID-19癥狀),冬季平均比春季高三倍。 但是,我們以樂觀的態(tài)度結(jié)束了這一年。兩種有前途的疫苗在臨床試驗(yàn)中顯示約95%的有效性。有多少人需要接種疫苗才能保護(hù)大部分人口? 四、數(shù)據(jù)可視化的步驟 數(shù)據(jù)可視化的實(shí)施步驟主要有四項(xiàng):需求分析,建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市模型,數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL),建立可視化分析場景。 1) 需求分析 需求分析是數(shù)據(jù)可視化項(xiàng)目開展的前提,要描述項(xiàng)目背景與目的、業(yè)務(wù)目標(biāo)、業(yè)務(wù)范圍、業(yè)務(wù)需求和功能需求等內(nèi)容,明確對可視化的期望和需求。包括需要分析的主題、各主題可能查看的角度、需要發(fā)現(xiàn)的規(guī)律、需求等內(nèi)容。 2) 建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型 數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型是在需求分析的基礎(chǔ)上建立起來的。數(shù)據(jù)倉庫/數(shù)據(jù)集市建模除了數(shù)據(jù)庫的ER建模和關(guān)系建模,還包括專門針對數(shù)據(jù)倉庫的維度建模技術(shù)。維度建模的關(guān)鍵在于明確下面四個(gè)問題:
3) 數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL) 數(shù)據(jù)抽取是指將數(shù)據(jù)倉庫/集市需要的數(shù)據(jù)從各個(gè)源系統(tǒng)中抽離出來,因?yàn)槊總€(gè)系統(tǒng)的數(shù)據(jù)質(zhì)量不同,所以要對每個(gè)數(shù)據(jù)源建立不同的抽取程序,每個(gè)數(shù)據(jù)抽取流程都需要使用接口將源數(shù)據(jù)傳送到清洗和轉(zhuǎn)換階段。 數(shù)據(jù)清洗的目的是保證抽取的原數(shù)據(jù)的質(zhì)量符合數(shù)據(jù)倉庫/集市的要求并保持?jǐn)?shù)據(jù)的一致性。 數(shù)據(jù)轉(zhuǎn)換是整個(gè)ETL過程的核心部分,主要是對原數(shù)據(jù)進(jìn)行計(jì)算和放大。數(shù)據(jù)加載是按照數(shù)據(jù)倉庫/集市模型中各個(gè)實(shí)體之間的關(guān)系將數(shù)據(jù)加載到目標(biāo)表中。 4) 建立可視化場景 建立可視化場景是對數(shù)據(jù)倉庫/集市中的數(shù)據(jù)進(jìn)行分析處理的成果,能夠按照不同的主題和方式探查需求的核心數(shù)據(jù),從而作出趨勢性分析以便更精準(zhǔn)的預(yù)測和判斷。 五、綜述 數(shù)據(jù)可視化的開發(fā)和大部分項(xiàng)目開發(fā)一樣,也是根據(jù)需求來根據(jù)數(shù)據(jù)維度或?qū)傩赃M(jìn)行篩選,根據(jù)目的和用戶群選用表現(xiàn)方式。同一份數(shù)據(jù)可以可視化成多種看起來截然不同的形式。 ■有的可視化目標(biāo)是為了觀測、跟蹤數(shù)據(jù),所以就要強(qiáng)調(diào)實(shí)時(shí)性、變化、運(yùn)算能力,可能就會(huì)生成一份不停變化、可讀性強(qiáng)的圖表。 ■有的為了分析數(shù)據(jù),所以要強(qiáng)調(diào)數(shù)據(jù)的呈現(xiàn)度、可能會(huì)生成一份可以檢索、交互式的圖表 ■有的為了發(fā)現(xiàn)數(shù)據(jù)之間的潛在關(guān)聯(lián),可能會(huì)生成分布式的多維的圖表。 ■有的為了幫助普通用戶或商業(yè)用戶快速理解數(shù)據(jù)的含義或變化,會(huì)利用漂亮的顏色、動(dòng)畫創(chuàng)建生動(dòng)、明了,具有吸引力的圖表。 ■還有的被用于教育、宣傳或政治,被制作成海報(bào)、課件,出現(xiàn)在街頭、廣告手持、雜志和集會(huì)上。這類可視化擁有強(qiáng)大的說服力,使用強(qiáng)烈的對比、置換等手段,可以創(chuàng)造出極具沖擊力自指人心的圖像。 數(shù)據(jù)可視化的應(yīng)用價(jià)值,其多樣性和表現(xiàn)力吸引了許多從業(yè)者,而其創(chuàng)作過程中的每一環(huán)節(jié)都有強(qiáng)大的專業(yè)背景支持。無論是動(dòng)態(tài)還是靜態(tài)的可視化圖形,都為我們搭建了新的橋梁,讓我們能洞察世界的究竟、發(fā)現(xiàn)形形色色的關(guān)系,感受每時(shí)每刻圍繞在我們身邊的信息變化,還能讓我們理解其他形式下不易發(fā)掘的事物。 |
|