乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      我們是如何在一張地圖上表現(xiàn)86萬個數(shù)據(jù)的

       昵稱27299644 2015-09-23

      數(shù)盟(dataunion.org)是一個專注于數(shù)據(jù)應(yīng)用的技術(shù)型社區(qū),致力于成為培養(yǎng)與發(fā)現(xiàn)“數(shù)據(jù)科學(xué)家”的黃埔軍校。數(shù)盟主要關(guān)注大數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化等領(lǐng)域,倡導(dǎo)“數(shù)據(jù)價值的發(fā)現(xiàn)與應(yīng)用”,助力企業(yè)、個人提升價值。

      國內(nèi)唯一的數(shù)據(jù)可視化在線課程,搜索網(wǎng)易云課堂“數(shù)盟數(shù)據(jù)可視化”,或點(diǎn)擊文末閱讀原文,輕松搞定數(shù)據(jù)可視化~


      出處:百度新聞實(shí)驗(yàn)室

      作為一名數(shù)據(jù)工作者,我每天會接觸到很多的數(shù)據(jù)可視化成果,美好的可視化作品簡潔明快炫酷非常,讓人心情舒暢。

      但是不佳的數(shù)據(jù)可視化也越來越多。比如這張信息圖,通過大大小小的飛機(jī)圖標(biāo)展示某島空軍部署情況,但讀者能從中迅速獲取所表達(dá)的信息嗎?如果用“數(shù)字+圖標(biāo)”重新設(shè)計這張圖能否更加清晰?最后,這張圖也是密集恐懼者的一場災(zāi)難。

      我認(rèn)為目前可視化正在快速進(jìn)入泡沫期。每天在誕生各類優(yōu)秀作品的同時,會出現(xiàn)數(shù)倍的劣質(zhì)作品。原因在哪里?

      我的答案是——

      技術(shù)的發(fā)展激發(fā)了人類過度表達(dá)的欲望。

      2000年前,那時我們的祖先在竹簡上刻字,鐫刻每一個字都非常辛苦,技術(shù)落后使我們的表達(dá)簡潔,比如說《老子》五千言,文辭深邃,流轉(zhuǎn)久遠(yuǎn),陳鼓應(yīng)先生用厚厚一本書注譯。而現(xiàn)在我們有了電腦輸入法,打字飛快。但是結(jié)果呢(如下圖)?

      技術(shù)的發(fā)展在解放生產(chǎn)力的同時,也解放了過度表達(dá)的欲望,而這個勢頭正在數(shù)據(jù)可視化領(lǐng)域重演。

      在現(xiàn)代工具的幫助下,我們點(diǎn)兩下鼠標(biāo)就可以做出精美的圖表,而類似的圖表在三五年前還要需要專業(yè)繪圖者花兩三天才能做出來。傳播就更容易了,輕輕點(diǎn)擊按紐就可以立刻傳到朋友圈讓大家看到。

      極簡主義面前,數(shù)據(jù)可視化需要回答的三個問題

      這個時代可視化更需要簡潔表達(dá)。極簡主義目前很流行,但做到并不容易,一方面是由于技術(shù)局限,另一方面是必須努力控制自身表達(dá)欲望。一年前我們也經(jīng)歷了一場理智與欲望的斗爭。

      2013年,中國政府啟動了中國第三次全國經(jīng)濟(jì)普查。這是人類歷史上空前的一次壯舉!國家動用了300多萬基層調(diào)查員,對960萬平方公里上的1200多萬個經(jīng)濟(jì)單位,進(jìn)行上千個指標(biāo)的詳細(xì)地毯式普查。

      我們的團(tuán)隊(duì)為國家統(tǒng)計系統(tǒng)建設(shè)了十多年的統(tǒng)計地理信息系統(tǒng),所以2014年接受了一個光榮而艱巨的任務(wù)把全國33個省(不包括臺灣)328個地市、2000多個縣的數(shù)據(jù)展示在一張地圖上,一共3次經(jīng)濟(jì)普查每個地區(qū)包含90多個指標(biāo),總數(shù)據(jù)量達(dá)到86萬個。

      這個可視化工作很困難。迫使我們?nèi)ニ伎既齻€關(guān)鍵的問題:

      數(shù)據(jù)可視化的目的是什么?

      作用對象是誰?

      傳遞信息的關(guān)鍵是什么?

      我想到了多年前看過無印良品的創(chuàng)始人原研哉撰寫的《設(shè)計中的設(shè)計》,其中提到“Visualogue”的概念,也就是視覺對話??梢栽O(shè)想兩個語言、文字不通的陌生人,給他們一張紙,一桿筆,他們一定是最簡潔的方式把自己的想法畫下來交流,這就是用視覺對話。這其實(shí)就是數(shù)據(jù)可視化的本質(zhì),通過可視化圖表將對領(lǐng)域陌生的讀者用比文字快十倍百倍的速度帶進(jìn)門。

      這給了我一個啟示,了解了人類的對話也許是理解可視化的鑰匙。所以我破解了一次對話。所有對話都從信息源開始,信息經(jīng)歷通道傳輸給接收者,并形成反饋,此外還需要考慮來自環(huán)境的噪音以及人為噪音——語言中的無效信息。所有對話都是由這樣的基本單元組成。

      提升可視化效率的三個方法

      參照對話模型就可以發(fā)現(xiàn)數(shù)據(jù)可視化的優(yōu)化密碼。提升對話效率通常有三個方法:

      第一個是明確,明確的說話內(nèi)容,

      第二需要邏輯,每句話之間需要有關(guān)系,

      第三是剔除噪音,包括自然和認(rèn)為的噪音。

      在數(shù)據(jù)可視化領(lǐng)域相對應(yīng)的三項(xiàng)技術(shù)就是數(shù)據(jù)降維、關(guān)聯(lián)關(guān)系和扁平交互。

      1.數(shù)據(jù)降維

      數(shù)據(jù)降維被認(rèn)為是大數(shù)據(jù)處理的首要任務(wù)。而迄今為止最有效的降維方法依舊是人類已經(jīng)使用上千年的分類。在沒有計算機(jī)的時代,圖書館使用分類技術(shù)讓我們在短時間內(nèi)可以在成千上萬本書中找到需要的信息。

      在地理可視化中也充分利用分類技術(shù),分析發(fā)現(xiàn)86萬數(shù)據(jù)是可以分為時間和地區(qū)兩個分組,而90多個指標(biāo)可以分為綜合信息,第三產(chǎn)業(yè),第二產(chǎn)業(yè)、能源四大類。這三大維度時間、地區(qū)和指標(biāo)構(gòu)成數(shù)據(jù)空間,三個維度值確定就可以獲得唯一的數(shù)據(jù),比如北京市(地區(qū))2013年(時間)的就業(yè)人口總數(shù)(指標(biāo));

      如果確定兩個維度就可以獲得一個相關(guān)的數(shù)據(jù)集,例如2013年(時間)單位總數(shù)(指標(biāo)),其全國分布圖。


      我們在是否嘗試去了解分析自己面對的數(shù)據(jù),良好的數(shù)據(jù)分類整理是實(shí)現(xiàn)優(yōu)質(zhì)的可視化的最好起點(diǎn)。

      2.關(guān)聯(lián)關(guān)系

      數(shù)據(jù)本身并無意義,只有相關(guān)才能產(chǎn)生含義與價值,所以關(guān)聯(lián)關(guān)系時則從數(shù)據(jù)到知識躍遷的過程.此過程需要將零散數(shù)據(jù)集聚,叫做信息加工。

      可視化不同于文字,知識不是直白的說出來,而是用隱喻方式表達(dá),綜合利用顏色、大小、聯(lián)動等視覺習(xí)慣讓讀者在不知不覺中自然感受到數(shù)據(jù)的差異和關(guān)聯(lián)。

      地圖上不同顏色深淺代表數(shù)據(jù)值的大小,圖標(biāo)的大小和內(nèi)容可以代表數(shù)據(jù)總量大小,和不同成分差異。

      數(shù)據(jù)聯(lián)動主要體現(xiàn)在人機(jī)交互中,隨著鼠標(biāo)移動數(shù)據(jù)同步變化,此外關(guān)聯(lián)的欄目頁隨時更新當(dāng)前熱點(diǎn)區(qū)域的指標(biāo)排名和三次經(jīng)濟(jì)普查的變化趨勢,整個過程基本不依賴文字語言,讀者可以直觀感受到數(shù)據(jù)的變化。

      良好的數(shù)據(jù)關(guān)聯(lián)性分析與處理有助于厘清一份數(shù)據(jù)對于可視化是否有價值,也可以幫助我們選擇合適的可視化方法。

      3.扁平交互

      計算機(jī)與手機(jī)屏幕是有限的,每增加一個顏色和要素都會增加進(jìn)入眼睛的信息量,從而干擾對信息的傳輸,所以要嚴(yán)格控制進(jìn)入用戶眼睛每一個比特,避免沖淡可視化主題。

      地理可視化中采取了兩種方式實(shí)現(xiàn)數(shù)據(jù)隱藏,一種是逐級鉆取,可以充分利用地域的天然的分級包含關(guān)系,使得信息不用不一下子全部展開,而是隨著“省-市-縣”層次逐級展示;另一種是擴(kuò)展圖示

      將復(fù)雜的信息濃縮為簡單的圖標(biāo),只有讀者感興趣的時候才點(diǎn)擊展開。

      數(shù)據(jù)可視化是一個“謊言”

      從某種意義上說可視化是一個“謊言”,現(xiàn)在不缺乏數(shù)據(jù)展示,缺乏的是數(shù)據(jù)隱藏,只有充分的數(shù)據(jù)隱藏才能有效的數(shù)據(jù)展示。這是可視化的關(guān)鍵。

      什么叫隱藏?不是不讓讀者看到這個數(shù)據(jù),而是分不同的場合、不同的時間段展示不同的數(shù)據(jù),只有當(dāng)讀者需要了才展示,而不是一下子將所有數(shù)據(jù)鋪開來,否則其實(shí)是對數(shù)據(jù)的濫用,也阻礙了讀者獲取信息。

      感謝我們不屈不撓,創(chuàng)意無限的優(yōu)秀團(tuán)隊(duì),感謝你們?yōu)榇税具^的多少個不眠之夜,作為你們的一員,我非常驕傲。

      我們也于8月份把作品放在國家數(shù)據(jù)網(wǎng)站上,讓全國乃至全球的讀者都可以分享中國第三次全國經(jīng)濟(jì)普查這項(xiàng)人類壯舉的喜悅。

      這就是我們將86萬數(shù)據(jù)放入一張地圖的故事,總結(jié)一句話“可視化的本質(zhì)是簡潔”,也就是俗話說“千言萬語不如一張圖”。

      但是為什么還會出現(xiàn)過度表達(dá)現(xiàn)象呢?我想這和更愛自己還是更愛世界有關(guān),如果一個人更希望去炫耀自己的技術(shù)和數(shù)據(jù),那么很有可能選擇復(fù)雜的可視化,如果一個人更關(guān)注傳遞給讀者有效信息,那么他肯定會選擇簡潔的可視化。

      所以請行動吧,審視自己的每一幅作品,每一段文字,每一張圖片,大膽的剃掉不必要的部分,你會發(fā)現(xiàn)舍棄的越多,你將獲得的會更多。


      關(guān)于我們 ID:DataScientistUnion

      數(shù)盟網(wǎng)站:www.dataunion.org

      數(shù)盟微博:@數(shù)盟社區(qū)

      數(shù)盟微信:DataScientistUnion

      數(shù)盟【大數(shù)據(jù)群】272089418

      數(shù)盟【數(shù)據(jù)可視化群】 179287077

      數(shù)盟【數(shù)據(jù)分析群】 174306879

      (長按可關(guān)注)



      點(diǎn)擊[閱讀原文] 國內(nèi)唯一數(shù)據(jù)可視化在線課程



        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多