小編某天刷論壇的時候看到這樣一個貼:一個習(xí)慣python可視化數(shù)據(jù)的小伙被展示了把tableau之后感嘆道:“這就像是,你搭了一個mysql集群后發(fā)現(xiàn),公司有1000核的20年oracle授權(quán)!”。拿python畫了許久圖的小編心情如下: Tableau是一款商業(yè)智能(BI)軟件,可以連接無論是電子表格,數(shù)據(jù)庫還是hadoop或是云服務(wù)的多種數(shù)據(jù),簡單易用,可視化內(nèi)容豐富。Tableau public是Tableau系列中的一款開源軟件,提供了很多分析和可視化功能,下載網(wǎng)址:https://public./s/。 對于清洗后數(shù)據(jù)的常規(guī)可視化,tableau極大的解放了使用者花在作圖上的精力,簡單易操作的數(shù)據(jù)下鉆功能,使使用者更集中在數(shù)據(jù)和可視化后的分析上,其儀表板能系統(tǒng)地展示數(shù)據(jù),連動交互多種數(shù)據(jù)圖表,直觀的發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系或變化,用數(shù)據(jù)挖掘故事。 與之相比,python具備全棧分析能力,可以完成數(shù)據(jù)的獲取,清洗,分析,可視化的全過程,具備極高的設(shè)計自由度,而弊端呢,則是需要自行碼代碼,在常規(guī)的可視化作圖中,并不如tableau或其他BI軟件操作簡單方便。 今天,我們就來嘗試用tableau public做一些常規(guī)的專利分析的可視化。 STEP 1 導(dǎo)入數(shù)據(jù) 首先從數(shù)據(jù)庫中檢索并下載數(shù)據(jù),經(jīng)過清洗和標(biāo)引后將數(shù)據(jù)上傳。 Tableau也可將多個上傳的文件進(jìn)行組合。 STEP 2 數(shù)據(jù)調(diào)整 Tableau會根據(jù)它自己的理解,自動將導(dǎo)入的Excel表中的各項數(shù)據(jù)進(jìn)行分類,分為維度(Dimensions)和度量(measuers),同時還會根據(jù)單元格中的內(nèi)容將字段標(biāo)記為數(shù)字或日期信息(用“#”表示)、地理數(shù)據(jù)信息(用地球儀icon表示)、文本信息(用“Abc”表示)。 但Tableau的默認(rèn)分類可能并不是我們想要的,所以我們可以手動修改數(shù)據(jù)類型。 當(dāng)數(shù)據(jù)類型為“度量(measuers)”時,才可以對其進(jìn)行計數(shù)、計算平均值等操作,所以如果我們要統(tǒng)計申請量的話,就需要將“申請?zhí)枴弊侄晤愋托薷臑?span>“度量(measuers)”,這樣Tableau才可以對其計數(shù)。 如果要繪制地圖的話,就需要將“申請人國別代碼”字段類型修改為“國家/地區(qū)”。 STEP 3 工作表的制作 點擊界面右下角的“新建工作表”,就可以逐個創(chuàng)建新的空白工作表開始畫圖。 通過簡單的拖拽,即可完成多種可視化圖的繪制。下面舉三個例子: (1)申請趨勢圖 將“申請年份”(“申請年份”的字段,需要在ecxel表導(dǎo)入Tableau之前,在excel中對申請日進(jìn)行數(shù)據(jù)提取得到)拖到列標(biāo)簽,將“申請?zhí)枴保ㄒ葘⑵鋽?shù)據(jù)類型變成度量哦)拖到行標(biāo)簽。圖表就自動生成了。還可以選擇其他的圖表類型。 (2)技術(shù)功效圖(氣泡圖) 將“技術(shù)手段”拖到列標(biāo)簽,“技術(shù)效果”拖到行標(biāo)簽,“申請?zhí)枴保愋蜑槎攘浚┩系健按笮 ?,就能立刻生成氣泡圖。 (3)申請來源國分布圖 將“申請人國別代碼”拖到列標(biāo)簽,將“申請?zhí)枴保愋蜑槎攘浚┩系叫袠?biāo)簽,然后再選擇圖表類型就OK了。下圖展示的是采用熱力地圖或者treemap表現(xiàn)申請來源國分布。 此外,我們還可以根據(jù)需要對圖表進(jìn)行美化,例如修改配色,對象的大小,坐標(biāo)軸距離,增加數(shù)據(jù)標(biāo)簽等。 STEP4 創(chuàng)建儀表板 通過將已建立的工作表拖動到儀表板中央,調(diào)整工作表的大小和布局,來形成一個數(shù)據(jù)聯(lián)動的儀表板。 在這里小編僅僅以上面的三個圖作為例子制作儀表板,雖然上面三個圖之間可能沒什么關(guān)聯(lián),不能充分體現(xiàn)儀表板的優(yōu)勢。小編只是拋磚引玉,希望大家能夠做出關(guān)聯(lián)性更強(qiáng)分析更深入的案例。儀表板的圖表之間是相互連動交互的,利用這種交互的連動關(guān)系更易于挖掘和展示數(shù)據(jù)背后的故事。
今天只是初步的介紹了Tableau一些基礎(chǔ)的使用方法,Tableau還有很多強(qiáng)大的功能值得挖掘?qū)W習(xí),小編也在努力學(xué)習(xí)中,在之后的開源軟件中將會繼續(xù)介紹。 |
|