![]() 網(wǎng)絡分析背景知識1.圖是一種數(shù)據(jù)結構
圖結構:是研究數(shù)據(jù)元素之間的多對多的關系。在這種結構中,任意兩個元素之間可能存在關系。即結點之間的關系可以是任意的,圖中任意元素之間都可能相關。 基于圖論(Graph theory)的網(wǎng)絡科學認為,任何非連續(xù)事物之間的關系都可以用網(wǎng)絡來表示,通過將互聯(lián)網(wǎng)內(nèi)的電腦、社會關系中的個人、生物的基因等不同屬性的實體抽象為節(jié)點(Node),并用連接(Link)來展示實體之間的關系,通過量化以節(jié)點和連接為組件的網(wǎng)絡結構指數(shù)(Index),從而能夠在統(tǒng)一的框架下尋找復雜系統(tǒng)的共性。
網(wǎng)絡關系圖(network analysis)是一款比較火的分析,最近頻繁出現(xiàn)在微生物生態(tài)研究的各大論文里。其實單純看網(wǎng)絡關系的話,只是一種數(shù)據(jù)分析的手段,很早就應用在其他領域。然而到了2006年,Proulx等科學家在TRENDS ECOL EVOL(IF=16.74)發(fā)文,提出網(wǎng)絡關系也可以作為一種分析手段應用在生態(tài)領域(Proulx et al. 2006)。到了2012年,Barberán等科學家在ISME發(fā)文,通過構建土壤中微生物的網(wǎng)絡關系來研究其共生模式(Barberán et al. 2012)。
目前生態(tài)學領域大家用到的網(wǎng)絡圖多為基于群落數(shù)據(jù)相關性構建的Co-occurrence網(wǎng)絡圖。此類網(wǎng)絡可以采用R中igraph包、Python 中的Networkx構建并實現(xiàn)出圖。當然,除此之外,還有一些非命令行的軟件,例如cytoscape,gephi,pajek,graphviz(dot),Ucinet等。
其中 Gephi 是開源免費跨平臺基于JVM的復雜網(wǎng)絡分析軟件, 其主要用于各種網(wǎng)絡和復雜系統(tǒng),因它簡單、易學、出圖美觀而備受青睞。當你打開網(wǎng)絡圖的大門,第一個映入眼簾的可能就是它,適合入門,被譽為Networker的初戀[扯]。
2.圖相關的概念和術語
3.圖的度量
Gephi 實現(xiàn)網(wǎng)絡圖繪制1.Gephi 安裝 下文Gephi官網(wǎng)安裝(我略,你不能略) 2.數(shù)據(jù)處理 以CSV格式文件為例:
邊文件 節(jié)點文件 3.導入數(shù)據(jù) 當然你要打開Gephi?!疚募俊敬蜷_】選擇文件,在點擊下一步的同時注意一下每個參數(shù)的含義是不是你要表達的意思。分別導入節(jié)點文件與邊文件。 ![]()
輸入第二個文件時 注意:
![]() 4.設置布局樣式 Gephi提供多種布局方式,一般圓形網(wǎng)絡圖選擇”Fruchterman Reingold”布局格式。點擊【運行】,等布局穩(wěn)定后,點擊 【停止】,生成圓形布局的網(wǎng)絡圖。 ![]() 5.網(wǎng)絡拓撲參數(shù)計算 點擊【窗口-統(tǒng)計】面板,分別點擊 【運行】-【關閉】當然你也可以選擇打印、復制,保存,最終你還是要選擇關閉。進行以下6個拓撲參數(shù)的計算:平均度、網(wǎng)絡直徑、圖密度、模塊化、平均聚類系數(shù)、平均路徑長度。 注:對于無向網(wǎng)絡圖,平均度和平均加權度 數(shù)值相同。再次注意:可能會卡。 ![]() 6.節(jié)點設定 點擊【窗口】-【外觀】-【節(jié)點】-大小-數(shù)值設定,選擇渲染方式為 度,設置節(jié)點大小的 最大尺寸和最小尺寸(此處分別為20和70),點擊 應用。顏色設置也在外觀節(jié)點中,設置渲染方式為Modularity Class注意紅色方框里內(nèi)容,從左到右依次為:顏色、大小,標簽顏色、標簽尺寸。 ![]() 7.邊設定 在【外觀】中選擇【邊】Partition 渲染方式選擇pn即我們數(shù)據(jù)中相關性標簽;Ranking選擇【度】。如下: ![]() 8.預覽修飾 點擊預覽,修改如下圖紅色方框選項,在 預覽設置 面板對網(wǎng)絡圖進行輸出前的最后修飾。
另外的選項可根據(jù)需要自行調整。在之前的設置中也可以通過預覽來查看效果,一步一步調整。 ![]() 9.圖像導出 Gephi 支持多種格式的輸出:SVG、PNG、PDF、gexf圖文件等。 ![]() 導出格式
導出的矢量圖可用AI等圖形編輯軟件進一步修改,圖形文件也可以用腳本來處理,圖個性化地添加圖例等。圖文件也是一種標簽語言。
讓大家見識一下,開頭HelloWorld的代碼:
<meta lastmodifieddate=”2018-05-30″> <creator>Gephi 0.9</creator> <description></description> </meta> <graph defaultedgetype=”directed” mode=”static”> <nodes> <node id=”0″ label=”Hello”> <viz:size value=”10.0″></viz:size> <viz:position x=”-157.09903″ y=”-64.66471″></viz:position> <viz:color r=”251″ g=”9″ b=”9″></viz:color> </node> <node id=”1″ label=”World”> <viz:size value=”10.0″></viz:size> <viz:position x=”157.09904″ y=”64.66471″></viz:position> <viz:color r=”10″ g=”194″ b=”245″></viz:color> </node> </nodes> <edges> <edge id=”0″ source=”0″ target=”1″> <viz:color r=”0″ g=”109″ b=”44″></viz:color> </edge> </edges> </graph></gexf>
GEXF (Graph Exchange XML Format) 是一種描述復雜網(wǎng)絡的語言,包括復雜網(wǎng)絡的結構,數(shù)據(jù)等等。最初是由Gephi項目2007年確立。生成gexf需要用到布局算法, 常見的有 Force-directed_graph_drawing 力導向算法, 一個花的例子:How Programmers Relate based on Google Searches ![]() 難點在哪?
gephi 中文教程|視頻
作者:周運來,一個讀序列天書的公子哥,穩(wěn)健,瀟灑,大方,靠譜。大型測序工廠的螺絲釘,統(tǒng)計草原上的游牧者。 |
|
來自: 創(chuàng)客小組 > 《sci666》