乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      開源分析方法 | 專利網(wǎng)絡(luò)可視化利器——Gephi

       豆豆samuel 2018-06-10

      關(guān)鍵詞:Gephi 專利數(shù)據(jù) 網(wǎng)絡(luò)可視化 

      今天繼續(xù)WIPO開源專利分析項(xiàng)目的編譯系列。近兩期相關(guān)文章中,公號系統(tǒng)地介紹了專利分析的八種工具(開源分析方法 | 專利分析工具上),其中在網(wǎng)絡(luò)關(guān)系可視化(Network Visualisation)中特別提到了“Gephi”這一開源工具,今天就為大家?guī)?span>用Gephi繪制專利網(wǎng)絡(luò)關(guān)系的作法詳解。


      注:本文編譯自WIPO開源專利分析項(xiàng)目中的“Patent Network Visualisation with Gephi”一文,有刪減,并根據(jù)最新版Gephi 0.9.1進(jìn)行了適應(yīng)性修改,更像是小編的閱讀兼實(shí)際操作筆記。


      Gephi介紹及安裝

      Gephi與網(wǎng)絡(luò)關(guān)系

      Gephi是一款非常好用的網(wǎng)絡(luò)關(guān)系繪制軟件,應(yīng)用范圍十分廣泛,凡是可以抽象為節(jié)點(diǎn)(node)和邊(edge)的關(guān)系數(shù)據(jù),大都可以用Gephi來繪制。比如Facebook上的社交網(wǎng)絡(luò)、鼠腦中的神經(jīng)網(wǎng)絡(luò)、美國各州間的交通網(wǎng)絡(luò)等。


      Gephi繪制的設(shè)計(jì)師博客主題聚類分析圖

      Facebook朋友關(guān)系分析

      鼠腦內(nèi)神經(jīng)元連接分析


      Gephi的安裝

      Gephi最新版本為0.9.1,下載(https:///users/download/)后雙擊并按照提示步驟安裝即可,第一次打開時(shí)會(huì)提示安裝Java(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)。

      一切安裝完畢后,Gephi的打開界面:


      為便于將Excel格式的數(shù)據(jù)直接導(dǎo)入Gephi中,還需要安裝一個(gè)將Excel或CSV格式數(shù)據(jù)轉(zhuǎn)換成Gephi可用數(shù)據(jù)的插件,安裝步驟如下:

      點(diǎn)擊“工具”——“插件”

      彈出如下窗口,點(diǎn)擊“可用插件”,選擇“Convert Excel and csv files to networks”

      點(diǎn)擊“安裝”后彈出如下窗口,按步驟提示一步步安裝即可。

      數(shù)據(jù)導(dǎo)入及圖形初繪

      原文作者非常貼心地提供了數(shù)據(jù)樣例——一組涉及“合成生物學(xué)”主題的專利數(shù)據(jù),包括576個(gè)首次專利申請和與之相關(guān)的2882個(gè)同族專利,并對數(shù)據(jù)進(jìn)行了清洗(數(shù)據(jù)樣例下載地址:https://github.com/poldham/opensource-patent-analytics/blob/master/2_datasets/synbio_patents/synbio_inventors.xlsx?raw=true)。


      輸入數(shù)據(jù)文件

      點(diǎn)擊“文件”——“import”

      彈出如下窗口:

      點(diǎn)擊“下一步”,彈出如下窗口:

      點(diǎn)擊“select file”,選擇剛才下載的數(shù)據(jù)文件


      選擇輸入內(nèi)容項(xiàng)

      繼續(xù)點(diǎn)擊“下一步”后,彈出如下窗口。本次可視化旨在分析申請人(受讓人)的共現(xiàn)關(guān)系,因此兩端的節(jié)點(diǎn)均選擇“patent_assignees_cleaned”

      選好后點(diǎn)擊下一步,彈出如下窗口,Gephi會(huì)詢問該數(shù)據(jù)列中有沒有包含子字段,如果有,子字段以什么為分界?

      觀察原始數(shù)據(jù)可以發(fā)現(xiàn),“patent_assignees_cleaned”這一字段中包含多個(gè)申請人的子字段,并以分號分隔。

      因此在上面的選項(xiàng)中,我們選擇“semicolon”(即分號),然后點(diǎn)擊“下一步”,彈出如下窗口,Gephi繼續(xù)詢問:如果想生成動(dòng)態(tài)網(wǎng)絡(luò)的話,選擇哪個(gè)字段作為時(shí)間字段?

      我們選擇“priority_date_earliest”

      點(diǎn)擊“下一步”后,彈出如下窗口,Gephi會(huì)給出三個(gè)選項(xiàng),我們勾選1和3。1表示要在“patent_assignees_cleaned”之間形成連接關(guān)系,是必選項(xiàng);3表示去除節(jié)點(diǎn)連接到自身的自循環(huán)環(huán)路,通常也應(yīng)勾選。

      點(diǎn)擊“下一步”,彈出提示窗口:

      點(diǎn)擊“完成”,彈出“輸入報(bào)告”窗口,提示一切正常,并告知共有363個(gè)節(jié)點(diǎn),176條邊,圖形為無向網(wǎng)絡(luò)圖。

      點(diǎn)擊“確定”后,得到如下初始圖形:


      刪除無效節(jié)點(diǎn)

      由于“patent_assignees_cleaned”字段中存在“NA”的無效數(shù)據(jù),應(yīng)當(dāng)將其去除。點(diǎn)擊上方的“數(shù)據(jù)資料”,點(diǎn)擊“frequency”排序,發(fā)現(xiàn)NA的頻率高達(dá)74次,選中NA,右鍵后點(diǎn)擊“刪除”并確定。

      再返回“概覽”界面:

      統(tǒng)計(jì)分析、參數(shù)設(shè)置及布局配置

      統(tǒng)計(jì)分析

      Gephi為整個(gè)網(wǎng)絡(luò)布局提供了一系列統(tǒng)計(jì)分析,包括平均度、平均加權(quán)度、網(wǎng)絡(luò)直徑、圖密度、平均聚類系數(shù)等。這些統(tǒng)計(jì)數(shù)據(jù)項(xiàng)與節(jié)點(diǎn)和邊等參數(shù)的設(shè)置密切相關(guān),例如節(jié)點(diǎn)的大小和顏色等可以按照節(jié)點(diǎn)出現(xiàn)頻率進(jìn)行排序,根據(jù)模塊化進(jìn)行聚類分區(qū)等。

      “統(tǒng)計(jì)”區(qū)域位于界面右側(cè),依次點(diǎn)擊“運(yùn)行”,可以得到平均度等統(tǒng)計(jì)數(shù)據(jù),其中最重要的統(tǒng)計(jì)數(shù)據(jù)有兩個(gè):

      1. 網(wǎng)絡(luò)直徑:計(jì)算給定節(jié)點(diǎn)與網(wǎng)絡(luò)中相距最遠(yuǎn)的節(jié)點(diǎn)之間的距離。

      2. 模塊化:對節(jié)點(diǎn)間的連接(即“邊”)進(jìn)行計(jì)算并基于連接強(qiáng)度對節(jié)點(diǎn)進(jìn)行聚類分區(qū)。


      參數(shù)設(shè)置

      Gephi提供了豐富的參數(shù)設(shè)置,可以對節(jié)點(diǎn)和邊的顏色、大小、標(biāo)簽顏色、標(biāo)簽尺寸等進(jìn)行調(diào)節(jié)。

      比如首先可以設(shè)置節(jié)點(diǎn)的顏色:依次選中“節(jié)點(diǎn)”——“調(diào)色板圖標(biāo)”——“數(shù)值設(shè)置”——“frequency(即按照節(jié)點(diǎn)出現(xiàn)頻率配置顏色)”,即可得到彩色的節(jié)點(diǎn)。

      接下來還可以配置節(jié)點(diǎn)的大小:依次選中“節(jié)點(diǎn)”——“節(jié)點(diǎn)大小圖標(biāo)”——“數(shù)值設(shè)置”——“加權(quán)度”,即可得到大小合適的節(jié)點(diǎn)。


      布局配置

      進(jìn)行參數(shù)設(shè)置后的專利申請人關(guān)系圖仍然擠作一團(tuán),沒有明顯的空間感。接下來需要對節(jié)點(diǎn)和邊的空間布局進(jìn)行配置,Gephi提供了很多節(jié)點(diǎn)的布局算法,包括Force Atlas、Fruchterman-Reingold、Yifan Hu等,其中Fruchterman-Reingold算法(簡稱FR算法)是最經(jīng)典的算法之一,我們點(diǎn)擊FR算法:

      點(diǎn)擊“運(yùn)行”,并設(shè)置合適的“區(qū)”、“重力”、“速度”后,得到下圖:

      觀察上圖,有一些節(jié)點(diǎn)仍處于交疊狀態(tài),此時(shí)可以運(yùn)行輔助布局工具“Noverlap”,與上圖相比,紅線框出的區(qū)域,交疊的節(jié)點(diǎn)打開成為更加清晰的空間布局。


      背景、邊及標(biāo)簽設(shè)置

      在界面下方的工具欄中,我們可以對圖形的背景、邊的顏色和尺寸以及標(biāo)簽的屬性進(jìn)行設(shè)置。

      在“Labels(標(biāo)簽)”的設(shè)置中,我們可以選擇字體的樣式、大小和顏色,還可以將標(biāo)簽字體大小設(shè)置為固定、按比例排列或隨節(jié)點(diǎn)尺寸變化,將標(biāo)簽顏色設(shè)置為單一或隨目標(biāo)變化等。

      如果覺得上面的標(biāo)簽太多太亂,還可以勾選“隱藏未選中”,點(diǎn)擊左上方的“矩形選擇”,按住Ctrl鍵,選擇希望顯示標(biāo)簽的節(jié)點(diǎn)即可,如下圖所示:


      輸出圖形

      點(diǎn)擊左下方的小相機(jī)按鈕,可以截屏輸出圖形,在配置中還可對分辨率和抗鋸齒等進(jìn)行設(shè)定。

      輸出圖形如下:

      Gephi的功能十分強(qiáng)大,今天僅僅是介紹了一些入門性能,上圖也還有很多可設(shè)置和優(yōu)化的空間,后續(xù)小編還將和大家一起深入學(xué)習(xí),也歡迎真愛粉提出更多好的想法。

        本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多