乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      菜鳥第一步,跪在數(shù)據(jù)處:R語言讀取數(shù)據(jù)

       生物_醫(yī)藥_科研 2019-01-20

      1. 溫故知坑

      實踐是學習知識的最好途徑。之前我講的內容都非常非?;A,包括:

      (1)什么是R語言?R語言和Rstudio軟件的安裝,Rstudio的界面介紹;
      (2)R語言的基本邏輯,基本數(shù)據(jù)類型;
      (3)ggplot基礎繪圖;
      (4)學習R語言的思路(整理,總結問題)。

      通過不斷的踩坑,走彎路,我們可以在勤奮的基礎上,找一些快速的方法。我們已經不能再像上大學時候一樣了,先啃完一本書,學好各種基礎知識,然后開始應用。工作之繁忙,生活之瑣碎,各種被電子產品占據(jù)走的時間。已經很難找出一整塊的時間去學習了。

      換句話說,沒有目的性的理論學習就是耍流氓。怎么講這么多數(shù)據(jù)類型,格式,可是我用不著呀?因此,我們調整策略,按照完成project為主線來解說在完成數(shù)據(jù)分析的過程中,我們需要用的R語言知識。

      2. 一個超級簡單的project流程

      以我之前處理的GEO數(shù)據(jù)為藍本,我們詳細的介紹每一個數(shù)據(jù)處理過程,所需要的知識(不僅僅是R語言代碼,還有各種背景知識)。

      步驟基本上是:導入數(shù)據(jù)--整理為可以進行分析的形式--差異分析(火山圖等)--GO/KEGG注釋(各種好看的圖)。其中每一個步驟都可以說是好幾把辛酸淚。

      但素!為了降低炸毛的風險,我自己捏造了一段非常非常小的數(shù)據(jù)用來做示例。想要跟著我步驟的小伙伴,需要這小小數(shù)據(jù),你們可以想辦法找到我。

      so,今天我們來講,導入數(shù)據(jù)!

      (1)首先自然是要有數(shù)據(jù)

      數(shù)據(jù)的來源:A. 自己課題組的各種測序結果,在經過linux的上游分析之后,得到一個表達量和分組的表格(我們也稱之為表達矩陣),經過精心整理之后,它大概需要變成這樣:

      B. 從公共數(shù)據(jù)庫下載:例如GEO、TCGA數(shù)據(jù)庫(知識點:自行去了解這兩個數(shù)據(jù)庫),那根據(jù)數(shù)據(jù)庫的不同,下載的數(shù)據(jù)也是有所不同的。GEO數(shù)據(jù)可以直接通過R語言下載,可以說是非常方便了!

      (2)載入數(shù)據(jù)方式

      R語言載入數(shù)據(jù)的方式如下:

      R語言數(shù)據(jù)的輸入:
      (1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他統(tǒng)計軟件出來的數(shù)據(jù),例如SPSS,SAS;(6)XML數(shù)據(jù);(7)網(wǎng)頁抓?。唬?)Stata;(9)netCDF;(10)HDF5;(11)通過數(shù)據(jù)庫接口下載;(12)通過Stat/Transfer導入數(shù)據(jù) 。

      看到這么多會直接炸毛,這么多!沒關系,我們又沒有期末考,掌握自己所需要的就可以了。

      最最最常見的數(shù)據(jù)就是txt,xls,csv(有點像xls)。

      (3)讀取Excel文件

      step 1-2  新建proj,管理文件,雙擊打開

      我在桌面上新建一個文件夾,叫做“train”。


      step 3 將Excel另存為csv文件,而后載入
      ## 方法一:另存為csv文件之后,以下代碼均可以讀取數(shù)據(jù)
      data_1<>'train.csv',header = T,sep = ',')
      data_2<>'train.csv',header = T,sep = ',')

      ## 知識點,header= T,sep=',' 是什么意思?
      ## header= T,字面上的意思就是:有抬頭,本文件的抬頭(即列名)就是:
      > colnames(data_1)
      [1'ensembl_id' 'control_1' 'control_2' 'control_3' 'experiment_1' 'experiment_2'
      [7'experiment_3'

      ## 那什么是sep=',' 你試試看不要這么參數(shù)?試試嘛!
      step 4 我偏不另存為,我就要讀Excel

      好的,妥妥的滿足你!雖然我不會,但是我去話了小潔大佬,她支的招就是,使用R包  tidyverse

      詳情請看:如何實現(xiàn)Excel和R語言雙劍合璧

      # 方法二:我偏不另存為,那就試試tidyverse包
      install.packages('tidyverse')
      library(tidyverse)  

      # 調出幫助文檔,學習如何使用該包
      ?tidyverse

      不想看幫助文檔學代碼的我,發(fā)現(xiàn)了一個小妙招:


      ## 根據(jù)R語言的提示,然后就妥妥的學會啦

      data_3<>'train.xlsx')

      最終三種方式載入的數(shù)據(jù)都是一樣的漂亮~


      至于txt文檔怎么載入,我想你用到的時候,定會查到的!

      3. 還是溫故知新的!

      其實寫這篇推文呢,我才是最大的收獲者,為了寫得簡潔明了,我回去自己看了一下書,然后又請教了小潔,真是妥妥的--溫故知不足,求索方知新。大家加油吧!

      再說一遍~需要數(shù)據(jù)的同學要么找到我,要么你自己手打咯~~反正也不多嘛~


        本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多