R語言學(xué)習(xí)——R讀取txt、csv、xls和xlsx格式文件

楓林秋2016 2019-09-01

展開全文

最近項目中運(yùn)用到了R讀取文件數(shù)據(jù)，所以把相關(guān)好用的、經(jīng)過驗證的方法總結(jié)了一下，有效避免下次入坑。

1. R讀取txt文件

使用R讀取txt文件直接使用read.table()方法進(jìn)行讀取即可，不需要加載額外的包。

read.table("/home/slave/test.txt",header=T,na.strings = c("NA"))

注意，此處的na.strings = c("NA") 的意思是文件中的缺失數(shù)據(jù)都是用NA進(jìn)行表示；在讀取文本文件時，默認(rèn)的分割符號為空格。具體的參數(shù)設(shè)置可參照如下：

read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

2. R讀取csv文件

使用R讀取csv文件和讀取txt文件很類似，使用的是read.csv()方法，兩者參數(shù)的使用大部分是一樣的。

read.csv("/home/slave/test.csv", header=T, na.strings=c("NA"))

在讀取csv文件時，分割符為“，”（這句基本是廢話，大家懂得）；具體的參數(shù)設(shè)置可參考如下：

read.csv(file, header = TRUE, sep = ",", quote = "\"",
dec = ".", fill = TRUE, comment.char = "", ...)

3. R讀取xls和xlsx文件

讀取xls和xlsx有很多方法，但是這里面的很多方法也不是特別好用，例如RODBC包中的讀取xls方法就不太好用，有時還會出現(xiàn)各種各樣的問題。在進(jìn)行了一番入坑探索之后，找到了兩個相對好用的讀取xls文件的包，下面我將分別進(jìn)行說明。

gdata

install.packages("gdata")
library(gdata)
read.xls("/home/slave/test.xls",sheet=1,na.strings=c("NA","#DIV/0!"))

其中sheet=1 參數(shù)的意思是讀取第一個sheet中的內(nèi)容；na.strings=c("NA","#DIV/0!") 將"NA" 和 "#DIV/0!" 都作為缺失數(shù)據(jù)表示，read.xls()方法的具體參數(shù)設(shè)置可參考如下：

read.xls(xls, sheet=1, verbose=FALSE, pattern, na.strings=c("NA","#DIV/0!"),
..., method=c("csv","tsv","tab"), perl="perl")

read.xls()方法只是gdata包中的一個方法，gdata包中還有一些有用的方法，例如xls轉(zhuǎn)csv,xls轉(zhuǎn)txt等，在這里進(jìn)行一些列舉：

xls2csv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tab(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tsv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2sep(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ...,
method=c("csv","tsv","tab"), perl="perl")

gdata包有著很多的功能，但是它對其他的包的依賴很多，可能會出現(xiàn)各種不可預(yù)知的問題，下面介紹一個較少依賴的包。

readxl

install.packages("readxl")
library(readxl)
read_excel("/home/slave/test.xls",sheet=1,na="NA")

這塊需要注意的一點是na="NA" 和其他讀取時的格式略有不同，下面列出了具體的參數(shù)設(shè)置：

read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)

注意：以上的兩個方法都可以對xls和xlsx進(jìn)行讀取。

至此，已將我們在R中常用到的讀取文件數(shù)據(jù)方法以及介紹完畢，下面就讓我們一起動手實驗吧。^_^

參考：

http://www.cnblogs.com/xianghang123/archive/2012/06/06/2538274.html
https://cran./web/packages/gdata/index.html
https://github.com/hadley/readxl

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：楓林秋2016 > 《R語言》

舉報/認(rèn)領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

楓林秋2016

關(guān)注對話

TA的最新館藏

[轉(zhuǎn)] Word灰色中括號太煩人？這里有妙招幫你解決！
每天喝“二兩酒”和“滴酒不沾”，哪個更健康呢？一次性說明白
人才加速聚集引擎驅(qū)動一流——聚焦河南大學(xué)生物學(xué)學(xué)科人才培育
“梁子湖模式”花開湖南大通湖①丨治湖與致富，可以兼得嗎？
無標(biāo)題
每日辟謠|洗頭時5個習(xí)慣，頭發(fā)會越來越少！你有中招嗎？

喜歡該文的人也喜歡更多

熱門閱讀換一換

乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

R語言學(xué)習(xí)——R讀取txt、csv、xls和xlsx格式文件

R語言學(xué)習(xí)——R讀取txt、csv、xls和xlsx格式文件