乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      R語(yǔ)言基礎(chǔ)入門之五:簡(jiǎn)單線性回歸 | Public Library of Bioinformatics

       勤悅軒 2015-09-11

      線性回歸可能是數(shù)據(jù)分析中最為常用的工具了,如果你認(rèn)為手上的數(shù)據(jù)存在著線性定量關(guān)系,不妨先畫個(gè)散點(diǎn)圖觀察一下,然后用線性回歸加以分析。下面簡(jiǎn)單介紹一下如何在R中進(jìn)行線性回歸。

      一、回歸建模

      我們利用R語(yǔ)言中內(nèi)置的trees數(shù)據(jù),其中包含了Volume(體積)、Girth(樹圍)、Height(樹高)這三個(gè)變量,我們希望以體積為因變量,樹圍為自變量進(jìn)行線性回歸。

      1plot(Volume~Girth,data=trees,pch=16,col='red')
      2model=lm(Volume~Girth,data=trees)
      3abline(model,lty=2)
      4summary(model)

      首先繪制了兩變量的散點(diǎn)圖,然后用lm函數(shù)建立線性回歸模型,并將回歸直線加在原圖上,最后用summary將模型結(jié)果進(jìn)行了展示,從變量P值和F統(tǒng)計(jì)量可得回歸模型是顯著的。但截距項(xiàng)不應(yīng)該為負(fù)數(shù),所以也可以用下面方法將截距強(qiáng)制為0。

      1model2=lm(Volume~Girth-1,data=trees)

      二、模型診斷

      在模型建立后會(huì)利用各種方式來(lái)檢驗(yàn)?zāi)P偷恼_性,對(duì)殘差進(jìn)行分析是常見(jiàn)的方法,下面我們來(lái)生成四種用于模型診斷的圖形。

      1par(mfrow=c(2,2))
      2plot(model)
      3par(mfrow=c(1,1))
      Rplot2

      這里左上圖是殘差對(duì)擬合值作圖,整體呈現(xiàn)出一種先下降后下升的模式,顯示殘差中可能還存在未提煉出來(lái)的影響因素。右上圖殘差QQ圖,用以觀察殘差是否符合正態(tài)分布。左下圖是標(biāo)準(zhǔn)化殘差對(duì)擬合值,用于判斷模型殘差是否等方差。右下圖是標(biāo)準(zhǔn)化殘差對(duì)杠桿值,虛線表示的cooks距離等高線。我們發(fā)現(xiàn)31號(hào)樣本有較大的影響。

      三、變量變換

      因?yàn)?1號(hào)樣本有著高影響力,為了降低其影響,一種方法就是將變量進(jìn)行開(kāi)方變換來(lái)改善回歸結(jié)果,從殘差標(biāo)準(zhǔn)誤到殘差圖,各項(xiàng)觀察都說(shuō)明變換是有效的。

      1plot(sqrt(Volume)~Girth,data=trees,pch=16,col='red')
      2model2=lm(sqrt(Volume)~Girth,data=trees)
      3abline(model2,lty=2)
      4summary(model2)

      四、模型預(yù)測(cè)

      下面根據(jù)上述模型計(jì)算預(yù)測(cè)值以及置信區(qū)間,predict函數(shù)可以獲得模型的預(yù)測(cè)值,加入?yún)?shù)可以得到預(yù)測(cè)區(qū)間

      1plot(sqrt(Volume)~Girth,data=trees,pch=16,col='red')
      2model2=lm(sqrt(Volume)~Girth,data=trees)
      3data.pre=data.frame(predict(model2,interval='prediction'))
      4lines(data.pre$lwr~trees$Girth,col='blue',lty=2)
      5lines(data.pre$upr~trees$Girth,col='blue',lty=2)
      Rplot011

      我們還可以將樹圍和樹高都加入到模型中去,進(jìn)行多元回歸。如果要考慮的變量很多,可以用step函數(shù)進(jìn)行變量篩選,它是以AIC作為評(píng)價(jià)指標(biāo)來(lái)判斷一個(gè)變量是否應(yīng)該加入模型,建議使用這種自動(dòng)判斷函數(shù)時(shí)要謹(jǐn)慎。對(duì)于嵌套模型,還可以使用anova建立方差分析表來(lái)比較模型。對(duì)于變量變換的形式,則可以使用MASS擴(kuò)展包中的boxcox函數(shù)來(lái)進(jìn)行COX變換。
      本文來(lái)自:http://www./lang/chinese/546

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多