乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      研究生論文中常用的回歸分析具體方法

       奈何忘川三生石 2018-06-24

      本文主要介紹以下內容:

      • R語言中線性模型lm函數(shù)公式及參數(shù)
      • 一元線性回歸實現(xiàn)與檢驗過程講解lm()函數(shù)
      • R語言中廣義線性模型glm()函數(shù)

      R語言中線性回歸方程擬合函數(shù)lm()

      Lm()是R語言中擬合線性回歸函數(shù)。官方文檔對他的用法解釋是這樣的:

      研究生論文中常用的回歸分析具體方法

      官方文檔用法解釋

      官方文檔參數(shù)比較多,明明同學感覺沒有必要研究那么多,這里明明同學講解最常用的方法即:

      lm(formula, data)

      formula:表示你要擬合的公式,一般有以下幾種

      研究生論文中常用的回歸分析具體方法

      公式中特殊符號表達的含義為:

      研究生論文中常用的回歸分析具體方法

      Data:你要擬合的數(shù)據(jù)集

      下面明明同學以一元線性的例子為大家介紹如何使用R語言做回歸分析(本部分數(shù)據(jù)為UsingR包里面的父親身高和兒子身高數(shù)據(jù))。

      一元線性回歸

      這是最簡單的回歸形式,用于確定兩個變量之間的關系。也就是說,給定一個變量,回歸告訴我另外一個變量的期望值是多少。分析中所形成的這種關系稱為回歸模型,其中以一條直線方程表明兩個變量依存關系的模型叫做一元線性模型也稱為簡單的線性回歸。其主要步驟包括:建立回歸模型、求解回歸模型中的參數(shù)、對回歸模型進行檢驗。

      研究生論文中常用的回歸分析具體方法

      UsingR包里面的父親身高和兒子身高數(shù)據(jù)(單位英尺)

      用ggplot2包的ggplot函數(shù)做散點圖查看數(shù)據(jù)大致趨勢

      研究生論文中常用的回歸分析具體方法

      R語言代碼

      研究生論文中常用的回歸分析具體方法

      父親身高和兒子身高散點圖

      從圖中可以看出數(shù)字大致成直線分布,此時用ggplot2包中的geom_smooth(method='lm')為圖形添加線性回歸直線查看直線位置和走勢。

      研究生論文中常用的回歸分析具體方法

      研究生論文中常用的回歸分析具體方法

      添加回歸模型之后的圖

      到此我們把回歸模型的圖做出來了,但是這個圖并沒有把結果提供給我們,所以我們在R語言中用lm()函數(shù)來實際計算回歸方程。過程如下圖

      研究生論文中常用的回歸分析具體方法

      從圖結果中紅色框框可以看出擬合的模型截距項為33.886,fheight的系數(shù)為0.51409。所以擬合的方程結果為sheight = 0.51409fheight + 33.886。從結果中還可以看出R2為0.2513,F(xiàn)檢驗值為361.2自由度為(1,1076),系數(shù)P檢驗值和模型P檢驗值都小于0.05,于是在α=0.05水平處拒絕H0,接受H1,即本例回歸系數(shù)有統(tǒng)計學意義,兩個變量之間有顯著的回歸關系。

      使用plot(模型擬合結果)查看模型擬合圖

      Q-Q圖

      正態(tài)性當預測變量值固定時,因變量成正態(tài)分布,則殘差值也應該是一個均值為0的正態(tài)分布。正態(tài)Q-Q圖(Normal Q-Q,右上)是在正態(tài)分布對應的值下,標準化殘差的概率圖。若滿足正態(tài)假設,那么圖上的點應該落在呈45度角的直線上;若不是如此,那么就違反了正態(tài)性的假設。

      研究生論文中常用的回歸分析具體方法

      模型Q-Q圖

      殘差圖與擬合圖

      變量之間線性是否好,在'殘差圖與擬合圖'( Residuals vs Fitted)中如果是一條直線說明變量之間線性關系很好。

      研究生論文中常用的回歸分析具體方法

      模型殘差圖與擬合圖

      位置尺度圖

      同方差性若滿足不變方差假設,那么在位置尺度圖(Scale-Location Graph)中,水平線周圍的點應該隨機分布

      研究生論文中常用的回歸分析具體方法

      庫克距離

      用來查看數(shù)據(jù)是否有異常點,一般指有著很大殘差(絕對值)的點,如果對模型的參數(shù)估計值影響出現(xiàn)了比例失衡,那么我們稱之為強影響點。庫克距離能夠查看異常點的分布。

      研究生論文中常用的回歸分析具體方法

      R語言廣義線性模型glm()函數(shù)

      廣義線性模型

      現(xiàn)實生活中并非所有的數(shù)據(jù)都適合用線性回歸模型,像二項分布(真/假)數(shù)據(jù)、計數(shù)數(shù)據(jù)或者其他的數(shù)據(jù)形式都不適合。為了模擬這些類型的數(shù)據(jù)、發(fā)展了廣義線性模型。

      廣義線性模型glm():

      glm(formula , family=gaussian , data,…)

      formula:的寫法可以參考lm()函數(shù),公式寫法是一樣的。

      Family 為分布族,包括正態(tài)分布(gaussian)、二項分布(binomial)、泊松分布(poisson)和伽馬分布(gamma),分布族還可以通過選項Link = 來指定使用的鏈接函數(shù)。

      常用的鏈接函數(shù):

      二項族里有l(wèi)ogit 、probit 、 cauchit 、 log 、 cloglog ;伽馬族有inverse、identify、log;泊松族有l(wèi)og、identify、和sqrt。

      Data 是數(shù)據(jù)框

      實例:

      我們對45名駕駛員調查結果進行如下統(tǒng)計:

      x1 : 表示視力狀況,是一個分類變量,1表示好,0表示有問題;

      x2 : 年齡,數(shù)值型

      x3 : 駕車教育,分類變量 1表示參加過駕車教育 , 0 表示沒有

      y :分類變量 表示去年是否出過事故 , 1表示出過事故 , 0表示沒有

      研究生論文中常用的回歸分析具體方法

      45名駕駛員調查結果

      我們這里考查前三個變量x1 , x2 , x3與發(fā)生事故的關系

      這里用邏輯斯蒂進行回歸擬合

      研究生論文中常用的回歸分析具體方法

      由結果可知,x2 和 x3并沒有通過檢驗,下一步用step()函數(shù),逐步回歸在進行變量的篩選。

      研究生論文中常用的回歸分析具體方法

      研究生論文中常用的回歸分析具體方法

      看出最終只有變量x1入選模型。然后對模型就行預測,即對視力正常的和視力有問題的司機分別作預測,即預測發(fā)生交通事故的概率。

      研究生論文中常用的回歸分析具體方法

      由此可見眼睛有問題的司機的交通事故率是眼睛正常的司機交通事故率的差不多兩倍。


      下次明明同學給大家講解如何在R語言中輕松實現(xiàn)判別分析。

      查看歷史文章學習更多數(shù)據(jù)分析技巧、EXCEL和PPT使用技巧

      有任何問題可以私信明明同學,幫助你解決數(shù)據(jù)分析的難處。

        本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多