乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      重復(fù)測量ANOVA:你要知道的事兒都在這里啦 | 協(xié)和八

       協(xié)和八 2020-09-18
      說人話的統(tǒng)計(jì)學(xué)

      上一集我們?yōu)榇蠹医榻B了方差分析(ANOVA)的一種特殊技巧,叫做重復(fù)測量ANOVA(repeated-measures ANOVA)。它的功能和成對樣本的 t 檢驗(yàn)相似,是為了比較在同一組個(gè)體上進(jìn)行多次測量(不同時(shí)間點(diǎn)、不同實(shí)驗(yàn)條件等)后,得到的平均值是否有差異。

      從概念上來說,重復(fù)測量 ANOVA 和普通的 ANOVA 并沒有什么兩樣,都是將表示所有數(shù)據(jù)點(diǎn)圍繞全體平均值之間波動情況的總平方和劃分為不同的成分。這些成分有些與我們想考察的因素有關(guān)(常規(guī) ANOVA 中的組間平方和,重復(fù)測量 ANOVA 中的「時(shí)間點(diǎn)間平方和」或「條件間平方和」),而有些無關(guān)(常規(guī) ANOVA 中的組內(nèi)平方和,重復(fù)測量 ANOVA 中的「時(shí)間點(diǎn)內(nèi)/條件內(nèi)平方和」等)。

      重復(fù)測量 ANOVA 的特別之處,就是利用同一個(gè)個(gè)體貢獻(xiàn)了多個(gè)數(shù)據(jù)點(diǎn)這一信息,在總平方和中進(jìn)一步劃出去一個(gè)與個(gè)體本身固有性質(zhì)有關(guān)、而與時(shí)間點(diǎn)或?qū)嶒?yàn)條件無關(guān)的部分,稱之為「個(gè)體間平方和」。這樣一來,最后剩下的、被我們認(rèn)為是誤差的那部分平方和就變小了。上集文末的示意圖(見下圖)說的就是這個(gè)事兒。


      圖1 ANOVA 與重復(fù)測量 ANOVA 原理比較(同上集圖 3)

      說了這些,希望大家不要被這些五花八門的平方和給繞暈了,而忘記了我們的初衷——比較不同分組的平均值是否有差異。

      在開始介紹 ANOVA 時(shí),我們說過,要判斷差異的顯著性,我們需要找出與我們感興趣的因素相關(guān)的、組與組條件與條件間的差異(也就是組間/條件間平方和),把它和由隨機(jī)誤差引起的差異來比較一下。

      直觀上來說,如果前者比后者大得多,我們就有更充分的理由相信,不同組別之間平均值的差異是真實(shí)存在的;反之,我們則不能否定組間無差異的原假設(shè)(戳此處回顧《 ANOVA 在手,多組比較不犯愁》)。

      ????

      討論了這么多原理,現(xiàn)在該是挽起袖子來大干一場的時(shí)候了!

      下面,就讓我們回到上集講過的藍(lán)精靈研究睡眠時(shí)間對做算術(shù)題正確率影響的例子里,看看重復(fù)測量 ANOVA 的具體計(jì)算。

      首先,讓我們來重溫一下這組數(shù)據(jù)——6 只藍(lán)精靈分別在充分休息后體驗(yàn)三種實(shí)驗(yàn)條件(夜間睡眠 3、6、9 小時(shí)),然后做 50 道算術(shù)題,記下每人每個(gè)條件下答對的題數(shù)。以下散點(diǎn)圖就是上集我們見過的那幅,為了大家的方便再次附在這里。而下面的表 1 則是具體的數(shù)值。


      圖 2 三種實(shí)驗(yàn)條件下的算術(shù)測試得分(用顏色標(biāo)注不同個(gè)體,同上集圖 2 )

      表1 三種實(shí)驗(yàn)條件下的算術(shù)測試得分


      3小時(shí)

      6小時(shí)

      9小時(shí)

      各個(gè)體平均值

      綠精靈

      40

      42

      50

      44

      粉精靈

      37

      46

      48

      43.7

      黃精靈

      27

      26

      37

      30

      紅精靈

      25

      30

      42

      32.3

      深藍(lán)精靈

      30

      35

      44

      36.3

      蔚藍(lán)精靈

      26

      27

      28

      27

      各條件平均值

      30.8

      34.3

      41.5

      總平均值:35.6

      有了數(shù)據(jù),現(xiàn)在我們就把那些平方和一個(gè)個(gè)算過來。按照《 ANOVA 在手,多組比較不犯愁》里的方法,條件間平方和(等同于之前的「組間平方和」)就是各實(shí)驗(yàn)條件下的平均值圍繞總平均值的波動,而且還要各自乘以該組的個(gè)體數(shù)量。換言之,我們要找出表 1 里每一列的平均值與總平均值之間差異的加權(quán)平方和:


      而條件內(nèi)平方和(等同于之前的「組內(nèi)平方和」)則是各數(shù)據(jù)點(diǎn)圍繞它們所在的實(shí)驗(yàn)條件下的平均值的波動。和以前一樣,為了清晰起見,我們分別算出每個(gè)條件的平方和,再把它們加起來:


      相信你還記得,在常規(guī)的 ANOVA 里,這個(gè)條件內(nèi)平方和(組內(nèi)平方和)就是誤差平方和,統(tǒng)計(jì)推斷就建立在它與組間平方和的比較上。但是,在重復(fù)測量 ANOVA 里,我們還要從里頭刨掉一塊個(gè)體間平方和,剩下的才是誤差平方和。

      那么,個(gè)體間平方和應(yīng)該怎么算?

      在這一集的開頭以及上一集里,我們都說過,之所以要有個(gè)體間平方和,是因?yàn)槲覀兿胍プ€(gè)體間差異所造成的、而與分組、時(shí)間點(diǎn)或?qū)嶒?yàn)條件無關(guān)的數(shù)據(jù)波動。

      在上面這個(gè)例子里,說的就是不同藍(lán)精靈本身算術(shù)水平的差異,而這個(gè)差異是在不同的實(shí)驗(yàn)條件下都穩(wěn)定存在的。要注意,我們并不是說藍(lán)精靈解算術(shù)題的表現(xiàn)不受實(shí)驗(yàn)條件的影響,而是說我們能測量到的解題得分里,既體現(xiàn)了不同藍(lán)精靈自身水平的差異,也體現(xiàn)了睡眠時(shí)間的作用。既然說,個(gè)體間的差異在不同的實(shí)驗(yàn)條件下都穩(wěn)定存在,那么我們可以把三個(gè)實(shí)驗(yàn)條件合并起來取個(gè)平均。也就是說,表 1 最右邊的一列「各個(gè)體平均值」就代表了這六位藍(lán)精靈本身的算術(shù)水平,因而我們算出它們圍繞總平均值的波動,就是個(gè)體間平方和了。同樣,考慮到實(shí)驗(yàn)條件的數(shù)量,我們還得像以前那樣,給平方和乘上實(shí)驗(yàn)條件的個(gè)數(shù)作為加權(quán):


      對比這個(gè)式子和前面計(jì)算條件間平方和的算式,你會發(fā)現(xiàn)它們非常相似。其實(shí),我們可以把「個(gè)體」作為另一種條件或者實(shí)驗(yàn)分組,個(gè)體間平方和只不過是這一條件圍繞總平均值波動的大小而已。

      有了個(gè)體間平方和,我們已經(jīng)把這個(gè)樣本里變異性的兩個(gè)系統(tǒng)性的來源(實(shí)驗(yàn)條件造成的差異和個(gè)體本身的差異)都考慮到了。在沒有其他額外信息的情況下,還剩下的數(shù)據(jù)變異性就只能認(rèn)為是隨機(jī)誤差導(dǎo)致的了。因而,要得到誤差平方和,我們只需求出條件間平方和與個(gè)體間平方和之差:


      所以,對于這一組數(shù)據(jù),如果我們沒有利用實(shí)驗(yàn)設(shè)計(jì)中重復(fù)測量的優(yōu)勢,把它當(dāng)成三組互相獨(dú)立的數(shù)據(jù),就會認(rèn)為誤差平方和有 855.7 那么多。但在重復(fù)測量的條件下,其實(shí)在 855.7 里面,有 756.4 是由個(gè)體差異造成的,在這個(gè)條件下,我們認(rèn)為總平方和里只有 99.3 來自誤差。

      熟習(xí) ANOVA 心法的你一定知道,ANOVA 的本質(zhì)就是組間/條件間變異性和隨機(jī)誤差之間的比較。誤差平方和小了,組間/條件間平方和與之相比就更大了。

      ????

      這是否意味著重復(fù)測量 ANOVA 得到的顯著性一定就比常規(guī) ANOVA 更大( p 值更?。┠??多數(shù)情況下是的(比如我們上集提到過對于藍(lán)精靈這組數(shù)據(jù)的結(jié)果),但也并不絕對。

      為什么?原因在于,當(dāng)我們利用平方和進(jìn)行統(tǒng)計(jì)推斷時(shí),并不是簡單地看組間/條件間平方和與誤差平方和之間的比例,還需要有一些稍微有點(diǎn)煩人的技術(shù)細(xì)節(jié)。

      在《 ANOVA的基本招式你掌握了嗎?》里,我們介紹過,在常規(guī)的 ANOVA 中,要得到 p 值,我們要利用組間平方和與組內(nèi)平方和構(gòu)建這么一個(gè) F 統(tǒng)計(jì)量


      其中,n 為樣本量(所有各組中數(shù)據(jù)點(diǎn)個(gè)數(shù)的總和),s 為組數(shù)。在前面的例子里,n 為 18,s 為 3。

      在數(shù)據(jù)滿足一定假設(shè)條件(見《 ANOVA的基本招式你掌握了嗎?》的前提下,如果原假設(shè)為真(各組平均值之間沒有差異),這個(gè) F 統(tǒng)計(jì)量會服從自由度為(s-1, n-s)的 F 分布。要得到 p 值,只需要找出在這個(gè)分布之下,F(xiàn) 統(tǒng)計(jì)量取到比根據(jù)數(shù)據(jù)算出的 F 更大的數(shù)值的概率(各組平均值相互差異越大,組間和組內(nèi)平方和的比值就越大,在原假設(shè)下的概率就越?。?,這事咱們就交給統(tǒng)計(jì)學(xué)軟件包辦了。

      重復(fù)測量 ANOVA 呢?道理都是一樣的,關(guān)鍵就在于條件間平方和與誤差平方和之間孰大孰小。基于和之前同樣的原因,我們需要對條件個(gè)體的數(shù)量進(jìn)行校正,因此在 F 統(tǒng)計(jì)量中,兩個(gè)平方和底下也要除以兩個(gè)自由度


      其中,s 和之前一樣,為分組(實(shí)驗(yàn)條件)數(shù),而 m 為不同個(gè)體的數(shù)量。在前面的例子里,s 為 3,而 m 為 6 。要從 F 統(tǒng)計(jì)量算出 p 值,我們同樣需要數(shù)據(jù)滿足一定的假設(shè)(稍后會具體介紹),這時(shí)如果原假設(shè)為真,那么 F 統(tǒng)計(jì)量將服從自由度為 ( s-1,(s-1)(m-1)) 的 F 分布。

      比較兩個(gè) F 統(tǒng)計(jì)量的式子,對于同一組數(shù)據(jù),分子是一樣的,區(qū)別主要在分母上。一方面,經(jīng)過我們前面的介紹和計(jì)算示例,重復(fù)測量 ANOVA 的誤差平方和會比常規(guī) ANOVA 的組內(nèi)平方和??;另一方面,重復(fù)測量 ANOVA 里 (s-1)(m-1) 又會比常規(guī) ANOVA 的 (n-s) ?。ㄏ胂肟礊槭裁??提示一下,n 能夠用 m 和 s 怎樣表示?)。最后,自由度為 (s-1,n-s) 的 F 分布的形狀又會和自由度為 (s-1,(s-1)(m-1)) 的 F 分布有所不同——后者因?yàn)榈诙€(gè)自由度小,整個(gè)趨向正無窮的尾巴會更高一些,因而同樣的 F 統(tǒng)計(jì)量對應(yīng)的 p 值會大一些。讀著有點(diǎn)兒暈?沒關(guān)系,只需要知道這些因素?cái)嚭驮谝黄?,重?fù)測量 ANOVA 并不一定總是功效比常規(guī) ANOVA 更高,還得靠具體數(shù)據(jù)說話。

      需要強(qiáng)調(diào)的是,我們今天對兩種 ANOVA 的比較,是從幫助大家理解兩者異同的角度出發(fā)的,并不是說實(shí)際使用時(shí)能夠隨意選擇,更不意味著可以哪個(gè)算出來 p 值小就用哪個(gè)正如我們反復(fù)強(qiáng)調(diào)過的,選擇哪種 ANOVA,決定因素只能是實(shí)驗(yàn)設(shè)計(jì):數(shù)據(jù)來自幾組互不相關(guān)的個(gè)體,就應(yīng)當(dāng)使用普通的 ANOVA;數(shù)據(jù)來自對同一組個(gè)體在不同條件下的多次測量,就應(yīng)當(dāng)使用重復(fù)測量 ANOVA;如果兩者皆有,那么就需要用到以后再為大家介紹的更復(fù)雜的混合設(shè)計(jì) ANOVA一類的方法。

      ????

      在這集的最后,讓我們來簡單談?wù)勚貜?fù)測量 ANOVA 需要滿足哪些假設(shè): 

      ? 與普通 ANOVA 相同,各分組或條件中的各數(shù)據(jù)點(diǎn)需要服從或近似服從正態(tài)分布,而且各個(gè)體互相獨(dú)立(比方說,在藍(lán)精靈這個(gè)例子里,如果蔚藍(lán)精靈和深藍(lán)精靈是孿生兄弟,而其他藍(lán)精靈互相都沒有血緣關(guān)系,這樣就不獨(dú)立了)。在這里,我們以前介紹過的檢驗(yàn)正態(tài)性的方法(如 Shapiro-Wilk 檢驗(yàn)),還有將非正態(tài)數(shù)據(jù)轉(zhuǎn)化為接近正態(tài)數(shù)據(jù)的技巧,就都可以派上用場了。

      ? 重復(fù)測量 ANOVA 有一個(gè)特殊的假設(shè),就是要求所有條件間來自同一個(gè)體的兩兩數(shù)據(jù)點(diǎn)之差的方差(variance)相等。這個(gè)假設(shè)有個(gè)專門的術(shù)語,稱為球面性(sphericity)。大家可以參看下面的表2:在我們的例子里,球面性要求的是 3 小時(shí)減 6 小時(shí)、3 小時(shí)減 9 小時(shí)、6 小時(shí)減 9 小時(shí)這三組差值的方差相等。

      表 2 重復(fù)測量 ANOVA 中的球面性假設(shè)


      3小時(shí)

      6小時(shí)

      9小時(shí)

      3小時(shí)-6小時(shí)

      3小時(shí)-9小時(shí)

      6小時(shí)-9小時(shí)

      綠精靈

      40

      42

      50

      -2

      -10

      -8

      粉精靈

      37

      46

      48

      -9

      -11

      -2

      黃精靈

      27

      26

      37

      1

      -10

      -11

      紅精靈

      25

      30

      42

      -5

      -17

      -12

      深藍(lán)精靈

      30

      35

      44

      -5

      -14

      -9

      蔚藍(lán)精靈

      26

      27

      28

      -1

      -2

      -1

      方差


      12.7

      25.5

      21.4

      這樣一個(gè)假設(shè)是哪兒冒出來的?咱們可以從兩個(gè)角度來理解。

      首先,如果大家還記得常規(guī) ANOVA 的假設(shè)(回顧《 ANOVA 的基本招式你掌握了嗎?》),里頭也有一個(gè)(各組數(shù)據(jù))等方差性的要求,這里的球面性只不過是重復(fù)測量情形下的特殊形式罷了。那么為什么要求各條件中兩兩數(shù)據(jù)點(diǎn)之差的方差相等呢?回想一下,重復(fù)測量 ANOVA 是成對樣本 t 檢驗(yàn)的一種延伸,而成對樣本 t 檢驗(yàn)表面上有兩組數(shù)據(jù),實(shí)際的對象卻是兩組數(shù)據(jù)對應(yīng)數(shù)據(jù)點(diǎn)的差值。在重復(fù)檢驗(yàn) ANOVA 中也是一樣的——它實(shí)際上關(guān)心的并非各條件的數(shù)據(jù)本身,而是在 s 個(gè)條件中兩兩組合的差值。

      從上面的表 2 中,這三組差值的方差看起來似乎相差不小。怎樣才能知道球面性假設(shè)是否成立?和正態(tài)性檢驗(yàn)類似,有一個(gè)專門的統(tǒng)計(jì)學(xué)檢驗(yàn),稱為 Mauchly 氏球面性檢驗(yàn)(Mauchly’s Test of Sphericity),它是各大統(tǒng)計(jì)學(xué)軟件在重復(fù)測量 ANOVA 功能中的默認(rèn)標(biāo)配。這個(gè)檢驗(yàn)的原假設(shè)是「重復(fù)測量數(shù)據(jù)具有球面性」,因此當(dāng)該檢驗(yàn)的 p 值小于 0.05 時(shí),我們認(rèn)為數(shù)據(jù)違背了球面性假設(shè); p 值大于 0.05 時(shí),我們則認(rèn)為球面性得到了滿足。

      如果數(shù)據(jù)不滿足球面性,那么我們需要對 F 統(tǒng)計(jì)量的自由度進(jìn)行修正,最常用的修正方法是 Greenhouse-Geisser 校正(Greenhouse-Geisser correction)。在 SPSS 及其他統(tǒng)計(jì)學(xué)軟件中,我們只需根據(jù) Mauchly 氏球面性檢驗(yàn)的結(jié)果讀取相應(yīng)的 F 檢驗(yàn)結(jié)果報(bào)告即可。當(dāng)然,寫論文的時(shí)候也別忘了把選用的校正方法以及修正后的自由度寫清楚哦!

      五年執(zhí)醫(yī) 三年模擬

      精選每日一題

      更多精選題可回顧歷史推送文末

      題目來源:臨床執(zhí)業(yè)醫(yī)師資格考試往屆真題

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多