上一集我們?yōu)榇蠹医榻B了方差分析(ANOVA)的一種特殊技巧,叫做重復(fù)測量ANOVA(repeated-measures ANOVA)。它的功能和成對樣本的 t 檢驗(yàn)相似,是為了比較在同一組個(gè)體上進(jìn)行多次測量(不同時(shí)間點(diǎn)、不同實(shí)驗(yàn)條件等)后,得到的平均值是否有差異。 從概念上來說,重復(fù)測量 ANOVA 和普通的 ANOVA 并沒有什么兩樣,都是將表示所有數(shù)據(jù)點(diǎn)圍繞全體平均值之間波動情況的總平方和劃分為不同的成分。這些成分有些與我們想考察的因素有關(guān)(常規(guī) ANOVA 中的組間平方和,重復(fù)測量 ANOVA 中的「時(shí)間點(diǎn)間平方和」或「條件間平方和」),而有些無關(guān)(常規(guī) ANOVA 中的組內(nèi)平方和,重復(fù)測量 ANOVA 中的「時(shí)間點(diǎn)內(nèi)/條件內(nèi)平方和」等)。 重復(fù)測量 ANOVA 的特別之處,就是利用同一個(gè)個(gè)體貢獻(xiàn)了多個(gè)數(shù)據(jù)點(diǎn)這一信息,在總平方和中進(jìn)一步劃出去一個(gè)與個(gè)體本身固有性質(zhì)有關(guān)、而與時(shí)間點(diǎn)或?qū)嶒?yàn)條件無關(guān)的部分,稱之為「個(gè)體間平方和」。這樣一來,最后剩下的、被我們認(rèn)為是誤差的那部分平方和就變小了。上集文末的示意圖(見下圖)說的就是這個(gè)事兒。
說了這些,希望大家不要被這些五花八門的平方和給繞暈了,而忘記了我們的初衷——比較不同分組的平均值是否有差異。 在開始介紹 ANOVA 時(shí),我們說過,要判斷差異的顯著性,我們需要找出與我們感興趣的因素相關(guān)的、組與組或條件與條件間的差異(也就是組間/條件間平方和),把它和由隨機(jī)誤差引起的差異來比較一下。 直觀上來說,如果前者比后者大得多,我們就有更充分的理由相信,不同組別之間平均值的差異是真實(shí)存在的;反之,我們則不能否定組間無差異的原假設(shè)(戳此處回顧《 ANOVA 在手,多組比較不犯愁》)。 ???? 討論了這么多原理,現(xiàn)在該是挽起袖子來大干一場的時(shí)候了! 下面,就讓我們回到上集講過的藍(lán)精靈研究睡眠時(shí)間對做算術(shù)題正確率影響的例子里,看看重復(fù)測量 ANOVA 的具體計(jì)算。 首先,讓我們來重溫一下這組數(shù)據(jù)——6 只藍(lán)精靈分別在充分休息后體驗(yàn)三種實(shí)驗(yàn)條件(夜間睡眠 3、6、9 小時(shí)),然后做 50 道算術(shù)題,記下每人每個(gè)條件下答對的題數(shù)。以下散點(diǎn)圖就是上集我們見過的那幅,為了大家的方便再次附在這里。而下面的表 1 則是具體的數(shù)值。
表1 三種實(shí)驗(yàn)條件下的算術(shù)測試得分
有了數(shù)據(jù),現(xiàn)在我們就把那些平方和一個(gè)個(gè)算過來。按照《 ANOVA 在手,多組比較不犯愁》里的方法,條件間平方和(等同于之前的「組間平方和」)就是各實(shí)驗(yàn)條件下的平均值圍繞總平均值的波動,而且還要各自乘以該組的個(gè)體數(shù)量。換言之,我們要找出表 1 里每一列的平均值與總平均值之間差異的加權(quán)平方和:
那么,個(gè)體間平方和應(yīng)該怎么算? 在這一集的開頭以及上一集里,我們都說過,之所以要有個(gè)體間平方和,是因?yàn)槲覀兿胍プ€(gè)體間差異所造成的、而與分組、時(shí)間點(diǎn)或?qū)嶒?yàn)條件無關(guān)的數(shù)據(jù)波動。 在上面這個(gè)例子里,說的就是不同藍(lán)精靈本身算術(shù)水平的差異,而這個(gè)差異是在不同的實(shí)驗(yàn)條件下都穩(wěn)定存在的。要注意,我們并不是說藍(lán)精靈解算術(shù)題的表現(xiàn)不受實(shí)驗(yàn)條件的影響,而是說我們能測量到的解題得分里,既體現(xiàn)了不同藍(lán)精靈自身水平的差異,也體現(xiàn)了睡眠時(shí)間的作用。既然說,個(gè)體間的差異在不同的實(shí)驗(yàn)條件下都穩(wěn)定存在,那么我們可以把三個(gè)實(shí)驗(yàn)條件合并起來取個(gè)平均。也就是說,表 1 最右邊的一列「各個(gè)體平均值」就代表了這六位藍(lán)精靈本身的算術(shù)水平,因而我們算出它們圍繞總平均值的波動,就是個(gè)體間平方和了。同樣,考慮到實(shí)驗(yàn)條件的數(shù)量,我們還得像以前那樣,給平方和乘上實(shí)驗(yàn)條件的個(gè)數(shù)作為加權(quán):
有了個(gè)體間平方和,我們已經(jīng)把這個(gè)樣本里變異性的兩個(gè)系統(tǒng)性的來源(實(shí)驗(yàn)條件造成的差異和個(gè)體本身的差異)都考慮到了。在沒有其他額外信息的情況下,還剩下的數(shù)據(jù)變異性就只能認(rèn)為是隨機(jī)誤差導(dǎo)致的了。因而,要得到誤差平方和,我們只需求出條件間平方和與個(gè)體間平方和之差:
熟習(xí) ANOVA 心法的你一定知道,ANOVA 的本質(zhì)就是組間/條件間變異性和隨機(jī)誤差之間的比較。誤差平方和小了,組間/條件間平方和與之相比就更大了。 ???? 這是否意味著重復(fù)測量 ANOVA 得到的顯著性一定就比常規(guī) ANOVA 更大( p 值更?。┠??多數(shù)情況下是的(比如我們上集提到過對于藍(lán)精靈這組數(shù)據(jù)的結(jié)果),但也并不絕對。 為什么?原因在于,當(dāng)我們利用平方和進(jìn)行統(tǒng)計(jì)推斷時(shí),并不是簡單地看組間/條件間平方和與誤差平方和之間的比例,還需要有一些稍微有點(diǎn)煩人的技術(shù)細(xì)節(jié)。 在《 ANOVA的基本招式你掌握了嗎?》里,我們介紹過,在常規(guī)的 ANOVA 中,要得到 p 值,我們要利用組間平方和與組內(nèi)平方和構(gòu)建這么一個(gè) F 統(tǒng)計(jì)量:
在數(shù)據(jù)滿足一定假設(shè)條件(見《 ANOVA的基本招式你掌握了嗎?》的前提下,如果原假設(shè)為真(各組平均值之間沒有差異),這個(gè) F 統(tǒng)計(jì)量會服從自由度為(s-1, n-s)的 F 分布。要得到 p 值,只需要找出在這個(gè)分布之下,F(xiàn) 統(tǒng)計(jì)量取到比根據(jù)數(shù)據(jù)算出的 F 更大的數(shù)值的概率(各組平均值相互差異越大,組間和組內(nèi)平方和的比值就越大,在原假設(shè)下的概率就越?。?,這事咱們就交給統(tǒng)計(jì)學(xué)軟件包辦了。 重復(fù)測量 ANOVA 呢?道理都是一樣的,關(guān)鍵就在于條件間平方和與誤差平方和之間孰大孰小。基于和之前同樣的原因,我們需要對條件和個(gè)體的數(shù)量進(jìn)行校正,因此在 F 統(tǒng)計(jì)量中,兩個(gè)平方和底下也要除以兩個(gè)自由度:
比較兩個(gè) F 統(tǒng)計(jì)量的式子,對于同一組數(shù)據(jù),分子是一樣的,區(qū)別主要在分母上。一方面,經(jīng)過我們前面的介紹和計(jì)算示例,重復(fù)測量 ANOVA 的誤差平方和會比常規(guī) ANOVA 的組內(nèi)平方和??;另一方面,重復(fù)測量 ANOVA 里 (s-1)(m-1) 又會比常規(guī) ANOVA 的 (n-s) ?。ㄏ胂肟礊槭裁??提示一下,n 能夠用 m 和 s 怎樣表示?)。最后,自由度為 (s-1,n-s) 的 F 分布的形狀又會和自由度為 (s-1,(s-1)(m-1)) 的 F 分布有所不同——后者因?yàn)榈诙€(gè)自由度小,整個(gè)趨向正無窮的尾巴會更高一些,因而同樣的 F 統(tǒng)計(jì)量對應(yīng)的 p 值會大一些。讀著有點(diǎn)兒暈?沒關(guān)系,只需要知道這些因素?cái)嚭驮谝黄?,重?fù)測量 ANOVA 并不一定總是功效比常規(guī) ANOVA 更高,還得靠具體數(shù)據(jù)說話。 需要強(qiáng)調(diào)的是,我們今天對兩種 ANOVA 的比較,是從幫助大家理解兩者異同的角度出發(fā)的,并不是說實(shí)際使用時(shí)能夠隨意選擇,更不意味著可以哪個(gè)算出來 p 值小就用哪個(gè)。正如我們反復(fù)強(qiáng)調(diào)過的,選擇哪種 ANOVA,決定因素只能是實(shí)驗(yàn)設(shè)計(jì):數(shù)據(jù)來自幾組互不相關(guān)的個(gè)體,就應(yīng)當(dāng)使用普通的 ANOVA;數(shù)據(jù)來自對同一組個(gè)體在不同條件下的多次測量,就應(yīng)當(dāng)使用重復(fù)測量 ANOVA;如果兩者皆有,那么就需要用到以后再為大家介紹的更復(fù)雜的混合設(shè)計(jì) ANOVA一類的方法。 ???? 在這集的最后,讓我們來簡單談?wù)勚貜?fù)測量 ANOVA 需要滿足哪些假設(shè): ? 與普通 ANOVA 相同,各分組或條件中的各數(shù)據(jù)點(diǎn)需要服從或近似服從正態(tài)分布,而且各個(gè)體互相獨(dú)立(比方說,在藍(lán)精靈這個(gè)例子里,如果蔚藍(lán)精靈和深藍(lán)精靈是孿生兄弟,而其他藍(lán)精靈互相都沒有血緣關(guān)系,這樣就不獨(dú)立了)。在這里,我們以前介紹過的檢驗(yàn)正態(tài)性的方法(如 Shapiro-Wilk 檢驗(yàn)),還有將非正態(tài)數(shù)據(jù)轉(zhuǎn)化為接近正態(tài)數(shù)據(jù)的技巧,就都可以派上用場了。 ? 重復(fù)測量 ANOVA 有一個(gè)特殊的假設(shè),就是要求所有條件間來自同一個(gè)體的兩兩數(shù)據(jù)點(diǎn)之差的方差(variance)相等。這個(gè)假設(shè)有個(gè)專門的術(shù)語,稱為球面性(sphericity)。大家可以參看下面的表2:在我們的例子里,球面性要求的是 3 小時(shí)減 6 小時(shí)、3 小時(shí)減 9 小時(shí)、6 小時(shí)減 9 小時(shí)這三組差值的方差相等。 表 2 重復(fù)測量 ANOVA 中的球面性假設(shè)
這樣一個(gè)假設(shè)是哪兒冒出來的?咱們可以從兩個(gè)角度來理解。 首先,如果大家還記得常規(guī) ANOVA 的假設(shè)(回顧《 ANOVA 的基本招式你掌握了嗎?》),里頭也有一個(gè)(各組數(shù)據(jù))等方差性的要求,這里的球面性只不過是重復(fù)測量情形下的特殊形式罷了。那么為什么要求各條件中兩兩數(shù)據(jù)點(diǎn)之差的方差相等呢?回想一下,重復(fù)測量 ANOVA 是成對樣本 t 檢驗(yàn)的一種延伸,而成對樣本 t 檢驗(yàn)表面上有兩組數(shù)據(jù),實(shí)際的對象卻是兩組數(shù)據(jù)對應(yīng)數(shù)據(jù)點(diǎn)的差值。在重復(fù)檢驗(yàn) ANOVA 中也是一樣的——它實(shí)際上關(guān)心的并非各條件的數(shù)據(jù)本身,而是在 s 個(gè)條件中兩兩組合的差值。 從上面的表 2 中,這三組差值的方差看起來似乎相差不小。怎樣才能知道球面性假設(shè)是否成立?和正態(tài)性檢驗(yàn)類似,有一個(gè)專門的統(tǒng)計(jì)學(xué)檢驗(yàn),稱為 Mauchly 氏球面性檢驗(yàn)(Mauchly’s Test of Sphericity),它是各大統(tǒng)計(jì)學(xué)軟件在重復(fù)測量 ANOVA 功能中的默認(rèn)標(biāo)配。這個(gè)檢驗(yàn)的原假設(shè)是「重復(fù)測量數(shù)據(jù)具有球面性」,因此當(dāng)該檢驗(yàn)的 p 值小于 0.05 時(shí),我們認(rèn)為數(shù)據(jù)違背了球面性假設(shè); p 值大于 0.05 時(shí),我們則認(rèn)為球面性得到了滿足。 如果數(shù)據(jù)不滿足球面性,那么我們需要對 F 統(tǒng)計(jì)量的自由度進(jìn)行修正,最常用的修正方法是 Greenhouse-Geisser 校正(Greenhouse-Geisser correction)。在 SPSS 及其他統(tǒng)計(jì)學(xué)軟件中,我們只需根據(jù) Mauchly 氏球面性檢驗(yàn)的結(jié)果讀取相應(yīng)的 F 檢驗(yàn)結(jié)果報(bào)告即可。當(dāng)然,寫論文的時(shí)候也別忘了把選用的校正方法以及修正后的自由度寫清楚哦! 精選每日一題 更多精選題可回顧歷史推送文末 題目來源:臨床執(zhí)業(yè)醫(yī)師資格考試往屆真題 |
|