小編按 經(jīng)過了這么多集的學(xué)習(xí),相信大家已經(jīng)對(duì) t 檢驗(yàn)了如指掌了吧!今天就由田菊師姐教我們?nèi)绾蚊枋?t 檢驗(yàn)結(jié)果~ 講了這么多集關(guān)于 t 檢驗(yàn)的知識(shí),相信你們對(duì)統(tǒng)計(jì)檢驗(yàn)有了更深入的了解,再也不會(huì)被輕易地被一些不靠譜的結(jié)果糊弄住了。 另外一方面,學(xué)習(xí)統(tǒng)計(jì)檢驗(yàn)的原理也是為了能在我們自己寫論文的時(shí)候準(zhǔn)確地描述實(shí)驗(yàn)結(jié)果。如果不能把辛辛苦苦搜集來(lái)的實(shí)驗(yàn)數(shù)據(jù)清晰地表達(dá)出來(lái),導(dǎo)致自己的結(jié)論不能很快地被讀者理解,真對(duì)不起自己花那么多的時(shí)間做實(shí)驗(yàn)。 描述 t 檢驗(yàn)的結(jié)果可以通過文字列出關(guān)鍵數(shù)據(jù),也可以通過做圖來(lái)表示;前者更準(zhǔn)確,后者更直觀,通常會(huì)兩者結(jié)合。 我們從下面的例子開始我們的統(tǒng)計(jì)「八股文」之路。 用單樣本 t 檢驗(yàn)對(duì)比了格格巫包子的重量與標(biāo)準(zhǔn)包子重量(50g)的區(qū)別,發(fā)現(xiàn)格格巫包子的重量(平均值=45g,標(biāo)準(zhǔn)差=3g,95% 置信區(qū)間 [ 43.8g,46.2g ] )與標(biāo)準(zhǔn)值 50g 有顯著區(qū)別( t (25)=4.2, p < 0.001=""> 從例子我們可以看到,總結(jié) t 檢驗(yàn)的結(jié)果首先要說(shuō)明到底做了什么類型的檢驗(yàn)(單樣本 t 檢驗(yàn),成對(duì)樣本的 t 檢驗(yàn),還是獨(dú)立樣本的 t 檢驗(yàn);如果搞不清楚可以參考《就是要實(shí)用!t 檢驗(yàn)的七十二變》)。 光說(shuō)明檢驗(yàn)類型還不夠,還要說(shuō)清楚數(shù)據(jù)到底是針對(duì)什么的測(cè)量,如果是對(duì)比兩組數(shù)據(jù),最好說(shuō)清楚每一組具體的實(shí)驗(yàn)條件。 說(shuō)明檢驗(yàn)的背景之后,就可以總結(jié)結(jié)果了。 首先可以通過數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差來(lái)簡(jiǎn)單描述一下數(shù)據(jù),最好還能像例子里面一樣加上 95% 置信區(qū)間,這樣可以方便讀者判斷效應(yīng)大小,效應(yīng)的概念可以參考《只講 p 值,不講效應(yīng)大小,都是耍流氓!》。通過平均值和標(biāo)準(zhǔn)差以及對(duì)比的標(biāo)準(zhǔn)值,對(duì)結(jié)論感興趣的讀者可以直接估算出衡量效應(yīng)大小的 Cohen 氏 d 值。當(dāng)然,我們也可以直接給出該結(jié)果。 下一步根據(jù) p 值的大小來(lái)判斷是否有顯著性區(qū)別,通常 p 值小于 0.05,拒絕原假設(shè),認(rèn)為數(shù)據(jù)與標(biāo)準(zhǔn)值有顯著區(qū)別或者實(shí)驗(yàn)組數(shù)據(jù)與對(duì)照組數(shù)據(jù)有著顯著區(qū)別。 t 檢驗(yàn)的結(jié)果除了要給出 p 值,通常也會(huì)給出 t 統(tǒng)計(jì)量以及自由度(在單樣本情況下是等于樣本量減 1,在獨(dú)立樣本且兩個(gè)樣本方差相等的情況下等于總樣本量減 2)。根據(jù)我們之前在《想玩轉(zhuǎn)t檢驗(yàn)?你得從這一篇看起》講過的,有了自由度,t 統(tǒng)計(jì)量的分布就能確定,結(jié)合樣本給出的 t 統(tǒng)計(jì)量大小其實(shí)就可以計(jì)算出精確的 p 值。 因?yàn)?p 值的具體數(shù)值對(duì)結(jié)論并不是很重要,所以在論文里面一般只給出 p 值的范圍即可。通常會(huì)把 p 值在分為四個(gè)區(qū)間:p<0.001,>0.001,><0.01,>0.01,><0.05,p>0.05。注意后一個(gè)區(qū)間并不包含前一個(gè),例如 p=0.00005 的情況會(huì)寫作 p<0.001 而不會(huì)寫作="">0.001><> 有一個(gè)例外是如果 p 值接近顯著性的臨界值,比如 p=0.045 的情況,最好還是寫出 p 的具體數(shù)值而不是 p<> 不過話說(shuō)回來(lái),如果看到很接近 0.05 的 p 值,讀者難免會(huì)懷疑結(jié)果的真實(shí)性。所以遇到這種模棱兩可的 p 值,最好還是再重復(fù)兩次試驗(yàn)驗(yàn)證一下,得到的結(jié)果會(huì)更可信。 對(duì)于我們需要在統(tǒng)計(jì)結(jié)果報(bào)告中給出的這些數(shù)字,一般的統(tǒng)計(jì)軟件都會(huì)自動(dòng)輸出,只需將它們按照前面例子里的格式寫出。不同的雜志對(duì)統(tǒng)計(jì)結(jié)果的格式會(huì)有不同的要求,投稿前要記得檢查一下雜志的具體要求,或者翻一下雜志近期發(fā)表的文章。 我們可以看到,在論文里面描述結(jié)果其實(shí)非常簡(jiǎn)單,甚至不需要對(duì) t 檢驗(yàn)有什么深入的認(rèn)識(shí),那為什么我們要寫前面那么多期的文章來(lái)講解原理呢? 學(xué)會(huì)原理,我們才能選用最適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn),并理解這些統(tǒng)計(jì)結(jié)果的準(zhǔn)確含義,同時(shí)更好的解讀自己的結(jié)果和他人的結(jié)果,做起科研來(lái)也會(huì)更有信心。 除了用文字描述數(shù)據(jù),做圖往往也很重要?,F(xiàn)在很多讀者(甚至審稿人 )在看文獻(xiàn)的時(shí)候并沒有時(shí)間仔細(xì)地閱讀文字,而是直接掃一眼圖表。所以用圖表清晰地表現(xiàn)結(jié)果就至關(guān)重要了。 好的圖要直白,清晰,并且盡可能地包含多的信息。 表達(dá)同樣的一組數(shù)據(jù),我們可以用散點(diǎn)圖標(biāo)出所有的數(shù)據(jù)點(diǎn),也可以用箱線圖表示中位數(shù)、四分位數(shù)以及極端值(箱線圖具體可以參考《數(shù)據(jù)到手了,第一件事先干啥?》),或者用簡(jiǎn)單的柱狀圖(高度代表數(shù)據(jù)平均值,一般還用誤差線標(biāo)記樣本的標(biāo)準(zhǔn)差),見下圖的例子。 不難看出,從信息量的角度,散點(diǎn)圖>箱線圖>柱狀圖。因?yàn)樯Ⅻc(diǎn)圖包含了數(shù)據(jù)的所有信息,箱線圖可以大概表現(xiàn)出數(shù)據(jù)的分布,包括偏態(tài)和異常值的信息,而柱狀圖的信息只有平均值和標(biāo)準(zhǔn)差,并沒有提供比文字更多的信息。 當(dāng)然,也不是信息量越多的圖越好,當(dāng)數(shù)據(jù)點(diǎn)比較多(幾十個(gè)或以上時(shí)),點(diǎn)會(huì)開始重合,變成難以辨認(rèn)的一團(tuán)黑點(diǎn),這樣反而不能清晰地展示結(jié)果,這時(shí)用箱線圖會(huì)比較好。 雖然箱線圖比柱狀圖信息更多,但目前很多發(fā)表的論文都傾向于用柱狀圖。為了阻止這一歪風(fēng)邪氣蔓延,現(xiàn)在不少學(xué)術(shù)雜志已經(jīng)開始規(guī)定用箱線圖或者散點(diǎn)圖代替簡(jiǎn)單的柱狀圖。 說(shuō)實(shí)話我還真沒想出來(lái)什么情況下柱狀圖會(huì)比箱線圖更合適。假如出于某些原因一定用柱狀圖,不要忘了標(biāo)清楚柱狀圖的誤差線是標(biāo)準(zhǔn)差( standard deviation, 縮寫為 sd 或者 std ),還是測(cè)量標(biāo)準(zhǔn)誤差(standard error of the mean,縮寫 se 或者 sem )。后者是前者除以 √n,這里 n 是樣本量,所以測(cè)量標(biāo)準(zhǔn)誤差比較小。咱們讀文獻(xiàn)的時(shí)候也要看清楚了,不要誤把測(cè)量標(biāo)準(zhǔn)誤當(dāng)作標(biāo)準(zhǔn)差。 如果是成對(duì)樣本 t 檢驗(yàn)的情形,用散點(diǎn)圖還可以清晰地展現(xiàn)每一對(duì)數(shù)據(jù)是否都一致地增加或者減少。 假設(shè)我們想知道 30 周的小鼠是不是比 20 周的更重,于是測(cè)量了 7 只小鼠在這兩個(gè)時(shí)間點(diǎn)的體重,由于對(duì)每個(gè)樣本測(cè)量了兩個(gè)值進(jìn)行比較,所以這里的數(shù)據(jù)是成對(duì)數(shù)據(jù)。 在下圖中,B-D 這三個(gè)是用散點(diǎn)圖展現(xiàn)了三種不同的假想情況下的數(shù)據(jù), 左欄數(shù)據(jù)點(diǎn)代表小鼠 20 周體重,右欄數(shù)據(jù)代表 30 周體重,一條線連接的數(shù)據(jù)點(diǎn)都是成對(duì)樣本,來(lái)自同一只小鼠。
A 為柱狀圖(誤差線為測(cè)量標(biāo)準(zhǔn)誤差),B-D 為散點(diǎn)圖(B:每一對(duì)都上升;C:有些上升,有些下降,D:某幾個(gè)值上升很多,其它沒有太大變化),注意 B-D 組數(shù)據(jù)都對(duì)應(yīng) A 的柱狀圖。 不難看到,在 B 中,所有小鼠的體重都有所增長(zhǎng);在 C 中,有些小鼠體重增長(zhǎng),而另一些小鼠卻「為伊消得人憔悴」了;而在 D 中,一些小鼠體重增長(zhǎng),另一些小鼠則體重基本保持不變。顯然,這三種情形非常不一樣,但如果我們用柱狀圖來(lái)描繪這群小鼠在兩個(gè)時(shí)間點(diǎn)的平均體重和標(biāo)準(zhǔn)誤差,我們將會(huì)得到完全一樣的柱狀圖(即 A 中所示)! 這說(shuō)明了不同的成對(duì)數(shù)據(jù)可以有相似的柱狀圖,用散點(diǎn)圖不但可以反映數(shù)據(jù)點(diǎn)真實(shí)趨勢(shì),而且可以突出成對(duì)對(duì)比,體現(xiàn)出到底有多少對(duì)數(shù)據(jù)支持結(jié)論。B 圖的數(shù)據(jù)顯然比 C 和 D 圖更強(qiáng)烈地支持小鼠 30 周的體重大于 20 周的體重這一結(jié)論。 最后,統(tǒng)計(jì)顯著性也常常會(huì)用星星(*)在圖上表示。通常 *** 表示 p<0.001,** 表示="">0.001,**><><0.01,* 表示="">0.01,*><><0.05,對(duì)于 p="">0.05 的情況,通??梢詷?biāo)注為 n.s 或者 p>0.05,如下圖所示。 圖片來(lái)源 http://www./neuron/abstract/S0896-6273(15)00722-9 ***表示 p<0.001,n.s>0.001,n.s>紅色為實(shí)驗(yàn)組,黑色為對(duì)照組。 難怪周圍有些小伙伴們會(huì)視星星如生命。但是希望一直關(guān)注「說(shuō)人話的統(tǒng)計(jì)學(xué)」的讀者們不要唯星星是從,畢竟一個(gè)結(jié)果是否有意義還要看效應(yīng)大小。 回復(fù)「統(tǒng)計(jì)學(xué)」可查看「說(shuō)人話的統(tǒng)計(jì)學(xué)」系列合輯, 或點(diǎn)擊下方標(biāo)題可閱讀本系列全部文章 >> 干貨 做統(tǒng)計(jì),多少數(shù)據(jù)才算夠?(上) 做統(tǒng)計(jì),多少數(shù)據(jù)才算夠?(下) 提升統(tǒng)計(jì)功效,讓評(píng)審心服口服! 見識(shí)數(shù)據(jù)分析的「獨(dú)孤九劍」 只有15個(gè)標(biāo)本,也能指望 t 檢驗(yàn)嗎? 樣本分布不正態(tài)?數(shù)據(jù)變換來(lái)救場(chǎng)! 數(shù)據(jù)變換的萬(wàn)能鑰匙:Box-Cox變換 t 檢驗(yàn)用不了?別慌,還有神奇的非參數(shù)檢驗(yàn) >>> 自檢 媽媽說(shuō)答對(duì)的童鞋才能中獎(jiǎng) 統(tǒng)計(jì)學(xué)的十個(gè)誤區(qū),你答對(duì)了嗎? >>> 番外篇 說(shuō)人話的統(tǒng)計(jì)學(xué):一份遲來(lái)的邀請(qǐng) 精選每日一題 更多精選題可回顧歷史推送文末 題目來(lái)源:考研西醫(yī)綜合全真模擬試卷 本期主播:保健藥酒 作者:田菊 |
|