假設(shè)(hypothesis),又稱統(tǒng)計(jì)假設(shè),是對(duì)總體參數(shù)的具體數(shù)值所作的陳述。假設(shè)檢驗(yàn)(hypothesis test) 是先對(duì)總體參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過(guò)程。 假設(shè)檢驗(yàn)的特點(diǎn)就是采用邏輯上的反證法和依據(jù)統(tǒng)計(jì)上 的小概率原理。小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生,可以不予考慮。在假設(shè)檢驗(yàn)中,我們做出判斷時(shí)所依據(jù)的邏輯是:如果在原假設(shè)正確的前提下,檢驗(yàn)統(tǒng)計(jì)量的樣本觀測(cè)值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)。 假設(shè)檢驗(yàn)步驟一個(gè)完整的假設(shè)檢驗(yàn)過(guò)程,包括以下幾個(gè)步驟: (1)提出假設(shè); (2)構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值; (3)規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則; (4)做出判斷。 假設(shè)檢驗(yàn)的類型(1)對(duì)陳述正確性的檢驗(yàn) 在這種情況下,原假設(shè)通常是基于假定的陳述是正確的。然后建立備擇假設(shè),為拒絕提供統(tǒng)計(jì)證據(jù),從而證明這個(gè)假定的陳述是錯(cuò)誤的。 (2)對(duì)研究性假設(shè)的檢驗(yàn) 在研究性假設(shè)檢驗(yàn)的調(diào)查研究中,應(yīng)該建立原假設(shè)和備擇假設(shè),并用備擇假設(shè)來(lái)表示研究性假設(shè),這樣如果拒絕,將支持樣本所得出的結(jié)論以及應(yīng)該采取某些行動(dòng)。 (3)對(duì)決策情況下的檢驗(yàn) 在決策情況下的檢驗(yàn)研究中,決策者必須從兩種措施中挑選其中一種,無(wú)論是接受還是拒絕,都必須采取一定的措施。 (1)P值規(guī)則 所謂P值,實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(guò)(大于或小于)具體樣本觀測(cè)值的概率。如果P值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立;如果P值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒(méi)有充分的證據(jù)否定原假設(shè)。 (2)臨界值規(guī)則 假設(shè)檢驗(yàn)中,還有另外一種做出結(jié)論的方法:根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,稱作臨界值,直接用檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值與臨界值作比較,觀測(cè)值落在臨界值所劃定的尾部(稱之為拒絕域)內(nèi),便拒絕原假設(shè);觀測(cè)值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內(nèi),則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法,我們稱之為臨界值規(guī)則。 假設(shè)檢驗(yàn)中的兩類錯(cuò)誤·第Ⅰ類錯(cuò)誤 (type Ⅰ error) 又稱棄真錯(cuò)誤,當(dāng)原假設(shè)為真時(shí)拒絕原假設(shè)。犯第Ⅰ類錯(cuò)誤的概率通常記為α 。 ·第Ⅱ類錯(cuò)誤(type Ⅱ error) 又稱取偽錯(cuò)誤,當(dāng)原假設(shè)為假時(shí)沒(méi)有拒絕原假設(shè)。犯第Ⅱ類錯(cuò)誤的概率通常記為β。 在統(tǒng)計(jì)實(shí)踐中,進(jìn)行假設(shè)檢驗(yàn)時(shí)一般先控制第Ⅰ類錯(cuò)誤發(fā)生的概率,并確定犯第Ⅰ類錯(cuò)誤的概率最大值,稱為檢驗(yàn)的顯著性水平。在樣本容量n不變的條件下,犯兩類錯(cuò)誤的概率常常呈現(xiàn)反向的變化,要使α和β 都同時(shí)減小,除非增加樣本的容量。因此,統(tǒng)計(jì)學(xué)家奈曼與皮爾遜提出了一個(gè)原則:即在控制犯第一類錯(cuò)誤的概率情況下,盡量使犯第二類錯(cuò)誤的概率小。 在實(shí)際問(wèn)題中,我們往往把要否定的陳述作為原假設(shè),而把擬采納的陳述本身作為備擇假設(shè),只對(duì)犯第一類錯(cuò)誤的概率加以限制,而不考慮犯第二類錯(cuò)誤的概率。 假設(shè)檢驗(yàn)基本方法檢驗(yàn)形式(1)雙側(cè)檢驗(yàn) 雙側(cè)檢驗(yàn)屬于決策中的假設(shè)檢驗(yàn)。也就是說(shuō),不論是拒絕H0,還是接受H1 ,都必需采取相應(yīng)的行動(dòng)措施。 (2)單側(cè)檢驗(yàn) 單側(cè)檢驗(yàn)又可分兩種形式: a、檢驗(yàn)研究中的假設(shè) 將所研究的假設(shè)作為備擇假設(shè)H1,將認(rèn)為研究結(jié)果是無(wú)效的說(shuō)法或理論作為原假設(shè)H0?;蛘哒f(shuō),把希望(想要)證明的假設(shè)作為備擇假設(shè)。再做這類假設(shè)檢驗(yàn)時(shí)應(yīng)先確立備擇假設(shè)H1。 b、檢驗(yàn)?zāi)稠?xiàng)聲明的有效性 將所作出的說(shuō)明(聲明)作為原假設(shè),對(duì)該說(shuō)明的質(zhì)疑作為備擇假設(shè),在做這類單側(cè)檢驗(yàn)時(shí),應(yīng)先確立原假設(shè)H0。除非我們有證據(jù)表明“聲明”無(wú)效,否則就應(yīng)認(rèn)為該“聲明”是有效的。 以均值為例進(jìn)行如下分析分析,看適合哪種檢驗(yàn)。 以均值差為例進(jìn)行如下分析分析,看適合哪種檢驗(yàn)。 以上就是我總結(jié)的假設(shè)檢驗(yàn)的內(nèi)容,希望能對(duì)你的知識(shí)梳理起到幫助。 |
|
來(lái)自: taotao_2016 > 《概率》