復(fù)習(xí)統(tǒng)計心理學(xué)的時候比如標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤師兄說:今天我們就簡單的聊聊標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤,希望你對這個概念不再迷糊。 標(biāo)準(zhǔn)差是最常用的統(tǒng)計量,它主要用來說明一個變量的觀察值之間有何不同。標(biāo)準(zhǔn)差說明了觀察值與平均值相差多遠(yuǎn)(如下圖,觀察值用X表示,標(biāo)準(zhǔn)差就是這些觀察值的離散程度/變異程度)。 從上圖可以得知,如果觀察值X離平均值越遠(yuǎn),則標(biāo)準(zhǔn)差越大。標(biāo)準(zhǔn)差的最小值是0,這時數(shù)據(jù)集的各個觀察值一樣大。但是在實際中數(shù)據(jù)大部分都是分散的,所以標(biāo)準(zhǔn)差的值可大可小,而且沒有最大值。統(tǒng)計分析中的一個主要準(zhǔn)則是如果我們對事物進行第二次測量,則通常得到不同的結(jié)果。比如我們統(tǒng)計抄襲家的年齡,在抄襲家們平均年齡的數(shù)據(jù)中,一個抄襲家是19歲,另一個是28歲,等等。如果我們注意到這個變量的所有觀察值,我們可以發(fā)現(xiàn)大部分觀察值都彼此不同,標(biāo)準(zhǔn)差告訴我們,這些不同的程度有多大。例如一組抄襲家的年齡分別為:19、21、28、28、32 通過標(biāo)準(zhǔn)差,我們可以計算出抄襲家年齡的離散程度。 如果在抄襲家年齡的數(shù)據(jù)集中,30個抄襲家是一個樣本。這個樣本的均值是28歲。假設(shè)我們選擇的是另外一組30個新娘的隨機樣本,并且觀測他們的年齡。再次做同樣的實驗,我們一定會得到年齡的不同的均值。重復(fù)多次這個實驗,我們一定會得到多個不同的均值,這個和上文在一次研究中個體的觀測值通常是不同的一樣,對不同的樣本,樣本均值通常也是不同的。重復(fù)研究產(chǎn)生的各均值的差異是多大呢?他們是否比個體觀測的差異小或相同呢?例如:一起抽取了甲乙丙丁四個樣本的抄襲家,每個樣本有30個抄襲家。 甲樣本抄襲家的年齡分別為:20、22、21、28、28、32.. 乙樣本抄襲家的年齡分別為:15、22、21、20、21、32.. 解決上面的問題最簡單的方法就是找到所有均值的標(biāo)準(zhǔn)差,各均值只是一行數(shù)字,就像30個原始觀察值一樣,所以對不同變量找不同樣本的均值的標(biāo)準(zhǔn)差與找一個變量的原始觀察值的標(biāo)準(zhǔn)差沒有什么區(qū)別。或者說唯一的區(qū)別就是,找均值的標(biāo)準(zhǔn)差,我們需要先將每一個樣本的均值計算出來。因此有時我們處理樣本原始觀察值的標(biāo)準(zhǔn)差,有時我們處理從原始觀察中得到的一列數(shù)字的標(biāo)準(zhǔn)差,例如均值。為了區(qū)別這兩種標(biāo)準(zhǔn)差,由原始觀察值算出的叫做標(biāo)準(zhǔn)差( standard deviation),由一組均值算出的叫做標(biāo)準(zhǔn)誤差(standard error)。《Statistics: The Conceptual Approach》Authors: Iversen, Gudmund R., Gergen, Mary均值的標(biāo)準(zhǔn)誤比觀察值的標(biāo)準(zhǔn)差小還是大?為什么? 
|