在確定了研究對象的納入、排除標(biāo)準(zhǔn),即劃分好設(shè)計人群后,從總體中抽取研究樣本。抽樣方法的選擇和應(yīng)用非常重要,它決定了我們抽得的樣本對總體代表性的優(yōu)劣,也會影響研究結(jié)果的外推。不少讀者看了研究中的三種人群后,都表示對抽樣方法感興趣。這次我們就來聊聊抽樣方法,由于相關(guān)的內(nèi)容較多,我們分幾期慢慢和大家嘮嘮。這期先講講簡單隨機(jī)抽樣和分層隨機(jī)抽樣。 無論是簡單隨機(jī)抽樣還是分層隨機(jī)抽樣都是較為常見的抽樣方法,都屬于隨機(jī)抽樣的范疇,應(yīng)用這兩種方法獲得的研究對象樣本都對總體有較好的代表性。 簡單隨機(jī)抽樣(simple random sampling)是把符合要求的每一個個體都作為抽樣的對象,通過隨機(jī)化使每個個體被抽中選入樣本的機(jī)會是相等的。由于隨機(jī)化過程可以保證每個個體被抽中入選研究樣本的機(jī)率相同,因此能保證研究樣本對總體的代表性。舉個小例子,假設(shè)符合我們要求的研究對象總體有20000人(這么整,一看就是假滴),我們研究需要從中抽取200人作為研究樣本,如果采用簡單隨機(jī)抽樣的方法來獲得研究樣本,那么總體中每個人被我們抽中的機(jī)率都是1%。因為保證了機(jī)率相等,那么我們可以說我們抽得的樣本是杠杠的好哇! 看到這兒有人會說了,這種抽樣方法看起來很美,但是似乎都是在估計疾病頻率的橫斷面研究里用,我們臨床研究應(yīng)用得很少吧。如果你也深以為然的話,那小編要提醒你,病例-對照設(shè)計的臨床研究中也常會用到這個方法哦。比如,乳腺癌的預(yù)后研究中,如果是病例-對照設(shè)計,我們會先獲得一組乳腺癌發(fā)生了轉(zhuǎn)移的病例,say 100人。當(dāng)然,我們的對照組一定是患乳腺癌但沒有發(fā)生轉(zhuǎn)移的病例,由于目前的乳腺癌預(yù)后還不錯,所以沒有發(fā)生轉(zhuǎn)移的患者很多,我們?nèi)绾螐闹刑暨x代表性好的對照呢?簡單隨機(jī)抽樣啊,我們可以找同期的乳腺癌但沒有發(fā)生轉(zhuǎn)移的患者,從中隨機(jī)抽取100、200甚至400例形成對照組(具體幾例可以根據(jù)研究設(shè)計的需要了,當(dāng)然例數(shù)越多,統(tǒng)計效能越高)。病例-對照研究中,對照組的選擇是最考驗研究者的設(shè)計功力的,對照的代表性常受質(zhì)疑。我們可以在非病例中(在這個研究中是沒有發(fā)生不良結(jié)局的患者中)采用隨機(jī)抽樣的方法獲得有良好代表性的對照。 簡單隨機(jī)抽樣的優(yōu)點是能獲得良好代表性的研究樣本,操作實施也比較容易理解;其缺點是在抽樣范圍較大時,需要對總體中每個研究對象進(jìn)行編號并收集基本信息,工作量太大從而影響研究可行性。另一方面,當(dāng)某一重要研究因素在人群中分布不均勻時,采用簡單隨機(jī)抽樣可能會導(dǎo)致在總體中占比例較少的個體被遺漏,從而導(dǎo)致選擇偏倚。分層抽樣則可以很好地解決這一問題。 分層抽樣(Stratified Sampling)是從分布不均勻的研究人群中抽取有代表性樣本的方法。先按照研究對象的屬性(如年齡、性別、病情、病程、臨床亞型、職業(yè)、教育程度、民族等)將研究人群分為若干層,然后在每層內(nèi)再開展隨機(jī)抽樣。還是借用上面的例子,同樣是乳腺癌預(yù)后的病例-對照研究,乳腺癌的轉(zhuǎn)移與否和病程可能相關(guān),如果僅僅是簡單隨機(jī)抽樣的方法獲得對照組有可能會出現(xiàn)病程短的人比較多(因為病程短的患者出現(xiàn)轉(zhuǎn)移的機(jī)率低),這樣會降低對照組和病例組的可比性。這時我們可以根據(jù)病程分層再隨機(jī)抽樣,先看看我們的病例組中病程5年以下的有多少例,5年以上的有多少例,假設(shè)是2:3好了,那么我們就在乳腺癌沒有轉(zhuǎn)移的患者中根據(jù)病程是否大于5年分層,參考病例組的構(gòu)成在不同的層內(nèi)抽取研究對象構(gòu)成對照組。 一定要注意,分層抽樣要求層內(nèi)變異越小越好,層間變異越大越好,這樣可以提高樣本的代表性,便于層間進(jìn)行比較。分層隨機(jī)抽樣不能保證每個個體被抽中的概率相等,有可能處于不同分層之間的個體被抽中概率是不同的。 |
|
來自: 徒步者的收藏 > 《心理學(xué)》