存在競爭風(fēng)險的情況下,Kaplan-Meier的方法是不準(zhǔn)確的,因為我們不能假定如果隨訪時間足夠長,受試者將會發(fā)生感興趣的事件。累積發(fā)生率(CIF)是給定事件發(fā)生的子分布,被廣泛應(yīng)用于競爭風(fēng)險分析。 Fine和Gray(1999)提出的分布的比例風(fēng)險模型旨在擬合感興趣事件的累積發(fā)生率。關(guān)于Fine & Gray 模型,可以參考文獻(xiàn):“A Proportional Hazards Model for the Subdistribution of a Competing Risk. Jason P. Fine and Robert J. Gray,Journal of the American Statistical AssociationVol. 94, No. 446 (Jun., 1999), pp. 496-509”. 研究治療方案A和白血病復(fù)發(fā)的關(guān)系,如果患者在去醫(yī)院復(fù)查的路上出車禍意外死亡了,就觀察不到白血病復(fù)發(fā)了,也就是說“車禍死亡” 和“復(fù)發(fā)”存在競爭。這樣的現(xiàn)象在醫(yī)學(xué)研究中,非常常見! 在分析某事件發(fā)生時間時,如果該事件被其他事件阻礙,即存在競爭風(fēng)險。 例如這篇喝咖啡與低死亡風(fēng)險的研究。Association of Coffee Consumption With Total and Cause-Specific Mortality Among Nonwhite Populations. Ann Intern Med, 2017. SCI IF=17.1 ![]() 表4的結(jié)果表明排前10位的死因有心臟病、癌癥、慢性下呼吸道疾病、卒中等。根據(jù)趨勢性檢驗(P for trend)的結(jié)果,發(fā)現(xiàn)跟喝咖啡反向關(guān)系顯著的是心臟病、癌癥、慢性下呼吸道疾病、卒中、糖尿病和腎臟病原因?qū)е碌乃劳?。問題是死亡原因存在競爭關(guān)系,因為突發(fā)卒中死亡的人不太可能因為自殺再死一回。 本研究的作者在統(tǒng)計方法中寫了:考慮到競爭風(fēng)險后分析咖啡和不同原因死亡的關(guān)系,其中不同的死亡原因被認(rèn)為是不同的事件。 分析結(jié)果表明沒有發(fā)現(xiàn)考慮到死因之間的競爭風(fēng)險影響結(jié)果(P=0.92)。相當(dāng)于敏感性分析:做和不做競爭風(fēng)險,得出的兩套結(jié)果對比一下,如果差異不大表明結(jié)果穩(wěn)定。 如何實(shí)現(xiàn)競爭風(fēng)險模型分析呢?SEER數(shù)據(jù)庫又如何做競爭風(fēng)險模型呢? 首選我們需要從SEER數(shù)據(jù)庫下載癌癥臨床數(shù)據(jù),一般可以使用perl提取,或者直接下載SEER*Stat軟件,在進(jìn)行數(shù)據(jù)下載,當(dāng)然下載數(shù)據(jù)之后,我們需要對數(shù)據(jù)進(jìn)行清洗,常見的操作包括刪除數(shù)據(jù)未知的條目,如果需要也可以把SEER多原發(fā)的數(shù)據(jù)提取出來,發(fā)生多原發(fā)的條目給刪除。 ![]() 然后找到我們常見的SEER字段,標(biāo)注出來 ![]() 找到死亡原因和生存狀態(tài)兩列,通過這兩列數(shù)據(jù),我們把死亡原因分為三類——生存,死于癌癥,非癌癥死亡,這樣我們就可以做競爭風(fēng)險模型。 接下來用R包做曲線繪制: ![]() 這樣的話,我們就把SEER數(shù)據(jù)庫的競爭風(fēng)險模型構(gòu)建出來了. |
|