歡迎來到醫(yī)科研,這里是白介素2的讀書筆記,跟我一起聊臨床與科研的故事, 生物醫(yī)學(xué)數(shù)據(jù)挖掘,R語言,TCGA、GEO,SEER數(shù)據(jù)挖掘。 SEER數(shù)據(jù)的內(nèi)容完善SEER數(shù)據(jù) 為所有原發(fā)侵襲性癌和其他某些診斷(例如原位癌)收集的數(shù)據(jù)包括診斷日期和人口統(tǒng)計變量,例如診斷時的年齡,性別,種族/民族和居住的縣。從健康記錄中提取與第一療程有關(guān)的手術(shù)管理和/或放射治療數(shù)據(jù);
癌癥數(shù)據(jù)每年更新一次,以獲取生存狀態(tài),生存時間和死亡原因等信息。SEER最初的7個癌癥登記中心的隨訪時間現(xiàn)已超過40年。生存狀態(tài)通過與 National Death Index 鏈接以及通過醫(yī)療記錄摘要獲得的最近一次已知聯(lián)系的日期的補充數(shù)據(jù)來確認。SEER被認為是美國和全球癌癥注冊機構(gòu)中數(shù)據(jù)質(zhì)量的黃金標準。通過與地區(qū)注冊機構(gòu)的合同協(xié)議來保證質(zhì)量,并且在傳輸數(shù)據(jù)之前必須滿足SEER的標準 SEER數(shù)據(jù)的開放SEER允許不受限制地訪問SEER網(wǎng)站www.seer.cancer.gov,SEER數(shù)據(jù)的復(fù)制和獲取無需經(jīng)過許可。癌癥統(tǒng)計資料審查(Cancer Statistic Review)”選項以易于理解的文字,圖表和圖形提供所有癌癥和特定部位癌癥的摘要信息。除了癌癥數(shù)據(jù)集外,SEER中的其他數(shù)據(jù)集還有SEER地區(qū)的標準人口數(shù)據(jù),美國死亡率數(shù)據(jù)以及與人口普查區(qū)域社會經(jīng)濟狀況索引或縣屬性相關(guān)聯(lián)的美國人口數(shù)據(jù)。這些數(shù)據(jù)可用于與SEER癌癥數(shù)據(jù)進行匹配分析。除此以外 SEER數(shù)據(jù)還與其它數(shù)據(jù)庫鏈接以支持更深層次的研究挖掘。包括:Medicare, Medicare Health Outcomes Survey (SEER-MHOS), National Longitudinal Mortality Study (NLMS), 以及鏈接的生物樣本。 劃重點:SEER提供專門用于提取分析數(shù)據(jù)的軟件:包括SEER * Stat,SEER PREP,JointPoint,Health Disparities Calculator。只需要填寫申請表格申請下即可免費使用所有數(shù)據(jù)庫和軟件,附上表格的鏈接(www.seer.cancer.gov/data/access_seer_data.pdf)。 SEER生物樣本試點計劃SEER非常重視病理材料的可用性,以進行免疫組織化學(xué)(IHC)檢測和二代代測序等分析。RTR和最新提出的VTR是近期的試點計劃,旨在擴大各種癌癥病例的病理學(xué)材料的“生物儲備”,并將組織鏈接(注釋)到完整的SEER數(shù)據(jù)集9。RTR維護來自3個癌癥登記機構(gòu)(愛荷華州,夏威夷和洛杉磯)的組織,并且由福爾馬林固定石蠟包埋的組織塊在所有特定部位的癌癥上組成。到2010年已檢測的癌組織數(shù)量達到141,241,最大的四個癌癥組是肺癌,結(jié)腸癌/直腸癌,乳腺癌和前列腺癌。研究人員可以通過提交在線申請(www.seer.cancer.gov/biospecimen/application.html)并提供擬進行的研究的簡要摘要,來訪問基于人群的資料,也可以使用某些癌癥的組織微陣列數(shù)據(jù),例如乳腺癌,卵巢癌和結(jié)腸/直腸癌。 VTR是一個試點項目,涉及7個SEER注冊管理機構(gòu)。最初的試點旨在提供有關(guān)成本和最佳實踐的信息,以將該過程擴展到更大的SEER注冊中心。它將專門探討存活至少5年的胰腺導(dǎo)管腺癌患者和在短時間內(nèi)死于癌癥的局部淋巴結(jié)陰性女性乳腺癌患者。病例將與具有更典型生存模式的對照相匹配,并將基于邏輯回歸模型中確定的腫瘤和人口統(tǒng)計學(xué)特征。最初的試點項目將定義基于人群的生物樣本采集的最佳實踐。將收集定制的注釋信息,包括合并癥,詳細的化療,復(fù)發(fā)時間和結(jié)果。實驗室調(diào)查將收集有關(guān)組織位置,檢索成本以及將不明身份的數(shù)據(jù)提供給研究人員的要求的信息。試點項目還將探索獲取材料的最佳實踐,以及與數(shù)字圖像和病理學(xué)檢查的聯(lián)系。目標是擴大未來的VTR,以支持當前廣泛的癌癥研究問題。 |
|