——全面詳實(shí)的DIA數(shù)據(jù)提交指南 作者按:本文基于2018年截至11月的Molecular & Cellular Proteomics 對DIA數(shù)據(jù)提交的意見稿,并針對Spectronaut用戶進(jìn)行專門說明。第一部分為手稿提交時(shí)對文章材料方法部分撰寫的要求及參考示例,第二部分為數(shù)據(jù)上傳公共存儲平臺的操作流程(以ProteomeExchange的聯(lián)盟網(wǎng)站,中國國家蛋白中心建立的iProX數(shù)據(jù)庫為例)。 1. 材料方法撰寫要求 1.1 實(shí)驗(yàn)部分 1.1.1 實(shí)驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)描述: 作者必須在實(shí)驗(yàn)方法部分添加一個subsection標(biāo)題命名為 “Experimental Design and Statistical Rationale”. 該部分必須明確注明以下信息: 1)樣品的數(shù)量和類型; 2)用于分析和結(jié)果中展示的樣本數(shù)量; 3)該實(shí)驗(yàn)所包含的技術(shù)重復(fù)生物學(xué)重復(fù)以及過程重復(fù)的數(shù)目,如果沒有設(shè)置任何重復(fù),需明確給出該結(jié)果可被接受的理由; 4)樣本數(shù)目及重復(fù)數(shù)目設(shè)置的合理性; 5)是否采用了標(biāo)準(zhǔn)肽段或蛋白矯正保留時(shí)間; 6)樣本采集順序隨機(jī)化的方法; 7)是否建立真實(shí)譜圖庫,建庫采用的樣本的數(shù)量和類型(包括是否設(shè)置生物學(xué)重復(fù)/技術(shù)重復(fù)); 8)描述數(shù)據(jù)處理和統(tǒng)計(jì)學(xué)分析所采用的算法或者程序。需完整描述采用或者引用用于后續(xù)數(shù)據(jù)統(tǒng)計(jì)分析的方法并闡述采用該方法的合理性。 示例: Experimental Design and Statistical Rationale Two group tissue samples (e.g. liver, brain) were selected, and each group is represented by nine biological replicates. Nine individuals per group also permits sufficient sample size for standard statistical tests such as two-way ANOVA and PCA and so on, because the variation between technical replicates in DIA is less than the difference between biological replicates (technical error is ~1/3 of biological error [1]). For library generation by DDA, all 18 samples were pooled as a mixture and fractionated by high pH separation with 10 fractions. And all 18 samples were processed by DIA individually to assess theproteome differences. MS1 and MS2 data were all acquired, and samples acquisition by random order. The iRT kit (Ki3002, Biognosys AG, Switzerland) was added to all of the samples to calibrate the retention time of extracted peptide peaks. The statistical analysis of the DIA dataset was performed by Spectronaut X (Biognosys AG, Switzerland) including data normalization and relative protein quantification. After Student’s t-Test, different expressed proteins were filtered if their Qvalue <0.05 and="" absolute="" avg="" log2="" ratio="">0.58. Reference: [1] Williams, E.G., et al., Systems proteomics of liver mitochondria function. Science, 2016. 352(6291): p. aad0189. 1.2 數(shù)據(jù)采集 DIA數(shù)據(jù)采集的方法有很多種,作者需要給出其認(rèn)為有利于評估此檢測結(jié)果的所有參數(shù),包括: 1)是否采集了MS1數(shù)據(jù)及掃描范圍; 2)是否進(jìn)行了分級,如果分級那么分級相關(guān)的參數(shù),窗口的數(shù)目,是否設(shè)置了重疊窗口以及循環(huán)時(shí)間等。 示例: DIA data acquisition Data-independent Acquistion (DIA): The peptides were re-dissolved in solvent A (A: 0.1% formic acid in water) and analyzed by on-line nanospray LC-MS/MS on an Orbitrap Q Exactive HF coupled to EASY-nLC 1200 system (Thermo Fisher Scientific, MA, USA). 3 μL peptide sample was loaded to analytical column (Acclaim PepMap C18, 75 μm x 25 cm) and separated with 120 min gradient, from 5% to 35% B (B: 0.1% formic acid in ACN). The column flow rate was maintained at 200 nL/min. The electrospray voltage of 2 kV versus the inlet of the mass spectrometer was used. The mass spectrometer was run under data independent acquisition mode, and automatically switched between MS and MS/MS mode. The full scan was performed between 350–1,600 m/z at 60,000 resolution. The automatic gain control target for the MS scan was set to 3e6 and the maximum injection time was 20 ms. The MS/MS scan was performed at 30,000 resolution (automatic gain control target of 1e6 and auto for injection time. The collision energy was 27, and stepped collision energy was 5%. DIA was performed with variable Isolation window, and each window overlapped 1 m/z, and the window number is 42, total cycle time is 3s. DIA Raw Data analysis Raw Data of DIA were processed and analyzed by Spectronaut X (Biognosys AG, Switzerland) with default settings, Retention time prediction type was set to dynamic iRT. Decoy generation was set to mutated which similar to scrambled but will only apply a random number of AA position swamps (min=2, max=length/2). Interference correction on MS2 level was enabled. The false discovery rate (FDR) was set to 1% at peptide level. After Student’s t-Test, different expressed proteins were filtered if their Qvalue <0.05 and="" absolute="" avg="" log2="" ratio="">0.58. The DIA raw data and the results reported at protein level as well as peptide level is available at iPROX(or supplement) 1.3 DIA數(shù)據(jù)的分析方法 DIA數(shù)據(jù)的分析大致可以分為兩種策略;一種是試圖將肽與單個譜圖(以譜圖為中心,Spectrum-Centric)匹配,另一種是試圖檢測數(shù)據(jù)文件中某個給定的肽(以肽為中心,Peptide-Centric)。對于兩種策略,都可以匹配蛋白質(zhì)數(shù)據(jù)庫或譜圖庫,但是大多數(shù)以譜圖為中心的分析查詢蛋白質(zhì)數(shù)據(jù)庫而以肽為中心的方法主要使用譜圖庫。下面就根據(jù)不同的分析策略分別進(jìn)行指導(dǎo),有些工作可能使用這兩種方法的組合,在這種情況下,這兩套指導(dǎo)方針都是適用的。 1.3.1 Spectrum-Centric策略進(jìn)行的DIA分析 (1)峰列表(peak list)生成: a.說明用于創(chuàng)建峰列表的方法和/或程序(包括版本號和/或日期)。 b.列舉創(chuàng)建此峰列表時(shí)使用的參數(shù),特別是可能影響后續(xù)數(shù)據(jù)庫搜索質(zhì)量的任何處理。例如平滑、信噪比閾值,帶電荷狀態(tài)或去同位素峰,去多重累積,肽的不同電荷狀態(tài)(m/z或者漂移分離)對產(chǎn)物離子譜的相對貢獻(xiàn)。 c.描述在峰列表文件中是如何分配離子的保留/漂移時(shí)間和強(qiáng)度的。 d.說明一個檢測到的碎片離子可以包含的母離子峰的最大數(shù)量。 e.如果在創(chuàng)建峰列表時(shí)執(zhí)行了額外的自定義處理,例如聚類或過濾,則應(yīng)引用所采用的方法和/或程序(包括版本號)。 f.搜索引擎:必須提供用于數(shù)據(jù)庫搜索的所有程序的名稱和版本(或發(fā)布日期)。 g.序列數(shù)據(jù)庫或譜圖庫:必須列出所使用的所有序列數(shù)據(jù)庫或譜圖庫的名稱和版本(或發(fā)布日期)。如果是自建的序列數(shù)據(jù)庫或者譜圖庫,則必須完整的描述序列或者譜圖的來源以及用于建庫的軟件。必須說明從每個序列數(shù)據(jù)庫或者譜圖庫中搜索到的實(shí)際條目數(shù)。如果使用的數(shù)據(jù)庫或譜圖庫非常小(<> h.酶特異性:必須完整描述酶切過程所采用的所有蛋白酶種類,包括漏切的數(shù)量和非特異性酶切(如semi-tryptic),必須列出。 i.固定修飾:所有修飾的列表(包括特異性殘基)。 j.可變修飾: 所有修飾的列表(包括特異性殘基)。如果沒有指定固定或可變的修飾,也須說明。 k.母離子及碎片離子的質(zhì)量容差(如果是自定義設(shè)置的需要說明這一點(diǎn);一些軟件會自動確定這一點(diǎn))。 l.已知污染物排除:所有鑒定出的污染物的譜峰是否被排除(或是否這些碎片離子被應(yīng)用到校準(zhǔn)過程)。 m.閾值評分/期望值:被用于譜圖鑒定的標(biāo)準(zhǔn)以及理由需明確陳述。 n.肽段、蛋白質(zhì)鑒定的錯誤發(fā)現(xiàn)率(FDR)和批處理水平:對于大規(guī)模實(shí)驗(yàn),任何能用來評價(jià)數(shù)據(jù)鑒定準(zhǔn)確性的額外的統(tǒng)計(jì)分析結(jié)果,或錯誤發(fā)現(xiàn)率的計(jì)算,如反庫檢索結(jié)果或其他計(jì)算方法的結(jié)果需進(jìn)行描述。 示例: Peak List Generation Spectronaut X (Biognosys AG, Switzerland) with default settings was used to generate a peak list by the database of swissprot homo sapiens 201803. Trypsin was assumed as the digestion enzyme. Missed Cleavages was set to 2, and the decoy database was generated by reversed sequence. Carbamidomethyl (C) was specified as the fixed modification. Oxidation (M) and Acetyl(Protein N-term) was specified as the variable modifications. Kernel Density Estimator was performed to calculate the Pvalue, because it usually provides the best fit for estimating null-distribution Pvalues. Qvalue (FDR) cutoff on precursor and protein level was applied 1%. Remove the peptide if there are not at least 3 fragment ions, and kept best 6 fragments per peptide. All selected fragment ions passing the filters are used for quantification. The average top 3 filtered peptides which passed the 1% Qvalue cutoff were used to calculate the major group quantities. 34,767 precursors, 26,538 peptides, 3,758 proteins and 3,650 protein groups were searched. After Student’s t-Test, different expressed proteins were filtered if their Qvalue <0.05 and="" absolute="" avg="" log2="" ratio="">0.58. The database and reports are available on iPROX (or supplement) (項(xiàng)目號) 1.3.2 Peptide-Centric 策略的DIA分析 譜圖庫: 對于所有譜圖庫,必須報(bào)告譜圖的數(shù)量和它們所覆蓋的蛋白質(zhì)的數(shù)量(target和Decoy)。對于較小的庫(小于1000個條目),必須提供合理的理由。 (1)譜圖庫的建立是否作為本研究的一部分: a.如果從DDA數(shù)據(jù)創(chuàng)建譜圖庫,則DDA MS/MS的創(chuàng)建過程必須完整。 b.用于建庫的軟件 (包括版本號) c.多個譜圖可以被一個肽段使用的標(biāo)準(zhǔn); d.如果一個譜圖被添加到譜圖庫中,選擇的標(biāo)準(zhǔn)是什么,例如最佳評分,最可信的修飾位點(diǎn)。 e.如果譜圖庫中創(chuàng)建了合成譜圖,那么合并譜圖所采用的參數(shù)也需要說明 f.是否只有一個肽段用于創(chuàng)建庫,即是否去除未修飾或修飾的肽段 g.某些峰(如前體離子)是否從譜圖庫中刪除 h.譜峰是否卡了閾值(例如最低信噪比,每張譜圖最大的譜峰數(shù)目) i.計(jì)算的得出的譜圖庫中每個條目的FDR值;包括計(jì)算方法。分析結(jié)果是否整合了多種算法的分析結(jié)果,如果是,那么是使用的什么軟件/方法來進(jìn)行FDR的控制的。 (2)如果使用的是公開的譜圖庫: a.庫的版本號。提供文獻(xiàn)引文。 b.數(shù)據(jù)庫可以獲得/下載的位置。 c.被額外利用的數(shù)據(jù)庫中的圖譜元數(shù)據(jù)有哪些;例如保留時(shí)間,離子遷移率。 d.是否對庫進(jìn)行進(jìn)一步處理;例如進(jìn)一步參數(shù)調(diào)整;峰閾值修改。 (3)如果使用的是預(yù)測的譜圖庫: a.用于建庫的軟件(包括版本號) b.建庫的參數(shù)包括(如蛋白質(zhì)序列的來源;酶特異性假定;包括哪些修飾;肽段長度/質(zhì)量范圍等)。 c.如果譜圖庫存在Decoy庫: d.有多少Decoy條目(相對于target條目的比例) e.如何分配這些Decoy蛋白(允許蛋白質(zhì)水平的FDR估計(jì))? f.Decoy蛋白的譜圖是如何產(chǎn)生的? g.利用譜圖庫進(jìn)行數(shù)據(jù)庫檢索: h.用于peptide-centric分析的軟件的名稱和版本號 i.是否采集母離子? ○如果是,母離子信息是如何使用的? ○母離子匹配的質(zhì)量容差是多少? j.保留時(shí)間或離子遷移率是否用來輔助定性? ○如果是,如何進(jìn)行的;例如是否利用了預(yù)測時(shí)間/移動的窗口? ○利用什么方法來進(jìn)行保留時(shí)間的對齊,或者描述用來評估保留時(shí)間重現(xiàn)性的方法。 k.色譜峰的形狀是否作為一個參數(shù)用于結(jié)果評分?如果是,怎么做的? l.有多少質(zhì)譜峰被用于識別一個肽段?(對于某些軟件,這可能是一個范圍) ○這些譜峰挑選的標(biāo)準(zhǔn)是什么;例如,在譜圖庫中的相對強(qiáng)度,必須大于某一分子量;必須在一定的質(zhì)量范圍內(nèi)等 m.搜庫時(shí)碎片離子的質(zhì)量容差。 n.如果是修飾位點(diǎn)的鑒定,用于判斷修飾位點(diǎn)可靠性的方法 o.肽段、蛋白質(zhì)鑒定的錯誤發(fā)現(xiàn)率(FDR)和批處理水平:對于大規(guī)模實(shí)驗(yàn),任何能用來評價(jià)數(shù)據(jù)鑒定準(zhǔn)確性的額外的統(tǒng)計(jì)分析結(jié)果,或錯誤發(fā)現(xiàn)率的計(jì)算,如反庫檢索結(jié)果或其他計(jì)算方法的結(jié)果需進(jìn)行描述。 示例: Library Generation Data-dependent Acquistion (DDA): The peptide mixture was re-dissovled in the buffer A (buffer A: 20 mM ammonium formate in water, pH 10.0, adjusted with ammonium hydroxide), and then fractionated by high pH separation using Ultimate 3000 system (ThermoFisher scientific, MA, USA) connected to a reverse phase column (XBridge C18 column, 4.6 mm x 250 mm, 5 μm, (Waters Corporation, MA, USA)). High pH separation was performed using a linear gradient, starting from 5% B to 45% B in 40 min (B: 20mM ammonium formate in 80% ACN, pH 10.0, adjusted with ammonium hydroxide). The column was re-equilibrated at the initial condition for 15 min. The column flow rate was maintained at 1 mL/min and the column temperature was maintained at 30℃. Ten fractions were collected; each fraction was dried in a vacuum concentrator. And then peptides were re-dissolved in 0.5% formic acid in 5% ACN) and analyzed by on-line nanospray LC-MS/MS on an Orbitrap Q Exactive HF coupled to EASY-nLC 1200 system (Thermo Fisher Scientific, MA, USA). 3 μL peptide sample was loaded to analytical column (Acclaim PepMap C18, 75 μm x 25 cm) and separated with 120 min gradient, from 5% to 35% B (B: 0.1% formic acid in 80% ACN). The column flow rate was maintained at 200 nL/min. The electrospray voltage of 2 kV versus the inlet of the mass spectrometer was used. The mass spectrometer was run under data dependent acquisition mode, and automatically switched between MS and MS/MS mode. The full scan was performed between 350–1,600 m/z at 60,000 resolution. The automatic gain control target for the MS scan was set to 3e6 and the maximum injection time was 50 ms. The dynamic exclusion was set to 30 s. The MS/MS scan was performed at 15,000 resolution (automatic gain control target of 5e5 and 60 ms maximum injection time. The collision energy was 30. Spectral Library generation: Raw Data of DDA were processed and analyzed by Spectronaut X (Biognosys AG, Switzerland) with default settings to generate an initial target list, which contained 34,767 precursors, 26,538 peptides, 3,758 proteins and 3,650 protein group. Spectronaut was set up to search the database of swissprot homo sapiens 201803 assuming trypsin as the digestion enzyme. Carbamidomethyl (C) was specified as the fixed modification. Oxidation (M) was specified as the variable modifications. Qvalue (FDR) cutoff on precursor and protein level was applied 1%. The complete assay library including all relevant metadata is available at iPROX (or supplement) 1.4 結(jié)果部分 1.4.1 肽和蛋白質(zhì)報(bào)告(見Spectronaut 導(dǎo)出的Report列表) 根據(jù)研究的重點(diǎn),結(jié)果可能在肽段或蛋白水平上得到最適當(dāng)?shù)恼故?。必須提供一份結(jié)果列表,可以放在原稿中,或者如果結(jié)果文件很大,也可以作為補(bǔ)充材料隨原稿一起提交給雜志。 對于蛋白質(zhì)水平報(bào)告的結(jié)果,此表必須包括: a.蛋白質(zhì)的accession號 b.每個蛋白對應(yīng)的肽段數(shù)目:計(jì)算這個數(shù)字時(shí),氨基酸序列相同的多個匹配肽應(yīng)該算作不同的肽,包括一個肽段不同的帶電狀態(tài)或者修飾狀態(tài)。任何替代假設(shè)都必須是合理的。 c.如果某個蛋白被鑒定到了,那該蛋白在譜圖庫中的肽段數(shù)目是多少。 d.對于某些只鑒定到一個肽段的蛋白,肽段水平的信息必須提供,以及質(zhì)譜和色譜信息 (哪個更合適;見下文) e.對于肽段水平報(bào)告的結(jié)果,結(jié)果表必須包括: f.蛋白質(zhì)的accession號 g.所有匹配到的肽段序列。 h.母離子電荷數(shù),以及檢測到的m/z(質(zhì)荷比,如果使用MS1數(shù)據(jù))。 i.所有檢測到的修飾。 j.對于peptide-centric分析,匹配和沒有匹配到的碎片離子的數(shù)量和評估鑒定質(zhì)量的統(tǒng)計(jì)結(jié)果。 k.對于spectrum-centric分析,打分,和/或肽段匹配的統(tǒng)計(jì)度量。 l.如果鑒定到的肽段包含修飾,衡量修飾可靠性的方法必須報(bào)告(或必須表明修飾的可靠性沒有評估)。 m.如果報(bào)告鑒定到的肽段帶有翻譯后修飾,或者鑒定到的蛋白是基于一個唯一肽段(此定性結(jié)果不推薦)那么這些肽段對應(yīng)的質(zhì)譜圖和色譜圖都必須是可獲得的。可以通過以下方式提供: ○把所有的數(shù)據(jù)和搜庫結(jié)果上傳到一個配備有查看功能的公共數(shù)據(jù)存儲平臺,這種方法優(yōu)于直接發(fā)送給雜志。 或者 ○提交的數(shù)據(jù)和搜索結(jié)果的文件格式允許一些免費(fèi)的軟件對譜圖進(jìn)行可視化查看。 請參見 http://www./site/misc/annotated_spectra.xhtml 了解如何通過不同的軟件實(shí)現(xiàn)譜圖的注釋。 Spectronaut分析結(jié)果可以導(dǎo)出為.sne文件。將該文件上傳至公共數(shù)據(jù)存儲平臺即可。 一般在結(jié)果部分,我們鼓勵作者展示在質(zhì)譜數(shù)據(jù)中鑒定到的總離子的比例,該百分比可以通過使用任何軟件對數(shù)據(jù)進(jìn)行解釋并且應(yīng)說明如何確定或估計(jì)出該比例的。 1.4.2 定量 提供基于質(zhì)譜分析的定量蛋白質(zhì)組學(xué)結(jié)果的手稿必須提供以下信息: 1)所有相關(guān)的定量數(shù)據(jù)(作為肽段和蛋白鑒定列表的一部分),以及描述是如何通過原始數(shù)據(jù)得到這些定量值的(例如利用MS1還是MS2定量)。 2)后處理步驟的完整描述,如離群值剔除,通過鑒定打分值或者CV值進(jìn)行數(shù)據(jù)過濾,通過閾值排除數(shù)據(jù)(例如,基于信噪比或最低離子數(shù)目。) 3)每個蛋白質(zhì)用于定量的肽段數(shù)目(如果與定性采用的數(shù)目不一致)。 4)描述如何通過技術(shù)重復(fù)以及統(tǒng)計(jì)學(xué)方法來驗(yàn)證測量的分析方法的可靠性的??赡軙靡恍?biāo)準(zhǔn)方法或者特殊軟件。然而,有必要證明手稿中包含的數(shù)據(jù)確實(shí)符合模型的假設(shè)。 5)描述如何通過生物學(xué)重復(fù),統(tǒng)計(jì)方法來驗(yàn)證生物學(xué)可靠性的。單個樣本的單次實(shí)驗(yàn)通常是不能接受的(除了作為測試生物信息學(xué)系統(tǒng)的數(shù)據(jù))。如果生物學(xué)重復(fù)的來源相同是不能接受的 (例如,疾病樣本),為了得到一個可靠的結(jié)論必須進(jìn)行足夠數(shù)量的類似生物樣本的檢測,并進(jìn)行適當(dāng)?shù)淖C明。 6)描述定量過程中對共流出肽段的干擾是如何處理的 7)如果鑒定到修飾,那么是采用何種軟件評估修飾位點(diǎn)鑒定的可靠性的。 8)正確估計(jì)不確定性和誤差分析的方法。 9)對大量蛋白和多肽進(jìn)行定量通常需要使用某種形式的多重假設(shè)檢驗(yàn)校正。盡可能的應(yīng)該為每個單獨(dú)的蛋白質(zhì)定量的可信度進(jìn)行評估而不是基于全局?jǐn)?shù)據(jù)集的評估。從手稿中的定量數(shù)據(jù)中得出的任何結(jié)論或假設(shè),都必須與評估的不確定度估計(jì)值一致。 10)描述由多個亞型蛋白構(gòu)成的蛋白組(protein group)的定量方式。 示例: Quantification Data extraction was determined by Spectronaut X based on the extensive mass calibration. Spectronaut Pulsar X will determine the ideal extraction window dynamically depending on iRT calibration and gradient stability. Qvalue (FDR) cutoff on precursor and protein level was applied 1%. All selected fragment ions passing the filters are used for quantification.MS2 interference will remove all interfering fragment ions except for the 3 least interfering ones. The average top 3 filtered peptides which passed the 1% Qvalue cutoff were used to calculate the major group quantities. After Student’s t-Test, different expressed proteins were filtered if their Qvalue <0.05 and="" absolute="" avg="" log2="" ratio="">0.58. The quantification report is available on iPROX (or supplement) 1.5 數(shù)據(jù)提交到公共存儲庫 所有由質(zhì)譜輸出的原始文件必須在首次提交手稿時(shí)存放在一個可公開訪問并且不受作者控制的第三方數(shù)據(jù)存儲平臺(例如ProteomeXchange旗下的數(shù)據(jù)庫iPROX)中。如果譜圖庫是作為研究的一部分創(chuàng)建的,那么用于創(chuàng)建譜圖庫的原始數(shù)據(jù)也必須上傳(除非它已經(jīng)公開可用,在這種情況下應(yīng)該提供可供下載的位置),以及創(chuàng)建的譜圖庫(target庫和Decoy庫)。譜圖庫數(shù)據(jù)應(yīng)優(yōu)先作為單獨(dú)的提交文件存放,以便更容易引用。存儲庫通常需要用戶名和密碼才能訪問提交的數(shù)據(jù)集。這些信息必須在提交稿件給雜志時(shí)一同提供給編輯,并作為評審過程的一部分提供給審稿人。如果讀取原始數(shù)據(jù)的軟件不是被廣泛應(yīng)用的軟件的話,我們鼓勵將數(shù)據(jù)轉(zhuǎn)換為mzML等開放格式(Thermo Fisher質(zhì)譜儀器產(chǎn)生的數(shù)據(jù)無需這么做)。我們期望以盡可能接近原始數(shù)據(jù)的形式上傳譜圖數(shù)據(jù),以免某些處理影響后續(xù)的數(shù)據(jù)解釋度。 此外,必須提交一個文件作為補(bǔ)充材料(并且提交到原始數(shù)據(jù)的存儲庫),該文件映射每個原始數(shù)據(jù)文件、中間處理文件和結(jié)果文件之間的關(guān)系,并確定哪些是生物、技術(shù)或過程重復(fù)。所有的軟件分析都必須記錄所用軟件的相應(yīng)版本。 如果需要延遲或者不提交數(shù)據(jù),必須在投稿時(shí)以書面形式提交請求給數(shù)據(jù)管理編輯[chalkley@cgl.ucsf.edu]。并且數(shù)據(jù)必須在出版時(shí)向公眾提供。 有關(guān)此要求的進(jìn)一步信息,請聯(lián)系 mcp@asbmb.org。 2. 提交至公共數(shù)據(jù)庫的操作流程 首先準(zhǔn)備好需要上傳的各種文件,所需文件如下: iProX(http://www./),是一家在中國建立的蛋白質(zhì)組學(xué)數(shù)據(jù)與知識中心,旨在促進(jìn)蛋白質(zhì)組學(xué)資源在世界范圍內(nèi)的共享。iProX目前由一個蛋白質(zhì)組數(shù)據(jù)提交系統(tǒng)和一個蛋白質(zhì)組數(shù)據(jù)庫組成,其中前者遵照國際蛋白組學(xué)共享聯(lián)盟(ProteomeXchange)的數(shù)據(jù)共享政策而建立。注冊用戶可以以公開或私有兩種方式向iProX提交數(shù)據(jù),一旦相關(guān)論文發(fā)表后,數(shù)據(jù)集將自動公開。 第一步,輸入網(wǎng)址鏈接進(jìn)入主頁,點(diǎn)擊網(wǎng)頁右上角的“登錄”輸入賬號和密碼進(jìn)入,如果是第一次登錄需要點(diǎn)擊“注冊”,完善個人信息并提交申請獲取賬號和密碼: 第二步,登錄賬號,創(chuàng)建項(xiàng)目,兩種創(chuàng)建途徑可以選擇:①“提交”→“創(chuàng)建項(xiàng)目”或②“項(xiàng)目”→“New Project” 第三步,完善項(xiàng)目信息,其中“項(xiàng)目ID”及“PXID”是系統(tǒng)自動生成的,不需要填寫,帶“*”的為必填項(xiàng): 其中,“項(xiàng)目標(biāo)簽”即關(guān)鍵詞;“描述”需要簡要填寫項(xiàng)目的描述,類似于文章中的摘要。 第四步,創(chuàng)建子項(xiàng)目,并按照提示填寫數(shù)據(jù)集詳細(xì)信息,點(diǎn)擊對應(yīng)的灰色選框,可以選擇相應(yīng)的物種,定量方法,酶解方法等信息。點(diǎn)擊“常用的值”可以查找有無對應(yīng)的參數(shù),如果有可以直接選擇,如果沒有,則點(diǎn)擊“CV(控制詞匯表)搜索”輸入關(guān)鍵詞進(jìn)行查找并選擇: 其中,定量方法選擇”SWATH MS”;實(shí)驗(yàn)類型選擇“SWATH MS (Data-independent acquisition)”;酶解方法、PTMs、MS工具參照報(bào)告中設(shè)置的參數(shù);其他信息及總結(jié)雖然不是作為必填項(xiàng),但是建議盡可能的填寫完整,以確保數(shù)據(jù)審核能順利通過?!捌渌畔ⅰ笨梢院喴枋鰧?shí)驗(yàn)步驟,包括酶解、分級、富集(針對翻譯后修飾項(xiàng)目)、質(zhì)譜、數(shù)據(jù)分析等過程,可以參考報(bào)告中的實(shí)驗(yàn)部分的描述?!翱偨Y(jié)”可以簡要概括檢測結(jié)果,包括鑒定到的譜圖數(shù),肽段數(shù),蛋白數(shù)以及定量到的蛋白等信息。 第五步,完善中文信息,將上述信息翻譯成中文即可: 第六步,上傳數(shù)據(jù)文件,將準(zhǔn)備好的數(shù)據(jù)文件按照開始表1中對應(yīng)的文件類型上傳至平臺,注意文件類型(File type)是否準(zhǔn)確。選擇“部分提交(Partial Submission)”(注:如果是中文網(wǎng)頁,選擇[PCV010.partial2])并且“通過Aspera上傳”(文件小于4G可以選擇通過瀏覽器上傳) 第七步,點(diǎn)擊“Relative”為每一個文件添加一個或多個關(guān)聯(lián)文件,完成上述操作后請點(diǎn)擊“Start upload”進(jìn)行文件上傳,文件上傳完成后頁面上會出現(xiàn)提示,然后可以點(diǎn)擊“Continue”進(jìn)入提交頁面,或者點(diǎn)擊“Add New Subproject”再創(chuàng)建一個子項(xiàng)目: 第八步,數(shù)據(jù)文件上傳完成后,在網(wǎng)頁上方可以瀏覽已上傳的文件,如果上傳錯誤可以選中文件,點(diǎn)擊“Delete”刪除,確認(rèn)無誤點(diǎn)擊“繼續(xù)”進(jìn)入到提交頁面?;蛘咄ㄟ^“我的項(xiàng)目“→“項(xiàng)目樹”,選定項(xiàng)目/子項(xiàng)目名可在右側(cè)查看填寫好的項(xiàng)目/子項(xiàng)目信息,點(diǎn)擊右側(cè)上方的功能鍵進(jìn)行相應(yīng)操作:New Subproject在項(xiàng)目下添加新子項(xiàng)目,Edit進(jìn)行項(xiàng)目/子項(xiàng)目信息修改頁面,Upload在項(xiàng)目下上傳新文件,delete刪除save狀態(tài)的項(xiàng)目/子項(xiàng)目: ![]() 第九步,確認(rèn)項(xiàng)目/子項(xiàng)目信息無誤后,點(diǎn)擊頁面下方submit進(jìn)入數(shù)據(jù)提交頁面,選擇要提交的項(xiàng)目(該項(xiàng)目下所有子項(xiàng)目會自動選擇,子項(xiàng)目和項(xiàng)目必須一起提交,享有相同的發(fā)布時(shí)效和被訪問權(quán)限),點(diǎn)擊下方“submit”鍵后項(xiàng)目(包括子項(xiàng)目)將提交給iProX數(shù)據(jù)管理員進(jìn)行發(fā)布前審核,審核通過后提交者郵箱和站內(nèi)信將收到相應(yīng)通知,此時(shí)用戶上傳的數(shù)據(jù)文件正式完成提交。發(fā)送郵件反饋審核結(jié)果。 ![]() |
|