TCGA癌症临床数据资源全面介绍---癌症深入研究领域的全谱!

2021-11-08 12:01 来源:舟山妇科医院

2006年,呼吸系统乳癌原核海洋生物由此可知谱(The Cancer Genome Atlas, TCGA)计划书以多形持续性胶质母细胞核突起(GBM)、呼吸系统柱状细胞核乳癌(LUSC)和卵巢浸润持续性囊腺乳癌(OV)开始为期3年的试点建设项目,2009年~2015年下半年一触即发。到建设项目据粗略估计,TCGA网络数据档案研究工只用者已刻画了33种呼吸系统乳癌特持续性10,000余亦然病变的化学键特质,并假定了很多化学键免疫球蛋白。TCGA涵盖的科学研究极为最重要特质都是格在野化的数据档案抽取。为必需恰巧确运用于这些颇具原核海洋生物特质的巨量科学研究数据档案,最近TCGA完成一批重大成果,刊发格在CellPress旗下的期刊。

本文对4同年5日刊发格Cell上的一文完成编译。短文阐述以OS(总求生期)、PFI(无方面有规律)、DFI(不止有规律)和DSS(传染病无关生存者)为四个主要科学研究结果往北的TCGA在野呼吸系统乳癌科学研究数据档案人力(TCGA-CDR)规格化在线,并给单单了每种呼吸系统乳癌特持续性的往北运用于决定。TCGA科学研究数据档案可从原核海洋生物数据档案共享内部空间(GDC)门户网站串流,所有的化学键数据档案在串流。科学研究数据档案和化学键数据档案运用于同样的标签结构,便于病变的科学研究档案和结果显示化学键数据档案为基础。

TCGA在野乳癌在线链表特质

由此可知1A为科学研究数据档案为基础和研究方法及4个主要科学研究往北则有和审核的流程由此可知,对33份初始已登记和97份后续数据档案文件,共33种呼吸系统乳癌特持续性111,60亦然呼吸系统乳癌病变的档案完成了处置。表格1为每个TCGA链表的简而言之。按原发结果显示根据化学键特质选入每个链表,皮肤脑突起(SKCM)的原发和分散灶两种特持续性都有,其它极再加数的原发与分散特持续性也有数据档案研究。

由此可知1. 科学研究数据档案为基础和研究方法及4个主要科学研究往北则有和审核流程由此可知

表格1. TCGA 在野乳癌链表特质

科学研究结果往北OS、PFI、DFI和DSS

总求生期(OS)很最重要,缺点是假定OS惨剧时模糊持续性最较差。但运用于OS只用往北似乎削弱科学研究数据档案研究,因为非乳癌亡因不一定能体现单单病理学、波及持续性或对治疗法缓和。运用于OS或才可更长的随访时长;很多科学研究试验之从前,举亦然来说运用于比起随访时长短的DFI或PFI。针对这两项TCGA科学研究数据档案,要认识到短时科学研究随访有规律在波及持续性呼吸系统乳癌特持续性结果的最重要持续性,因为似乎几年内就注意到到科学研究惨剧,在亡亡从前已注意到病情恶化入院或方面。对波及持续性较弱的呼吸系统乳癌特持续性,病变在数十乃至几十年后入院,随访过后似乎无法注意到充分惨剧以反对有用结果可供判断。该研究的目的是检查和TCGA在野乳癌科学研究检测的比起优势和缺乏,指导今后的研究和不必要随访有规律时长缺乏等缺陷。

研究全部TCGA科学研究数据档案后,结论如下:在数据档案可获得时,OS、PFI及DFI比起精准,但大部分情况下不用推估DSS。由此可知1B为33种各有不同呼吸系统乳癌特持续性的OS K-M曲百余人。尽管求生研究不是TCGA主要目标,大部分呼吸系统乳癌特持续性求生曲百余人与从从前审核实质上一致求生往北的统一数据档案研究基本实质上一致,GBM、OV(2008, 2011)和较差级别胶质突起(LGG)(2015)的TCGA结果就是最劣亦然证。PFI、DFI和DSS的K-M曲百余人见由此可知1C–1E。

由此可知1 B-E科学研究数据档案研究

基于每种呼吸系统乳癌特持续性4个往北的注意到时长计算平均随访时长及惨剧或检查和的之从前位时长(表格2)。所有的之从前位随访时长为22.1个同年,但各有不同特持续性呼吸系统乳癌该时长歧异极大;GBM和急持续性髓系白血病(LAML)最短达12个同年,而肾嫌色细胞核乳癌(KICH)最长达48个同年。

表格2 整体而言之从前位随访时长及4个往北的惨剧与注意到之从前位时长

引荐运用于的科学研究结果往北

科学研究结果往北选择衡量数据档案研究目标、惨剧量、链表形状和结果数据档案精准度。将这些方法和开发的其它方法只用为对单个传染病在线的测试者和补充检查和,给单单在每种传染病特持续性之从前运用于每个结果往北的决定及可能(表格3)。每种呼吸系统乳癌特持续性的求生往北才可要至再加通过一个主要测试者和补充检查和才被好好。33种乳癌之从前的13种运用于全部4个往北:膀胱尿路上皮乳癌(BLCA)、宫颈柱状细胞核乳癌(CESC)、结肠乳癌(COAD)、食管乳癌(ESCA)、头颈部柱状细胞核乳癌(HNSC)、肾状细胞核乳癌(KIRP)、呼吸系统腺乳癌(LUAD)、LUSC、OV、胰腺乳癌(PAAD)、肉突起(SARC)、肠胃腺乳癌(STAD)和子宫内膜乳癌(UCEC)。相反,无法一个往北的有嗜铬细胞核突起和副神经突起(PCPG)。淋巴弥漫大B细胞核淋巴突起(DLBC)、LAML和颊腺突起(THYM)仅有一个往北;剩余呼吸系统乳癌特持续性2或3个往北,但其之从前一些持保留观点。最有用的是PFI,可无保留地引荐给除LAML(无数据档案)、DLBC和KICH(谨慎运用于)和PCPG(不引荐)另有的4种。

表格3 往北OS,PFI,DFI及DSS的审核与引荐运用于

检验TCGA-CDR及与此相关领域

在呼吸系统乳癌数据档案研究之从前,雌激素ER阴持续性病变科学研究求生期结节病比ER+病变劣。分别用OS、PFI、DFI和DSS较为这两类病变的求生期(由此可知3A–3D;曲百余人据粗略估计于10年随访时长,但运用于整个在线完成研究)。单各种因素研究显示,运用于PFI(p= 0.005)和DFI(p = 0.001)只用为科学研究往北,TCGA之从前ER+呼吸系统乳癌病变比ER-病变有很好的求生期,但运用于OS时两类病变间不普遍存在歧异(p = 0.097) 。此另有,两类病变的DSS(p = 0.009)有很大歧异,表格明DSS的潜在效益。以上发现证实了PFI和DFI是特定特持续性呼吸系统乳癌化学键数据档案研究的合适往北。

由此可知3 检验和领域实亦然

此另有还检验了波及持续性GBM求生结果往北。TCGA之从前GBM之从前位OS为12.6个同年,介于先从前美联社的规格治疗法的12.1个同年和规格治疗法牵头替莫唑胺的14.6个同年中间。之从前位PFI是6.1个同年,介于先从前美联社的规格治疗法5个同年和规格治疗法牵头替莫唑胺的6.9个同年中间。毕竟,TCGA在线OS和PFI惨剧时长与文献保持一致。再次鲜为人知OS和PFI只用为GBM化学键数据档案研究的科学研究往北效度。

用Cox百分比可能性回归数学方法未确定高期(III、IV期)比起较差期(I、II期)呼吸系统乳癌病变的可能性比(HR),检验4个往北的TCGA-CDR数据档案。由于DFI假定与其它结果的假定不保持一致,对引荐运用于OS、PFI和DSS的14种特持续性呼吸系统乳癌较为logHR(表格3)。随后仅有对满足Cox百分比可能性假定的传染病完成粗略估计(由此可知3E–3G)。结果表格明,14种特持续性呼吸系统乳癌之从前,除间皮突起(MESO)、PAAD和葡萄膜脑突起(UVM)另有,高期对比较差期HR在3个引荐往北OS、PFI及DSS上相比较偏高。运用于匹配结果显示的Wilcoxon秩和检验,当运用于PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有很大歧异,显示传染病方面和求生往北在HR上普遍存在系统偏劣;OS与DSS中间无法很大歧异(p = 0.106)。对2个logHR取值的规格误完成引加权平均未确定Pearson平均数, 由logHR推估的3种结果有极很大恰巧无关:PFI和OS平均数0.96(95%无可能性[CI]:0.77–0.99),PFI和DSS为 0.95(95%无可能性:0.76–0.99),OS和DSS为0.90(95%无可能性:0.61–0.98)。这些无关持续性潜在反对科学研究20世纪用PFI,后期用OS和DSS好好往北。

除了为基础化学键数据档案,还设法研究首次治疗法后不止病变与非不止病变从前提注意到各有不同的取而代之惨剧。TCGA-CDR之从前29类呼吸系统乳癌反馈用于解决该解决办法,划定病变从病症到完成首治并降至不止长时长至再加生存者3个同年。以LUSC为亦然,有289亦然不止病变和41亦然长期非不止病变,NTE百余人分别为21.8%和68.2%。用Cox百分比可能性回归数学方法,发现在非不止病变之从前NTE可能性很大高于不止病变(HR = 6.68,95% CI = 4.25–10.51,FDR修改q取值<0.05)。在另另有21种呼吸系统乳癌特持续性之从前也有实质上实质上一致结果(表格4)。余下7种之从前无法注意到到这些歧异。我们也在审核从前提每个数学方法都满足百分比可能性假定,其之从前有两个不符合,才可要数据档案研究时长依赖持续性及多函数数学方法来寻找可能。

表格4 非不止与不止病变NTE拓展对比

TCGA从全球数百个市区内抽取病症,为解决科学研究数据档案各有不同市区内间的可比持续性,才可考虑到数据档案明晰持续性、和病变特质等。对每种传染病而言,我们对比了从前两名备有病症数最多的该组织;也市区内(TSS)与所有其它TSS的同种传染病及4个结果往北(表格5)。

表格5 对来自从前两位TSS的每个呼吸系统乳癌特持续性数据档案研究结果完成较为

对于GBM等不亚于波及持续性的,从前两位TSS(#1和#2)的发病一些人与其它TSS相比较实质上实质上一致的有OS、PFI和DSS,因惨剧太再加很难研究不引荐DFI好好往北。BRCA等较较差波及持续性,短时间内引荐运用于PFI和DFI,但决定谨慎用OS或DSS审核。TSS #1的科学研究数据档案激发不太好的OS和DSS,但无法注意到到PFI歧异;另另有,表格面上TSS#1有很好的DFI结果,仅有注意到3亦然 DFI惨剧。这种表格里不一的现象表格明该市区内的结果数据档案才可促使审核。另一方面,TSS #2的4个往北结果与其它地方保持一致。

这个简单的结果较为表格明,当从特定结果研究整体TCGA的科学研究数据档案时,才可要考虑到TSS的颇具体情况反馈。由于年长、分期/分级及治疗法等各种因素影响各有不同TSS患一些人的往北结果,TSS可以只用为这些和不实质上科学研究注释等其它并未测量歧异的替代。

潜在的混各种因素、竞争结果的

可能性及数学方法假定

对科学研究求生往北研究来说,决定运用于所处置的全部科学研究数据档案。但相比较化学键/原核海洋生物数据档案的为基础研究,要注意两个方面。首先,引荐观点基于终端求生数学方法,以化学键免疫球蛋白只用得单单因子划分结果显示集,有似乎破坏结果粗略估计的很大持续性歧异。因此,从互无关联的TCGA化学键数据档案或免疫球蛋白TCGA-CDR结果数据档案之从前得单单的结论才可在统一的在线之从前促使证实。

第二,我们决定仅有运用于原发的化学键数据档案,因为病变初诊时,最重要时长反馈等也就是说的科学研究数据档案已抽取比起明晰。皮肤脑突起(SKCM)在TCGA特持续性之从前更加比如说,470亦然之从前仅有103亦然原发,其余296亦然为原发局部支气管分散,68亦然远端分散。这与很再加抽取到分散突起的其它TCGA呼吸系统乳癌特持续性形成鲜明对比。SKCM分散突起很再加有着也就是说的原发,而其它TCGA呼吸系统乳癌特持续性尽管很再加有分散突起,但都有着也就是说的原发结果显示。因此,对于SKCM结果的无关持续性,决定只运用于有限量的原发病症,尽管SCKM支气管分散的III期病症可只用为统一组群完成数据档案研究。

在运用于取而代之为基础的TCGA-CDR在线时,还才可要注意:潜在误用各种因素、竞争结果的可能性及数学方法假定。

混各种因素

混各种因素普遍存在但被回避在数学方法之另有时,偏劣似乎毕竟或较差估真实。如在呼吸系统乳癌的种族歧异数据档案研究之从前,白人与黑人病变中间普遍存在最重要的基因表格达歧异,然而根据化学键免疫球蛋白完成修改后,这种歧异很大减再加甚至消失。治果也是潜在的混各种因素,当反馈可受益时应适当考虑到修改。治疗法并未知时,年长、诊治所医院及病症日期等规格治疗法只用为替代反馈能减再加之另有最小取值。对这方面的执行者构建,鼓励运用于;也结节病数据档案研究决定报告(REMARK)。

竞争结果的可能性

量度DSS、DFI和PFI往北时,要对无法境遇最重要惨剧且不止的亡亡病变完成审查。在这种情况下,如果假定病变无法其它亡因,那她/他最终仍似乎亡于呼吸系统乳癌指征。然而,在推估治疗法等得单单因子对水肿呼吸系统乳癌或心血管传染病等非指数呼吸系统乳癌亡亡可能性的得单单能力时,该假定并不比如说。

数学方法假定

领域Cox百分比可能性(PH)数学方法才会检查和PH假定。除再加数与此相关另有,大大部分数学方法都满足Cox PH假定,但才可促使探索这些美国疾病控制与预防中心以找单单违背假定的可能,从而对HR无论如何更可靠的推估。尽管已经为排查数据档案和解决解决办法无论如何了巨大努力,但仍普遍存在最重要的运用于限制,次访问TCGA科学研究数据档案都才会探究这些限制。

首先,TCGA主要是为化学键数据档案研究设计者,最初病症选择来自多个机构有着合适库存该组织的并未治疗法原发病症,因此这些病症不组成连续持续性。此另有,对于每种各有不同特持续性/数据档案研究,随访数据档案无法统合抽取。同时,科学研究数据档案抽取的一些规则在从从前不得不随着时长的推移而改变。TCGA - CDR不涵盖呼吸系统乳癌治疗法史,并非所有病症都被注释。因此,研究特定特持续性或免疫球蛋白的治疗法背景优于概述持续性在野乳癌研究。当病变完成颇具体情况治疗法时,受益能用DFI和PFI往北有效率研究。

其次,TCGA结果显示科学研究随访根据当地诊所的时长表格,似乎为传染病或特定手部的入院和病患者最重要人类长时长的记录,因此无法TCGA指定的科学研究随访计划书,仅有给单单建设项目主要阐释的化学键特质。

先从前,完全所有TCGA获得的结果显示和原核海洋生物及化学键数据档案来自取而代之诊病变原发的单个切片,由此激发的原核海洋生物和化学键数据档案不能在内部空间或时长任何方面明确捕捉都是格另一病变结果函数的异质持续性。该解决办法不是TCGA有别于的,任何线性原发持续性数据档案研究都普遍存在。

取而代之拓展

这项工只用是更是第一次下半年核心内容处置TCGA在野乳癌科学研究档案。由此激发的TCGA-CDR的结果往北与统一非TCGA数据档案研究结果保持一致,陈述该人力在更是规模的科学研究连续持续性上备有了海洋生物探测取而代之视角。也要认识到TCGA-CDR的内在运用于局限持续性及极为最重要指导和引荐观点。已经更加模棱两可,进化传染病并更进一步大规模的化学键数据档案研究才会核心内容抽取科学研究病理、治疗法和转归惨剧数据档案,以坚决最高规格的科学研究数据档案研究。尽管有其局限持续性,TCGA-CDR备有了规格化在线,以及模糊不清的4个科学研究结果往北导单单,并解决了精准度解决办法,从而在在野乳癌和持续性状水平上完成转化数据档案研究。并更进一步数据档案数据档案研究的糅合将更高结果中间的可比持续性,很好地推论和反对每一次。

参考档案

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
委员建议激活三医联动综合改革试点
新医改加快6年来,为何整体疑问“看病难、看病贵”并未解决?导致“英国政府不满意、护士不满意、患者不满意”的无论如何原因是什么?昨,全国人...[详细]
2022-05-05
暴力伤医的教师评上职称了 您怎么看?
近日,一张南京中小学毕业生高级官阶面试审批的截图刷爆了帖子,原因是图中列出的颜词句来初中女毕业生缪某曾涉及殴打心理医生,情节严重。据了...[详细]
2022-05-04
月经不调是什么缘故
更年期不调有可能是极其焦虑、冬天的诱导等原因造成了的。更年期不调是所指男人的更年期极其,包括更年期的时间、数量和本质的变化。此外,痛经...[详细]
2022-05-03
疼痛伴有硬块是刚才
肿胀且间歇硬块的病症应该积极放射治疗原发性疾病,常见的病因包括很多种,例如内分泌心理因素、上皮蛋白增殖和上皮蛋白癌等。上皮蛋白增殖病症...[详细]
2022-05-02
宫颈炎怎么放射治疗 有哪几种分类
乳头状炎是育龄妇女的常见病,有急性和慢性两种。急性乳头状炎常与急性子宫内膜炎或急性炎同时不存在,但以慢性乳头状炎多见。主要表现为白随身...[详细]
2022-05-02
患了卵巢囊肿直至吃什么比较好
睾丸囊肿患儿在日;也生活中除了抗生素的疗程以外,还可以通过饮品来泡茶叶自己的身体健康,睾丸囊肿给好朋友造成不大的妨碍,所以日;也的健康...[详细]
2022-04-28
【以案说医】王小云:中药内外合治女性顽固性外阴黄疸案
▲王小云 潮州市名里医,潮州市里医院主任医师,副教授,博士生讨教,博士后携手讨教。生为大师路志自始副教授学术传承人,国内年初里医药领军人...[详细]
2022-04-27
艾灸肚脐眼痒是问道?艾灸后肚脐眼痒该怎么办?
艾专治嘴唇有极佳的良药排卵利尿、散寒的药用价值,可是大多数人在艾专治嘴唇后亦会借助于现痉挛的上述情况,那么,艾专治嘴唇眼发烧是怎么回事...[详细]
2022-04-26
了解功能障碍性子宫出血和不孕
神经内分泌系统调节紊乱引起的异常子宫出血称为功能障碍性子宫出血。病理生理由于下丘脑-垂体-卵巢性腺轴功能障碍,子宫内膜反应异常,其组织变...[详细]
2022-04-25
  • 地区医院
  • 医院联盟