[摘要]目的:整合基因表达谱和拷贝数变异谱数据来揭示Ⅱ~Ⅲ期结直肠癌的分子分型,并探索各分型与结直肠癌术后复发的关系。方法:从网络公共资源中下载结直肠癌的基因表达谱数据及对应的拷贝变异谱数据,经批间校正、四分位数标准化、缺失值估算及特征过滤等处理后获得用于后续整合分析的基因表达谱和基因组拷贝数谱数据;选用贝叶斯一致性聚类(BCc)算法整合上述两种谱学数据进行结直肠癌分子亚型分析;结合结直肠癌患者的复发和生存数据,利用生存分析评价各亚型的预后预测能力;并用基因系列富集度分析软件比较不同亚型所富集的生物学信号。结论:BCC法能够有效整合不同组学数据进行结直肠癌肿瘤分型;BCC-Ⅳ亚型的预后最差,可能与DNA损伤修复能力降低有关。
   
   【关键词]:结肠肿瘤/病理学;DNA损伤;DNA修复;基因表达;聚类分析;分子生物学;预后
   
   3讨论
   组学数据尤其多种组学数据联合用于肿瘤分型具有重要价值。但由于相应的生物信息学方法开发滞后,很多组学数据在最初发表时并未得到充分挖掘。本研究利用BCC法对GSE40967的基因表达谱数据和CNV数据进行整合聚类,完全异于原始文献的思路,以期发现新的有关结直肠癌预后的生物学知识。本研究针对Ⅱ一Ⅲ期结直肠癌的预后进行研究,并在亚型构建之前利用术后5年以上未复发和术后3年内复发的病例获得聚类分析的种子基因群,这种种子基因筛选的方法目标性很强,能够得到预后相关的分型,本研究BCC分型结果也支持该策略。
   由于目前尚无更好的办法来综合基因表达谱特征和CNV谱特征对BCC亚型进行解释,故本研究利用目前研究资源最丰富的基因表达谱工具来分析BCC亚型。BCC—I亚型和BCC一Ⅳ亚型具有两个极端的预后,因此探究究竟是什么生物学功能导致两者显著的预后差异很有意义。本研究用GSEA软件分析,结果提示DDR信号的强弱变化可能与结直肠癌复发有关。