摘 要
背景
结直肠癌(colorectal cancer,CRC)是世界上最常见的恶性肿瘤之一,而结肠腺 癌(Colonic adenocarcinoma,COAD)是结直肠癌最常见的病理类型。目前一些与结直 肠癌患者生存相关的生物标志物已被证实。然而,单个基因生物标志物的预测效果是 不够的。研究结果发现,肿瘤的各种生物学特征,都与新陈代谢密切相关,而三羧酸 循环(Tricarboxylic acid ,TCA)和一碳代谢在肿瘤中起着重要的作用。本研究主要从三羧酸循环(TCA)和一碳代谢中识别新的基因特征,以更好地预测 COAD 的存活。
目的
探讨三羧酸循环及一碳代谢和预后之间的可能联系,寻找三羧酸循环及一碳代谢相关的基因特征,以更好地预测 COAD 患者的生存。
方法
1. 利用癌症基因组图谱(TCGA)数据库的大型结肠腺癌(COAD)队列进行了mRNA 表达谱分析,寻找三羧酸循环及一碳代谢相途径的差异表达基因。
2. 采用单因素 Cox 回归分析、多因素 Cox 回归分析和受试者工作特征(ROC)曲线,筛选与患者预后生存最相关的基因组合。
3. 利用多种公共数据库对筛选出的基因进行生物信息学分析。
4. 验证这些基因在结肠腺癌(COAD)组织中的表达。
结果
1. 肿瘤和正常组织之间参与三羧酸循环和一碳代谢通路的,共有 18 个差异表达基因(DEGs)。
2. 单因素 Cox 回归分析和多因素 Cox 回归分析结果显示,SUCLG2、SUCLG1、ACLY、SUCLG2P2 、ATIC 、ACO2 与结肠腺癌患者的生存率相关。结合临床变量,采用受试者工作特征(ROC)曲线筛选出模型 1(AUC=0.82505),是与患者预后生存最相关的变量组合模型。模型 1 包含 3 个基因:SUCLG2P2 、SUCLG2 和 ATIC。
3. SUCLG2P2 和 SUCLG2 在结肠腺癌中低表达,而 ATIC 在结肠腺癌中高表达, 同时 SUCLG2P2 、SUCLG2 和 ATIC 的表达水平与结肠腺癌的分期有关。Pearson 分 析显示,SUCLG2P2、SUCLG2 和 ATIC 基因在正常组织中存在较强的正相关关系,而在肿瘤组织中 SUCLG2P2 和 ATIC 、SUCLG2 和 ATIC 之间未显示出相关性。背景
结直肠癌(colorectal cancer,CRC)是世界上最常见的恶性肿瘤之一,而结肠腺 癌(Colonic adenocarcinoma,COAD)是结直肠癌最常见的病理类型。目前一些与结直 肠癌患者生存相关的生物标志物已被证实。然而,单个基因生物标志物的预测效果是 不够的。研究结果发现,肿瘤的各种生物学特征,都与新陈代谢密切相关,而三羧酸 循环(Tricarboxylic acid ,TCA)和一碳代谢在肿瘤中起着重要的作用。本研究主要从三羧酸循环(TCA)和一碳代谢中识别新的基因特征,以更好地预测 COAD 的存活。
目的
探讨三羧酸循环及一碳代谢和预后之间的可能联系,寻找三羧酸循环及一碳代谢相关的基因特征,以更好地预测 COAD 患者的生存。
方法
1. 利用癌症基因组图谱(TCGA)数据库的大型结肠腺癌(COAD)队列进行了mRNA 表达谱分析,寻找三羧酸循环及一碳代谢相途径的差异表达基因。
2. 采用单因素 Cox 回归分析、多因素 Cox 回归分析和受试者工作特征(ROC)曲线,筛选与患者预后生存最相关的基因组合。
3. 利用多种公共数据库对筛选出的基因进行生物信息学分析。
4. 验证这些基因在结肠腺癌(COAD)组织中的表达。
结果
1. 肿瘤和正常组织之间参与三羧酸循环和一碳代谢通路的,共有 18 个差异表达基因(DEGs)。
2. 单因素 Cox 回归分析和多因素 Cox 回归分析结果显示,SUCLG2、SUCLG1、ACLY、SUCLG2P2 、ATIC 、ACO2 与结肠腺癌患者的生存率相关。结合临床变量,采用受试者工作特征(ROC)曲线筛选出模型 1(AUC=0.82505),是与患者预后生存最相关的变量组合模型。模型 1 包含 3 个基因:SUCLG2P2 、SUCLG2 和 ATIC。
4. SUCLG2P2、SUCLG2 和 ATIC 基因在结肠腺癌组织样本中的表达水平与公共数据库分析的结果一致。
结论
SUCLG2P2 、SUCLG2 和 ATIC 在结肠癌和正常组织中的表达存在差异,且与生 存相关。以上 3 个基因与临床数据构建的模型对预测患者的生存具有良好的预测能力, 未来 SUCLG2P2 、SUCLG2 和 ATIC 可能是结肠腺癌的新的生物标志物或治疗靶点。
关键词: 一碳代谢;三羧酸循环;预后;基因;结肠腺癌
前 言
结直肠癌(CRC)是目前最常见的恶性肿瘤之一。每年有超过 120 万的患者被诊断 为结肠直肠癌,其中超过 60 万人死亡,而且对人类的损害正在增加。在美国和其他 西方国家,结肠直肠癌的发病率在所有类型的肿瘤中排名第三,在男性中排名第二, 在女性中排名第三[ 1]。虽然近年来在结直肠癌的检测和治疗方面取得了一些进展,但 其治疗效果并没有改善,其发生和转移的具体分子机制尚不清楚。结肠腺癌(COAD) 是结直肠癌最常见的病理类型。因此,揭示 COAD 的发病机制,寻找 COAD 的分子标记物和药物靶点具有重要的科学意义和临床价值。
生活中任何类型的活动都是基于相应的物质和能量基础,肿瘤也不例外,各种 生物学特征,都与新陈代谢密切相关[2]。如果我们能选择性地控制肿瘤中的某些代谢 途径,就有可能阻断相应的恶性表型。生物体中包含一个碳原子的基团被命名为一 碳单位,其中包括甲基(-CH3)、烯基( -CH2)、炔基(-ch=) 、甲酰(-CHO)和亚胺 甲基(-ch=NH)[3] 。与一碳单位的产生和转移相关的代谢被称为一碳代谢[4] 。一碳代谢 与体内的其他代谢过程密切相关。一碳单位是核酸(嘧啶、嘌呤)合成的重要前体。 它通过 S-腺苷甲硫氨酸(SAM)参与 DNA 、RNA 、蛋白质、脂质、神经递质和谷胱甘 肽的甲基化合成,这对细胞的表观遗传和氧化还原状态有重要影响[3, 5]。三羧酸(TCA) 循环是有氧生物中常见的代谢途径[6]。三羧酸循环是三种营养物质(碳水化合物、脂 质和氨基酸)的最终代谢途径,也是碳水化合物、脂质和氨基酸代谢的枢纽[7]。三羧 酸循环是产生能量 ATP 的主要途径。它调节线粒体呼吸中的能量产生,并在碳水化 合物代谢中发挥重要作用[8]。越来越多的研究表明,一碳代谢和三羧酸循环的关键酶活性与多种肿瘤有关[6, 9- 12]。
此外有研究发现,基因的异常甲基化可出现在肿瘤发生的早期阶段,而在肿瘤逐渐发展的过程中,基因的异常甲基化程度增加。在肿瘤细胞中,总 DNA 甲基化水平低于正常细胞,但一些肿瘤抑制基因和生长调节基因的启动子区域的甲基化程度增加。所以甲基化也与肿瘤的形成有关。
在本研究中,我们利用公共数据库引导下的生物信息学分析,寻找碳代谢和三 羧酸循环途径的差异表达基因。采用单因素 Cox 回归、多因素 Cox 回归分析和受试 者工作特征(ROC)曲线,筛选与患者预后生存最相关的基因组合。并验证了这些基因 在 COAD 组织中的表达。本研究可能揭示新的研究方向和治疗靶点,为 COAD 的诊断和治疗提供依据。
[ 1] Siegel RL, Miller KD, Jemal A. Cancer Statistics, 2017. CA Cancer J Clin. 67( 1). UnitedStates,2017. 7-30.
[2] Phan LM, Yeung SC, Lee MH. Cancer metabolic reprogramming: importance, main features, andpotentials for precise targeted anti-cancer therapies. Cancer Biol Med. 11( 1) ,2014. 1- 19.
[3] Ducker GS, Rabinowitz JD. One-Carbon Metabolism in Health and Disease. Cell Metab.25( 1) ,2017. 27-42.
[4] Newman AC, Maddocks O. One-carbon metabolism in cancer. Br J Cancer. 116( 12) ,2017.1499- 1504.
[5] Zeng JD, Wu W, Wang HY, et al. Serine and one-carbon metabolism, a bridge that links mTORsignaling and DNA methylation in cancer. Pharmacol Res. 149Netherlands,2019. 104352.
[6] Anderson NM, Mucka P, Kern JG, et al. The emerging role and targetability of the TCA cycle incancer metabolism. Protein Cell. 9(2) ,2018. 216-237.
[7] Cappel DA, Deja S, Duarte J, et al. Pyruvate-Carboxylase-Mediated Anaplerosis Promotes Antioxidant Capacity by Sustaining TCA Cycle and Redox Metabolism in Liver. Cell Metab.29(6) ,2019. 1291- 1305.e8.
[8] Che-Othman MH, Jacoby RP, Millar AH, et al. Wheat mitochondrial respiration shifts from the tricarboxylic acid cycle to the GABA shunt under salt stress. New Phytol. 225(3). England,2020.1166- 1180.
[9] Vander Heiden MG, DeBerardinis RJ. Understanding the Intersections between Metabolism andCancer Biology. Cell. 168(4) ,2017. 657-669.
[ 10] Rizzo A, Napoli A, Roggiani F, et al. One-Carbon Metabolism: Biological Players in EpithelialOvarian Cancer. Int J Mol Sci. 19(7) ,2018.
[ 11] May JL, Kouri FM, Hurley LA, et al. IDH3α regulates one-carbon metabolism in glioblastoma.Sci Adv. 5( 1) ,2019. eaat0456.
[ 12] Nie H, Ju H, Fan J, et al. O-GlcNAcylation of PGK1 coordinates glycolysis and TCA cycle topromote tumor growth. Nat Commun. 11( 1) ,2020. 36.
结直肠癌(CRC)是目前最常见的恶性肿瘤之一。每年有超过 120 万的患者被诊断 为结肠直肠癌,其中超过 60 万人死亡,而且对人类的损害正在增加。在美国和其他 西方国家,结肠直肠癌的发病率在所有类型的肿瘤中排名第三,在男性中排名第二, 在女性中排名第三[ 1]。虽然近年来在结直肠癌的检测和治疗方面取得了一些进展,但 其治疗效果并没有改善,其发生和转移的具体分子机制尚不清楚。结肠腺癌(COAD) 是结直肠癌最常见的病理类型。因此,揭示 COAD 的发病机制,寻找 COAD 的分子标记物和药物靶点具有重要的科学意义和临床价值。
生活中任何类型的活动都是基于相应的物质和能量基础,肿瘤也不例外,各种 生物学特征,都与新陈代谢密切相关[2]。如果我们能选择性地控制肿瘤中的某些代谢 途径,就有可能阻断相应的恶性表型。生物体中包含一个碳原子的基团被命名为一 碳单位,其中包括甲基(-CH3)、烯基( -CH2)、炔基(-ch=) 、甲酰(-CHO)和亚胺 甲基(-ch=NH)[3] 。与一碳单位的产生和转移相关的代谢被称为一碳代谢[4] 。一碳代谢 与体内的其他代谢过程密切相关。一碳单位是核酸(嘧啶、嘌呤)合成的重要前体。 它通过 S-腺苷甲硫氨酸(SAM)参与 DNA 、RNA 、蛋白质、脂质、神经递质和谷胱甘 肽的甲基化合成,这对细胞的表观遗传和氧化还原状态有重要影响[3, 5]。三羧酸(TCA) 循环是有氧生物中常见的代谢途径[6]。三羧酸循环是三种营养物质(碳水化合物、脂 质和氨基酸)的最终代谢途径,也是碳水化合物、脂质和氨基酸代谢的枢纽[7]。三羧 酸循环是产生能量 ATP 的主要途径。它调节线粒体呼吸中的能量产生,并在碳水化 合物代谢中发挥重要作用[8]。越来越多的研究表明,一碳代谢和三羧酸循环的关键酶活性与多种肿瘤有关[6, 9- 12]。
此外有研究发现,基因的异常甲基化可出现在肿瘤发生的早期阶段,而在肿瘤逐渐发展的过程中,基因的异常甲基化程度增加。在肿瘤细胞中,总 DNA 甲基化水平低于正常细胞,但一些肿瘤抑制基因和生长调节基因的启动子区域的甲基化程度增加。所以甲基化也与肿瘤的形成有关。
在本研究中,我们利用公共数据库引导下的生物信息学分析,寻找碳代谢和三 羧酸循环途径的差异表达基因。采用单因素 Cox 回归、多因素 Cox 回归分析和受试 者工作特征(ROC)曲线,筛选与患者预后生存最相关的基因组合。并验证了这些基因 在 COAD 组织中的表达。本研究可能揭示新的研究方向和治疗靶点,为 COAD 的诊断和治疗提供依据。
[ 1] Siegel RL, Miller KD, Jemal A. Cancer Statistics, 2017. CA Cancer J Clin. 67( 1). UnitedStates,2017. 7-30.
[2] Phan LM, Yeung SC, Lee MH. Cancer metabolic reprogramming: importance, main features, andpotentials for precise targeted anti-cancer therapies. Cancer Biol Med. 11( 1) ,2014. 1- 19.
[3] Ducker GS, Rabinowitz JD. One-Carbon Metabolism in Health and Disease. Cell Metab.25( 1) ,2017. 27-42.
[4] Newman AC, Maddocks O. One-carbon metabolism in cancer. Br J Cancer. 116( 12) ,2017.1499- 1504.
[5] Zeng JD, Wu W, Wang HY, et al. Serine and one-carbon metabolism, a bridge that links mTORsignaling and DNA methylation in cancer. Pharmacol Res. 149Netherlands,2019. 104352.
[6] Anderson NM, Mucka P, Kern JG, et al. The emerging role and targetability of the TCA cycle incancer metabolism. Protein Cell. 9(2) ,2018. 216-237.
[7] Cappel DA, Deja S, Duarte J, et al. Pyruvate-Carboxylase-Mediated Anaplerosis Promotes Antioxidant Capacity by Sustaining TCA Cycle and Redox Metabolism in Liver. Cell Metab.29(6) ,2019. 1291- 1305.e8.
[8] Che-Othman MH, Jacoby RP, Millar AH, et al. Wheat mitochondrial respiration shifts from the tricarboxylic acid cycle to the GABA shunt under salt stress. New Phytol. 225(3). England,2020.1166- 1180.
[9] Vander Heiden MG, DeBerardinis RJ. Understanding the Intersections between Metabolism andCancer Biology. Cell. 168(4) ,2017. 657-669.
[ 10] Rizzo A, Napoli A, Roggiani F, et al. One-Carbon Metabolism: Biological Players in EpithelialOvarian Cancer. Int J Mol Sci. 19(7) ,2018.
[ 11] May JL, Kouri FM, Hurley LA, et al. IDH3α regulates one-carbon metabolism in glioblastoma.Sci Adv. 5( 1) ,2019. eaat0456.
[ 12] Nie H, Ju H, Fan J, et al. O-GlcNAcylation of PGK1 coordinates glycolysis and TCA cycle topromote tumor growth. Nat Commun. 11( 1) ,2020. 36.
第一部分 寻找正常组织与结肠腺癌中参与三羧酸循环与一碳代谢的差异表达基因
结肠癌是一种临床上常见的消化道恶性肿瘤,其致死率居恶性肿瘤的第二位,其 中结肠腺癌(COAD)是结直肠癌最常见的病理学类型。任何生命活动都与代谢密切相 关,而细胞代谢的重编程是最早发现的癌症标志之一。癌细胞重新连接新陈代谢,以 满足肿瘤的生物能量、生物合成和氧化还原需求。反过来,这些代谢适应产生了癌症 特异性的弱点,可以作为治疗靶向。三羧酸循环与一碳代谢是体内两条重要的代谢途 径,与其他代谢途径密切相关。本次研究首先利用公共数据库 TCGA 指导下的生物 信息学分析,寻找正常组织与结肠腺癌中参与三羧酸循环与一碳代谢途径的差异表达基因。
1 材料与方法
1.2 参与三羧酸循环和一碳代谢基因的提取
从GSEA 网站下载了c2.cp.kegg.v7.2 符号文件来寻找参与三羧酸循环和一碳代谢 途径的基因。从表达矩阵中提取三羧酸循环和一碳代谢途径基因的表达水平,共提取了 47 个基因。
1.3 差异表达式分析
使用 R 语言 limma 软件包对 TCGA 数据进行了差异表达分析。对肿瘤和非肿瘤 样本进行比较,采用 FDR<0.05 和|logFC|>0.6 的截断值筛选差异表达基因(DEGs)。据 此,筛选出了肿瘤和非肿瘤样本中参与三羧酸循环和一碳代谢的差异表达基因。然后用 R 语言绘制热图和火山图。
1.5 统计学方法
采用 SPSS20.0 进行统计学分析,采用 t 检验和 Pearson 卡方检验用于确定组间 均值和比例的差异。采用 Cox 比例风险模型进行单因素和多因素分析、受试者工作 特征(ROC)曲线分析。所有分析均使用统计软件 R 语言和 EmpoworStats , P < 0.05被认为具有统计学意义。
2 结果
2. 1 在 TCGA 数据集中三羧酸循环和一碳代谢途径中差异表达基因(DEGs)的筛选
2.1. 1 从基因表达矩阵中提取了三羧酸循环和一碳代谢途径基因的表达水平。我们使 用 FDR<0.05 和|logFC|>0.6 的截断值分析了正常组和肿瘤组之间的差异。共筛选出了 18 个不同的基因(表 1)。
表 1 肿瘤和正常组织之间三羧酸循环和一碳代谢通路中的 18 个差异表达基因(DEGs)
2.1.2 用 R 语言绘制热图(图 1)和火山图(图 2)显示,有 6 个上调基因,12 个下调基因。
图 1. COAD 中 DEGs 的热图。从红色到绿色,基因的表达量逐渐下降
N:正常;T:肿瘤
图 2.COAD 中 DEGs 的火山图。绿色代表下调基因,红色代表上调基因
2.2 研究参与者的特征分析
共分析了 417 份样本,其中肿瘤样本 379 例,正常样本 38 份。表 2 显示了研 究参与者的主要基线特征。筛选出年龄、性别、肿瘤分期、TNM 分类和差异基因 等变量 。将可变肿瘤特征进行柱分层分析 。结果显示 ,正常组与肿瘤组的SUCLG2P2 、ACO2 基因及临床病理分期存在差异。
..........略