2024-08-04 05:47

人工智能发现了隐藏在“垃圾”DNA中的癌症驱动因素

来自加文医学研究所的研究表明,非编码DNA,占我们基因组的98%,以前被认为是“垃圾”,可能在癌症的诊断和治疗中起着至关重要的作用。研究发现,这些区域的突变与12种不同的癌症类型有关。这些突变发生在CTCF蛋白的结合位点,这对维持基因组的三维结构至关重要。这些位点的破坏可能导致癌症的发展。研究结果表明,针对各种癌症的这些常见突变,可能有一种通用的癌症治疗方法。

加文研究所的研究人员利用人工智能识别DNA“垃圾”区域内潜在的致癌元素,为创新的诊断和治疗方法铺平了道路。

根据加文医学研究所的一项新研究,非编码dna——占我们基因组的98%,不包含制造蛋白质的指令——可能是新的癌症诊断和治疗的关键。发表在《核酸研究》(Nucleic Acids Research)杂志上的这一发现揭示了之前被忽视的基因组区域的突变,这些突变可能导致至少12种不同癌症的形成和发展,包括前列腺癌、乳腺癌和结直肠癌。

这一发现可能会导致早期诊断和对许多癌症类型有效的新疗法。

“非编码DNA曾因其明显缺乏功能而被视为‘垃圾DNA’,”加文研究所的研究官员、该研究的共同通讯作者阿曼达·库利博士说。“我们的研究发现了这些DNA区域的突变,这可能为癌症治疗开辟一种全新的、通用的方法。”

可见人类乳腺癌细胞(蓝色)的DNA损伤(绿色)。资料来源:加文研究所

研究癌症中被破坏的DNA“锚”

研究人员关注的是影响一种叫做CTCF的蛋白质结合位点的突变,这种蛋白质有助于将长链DNA折叠成特定形状。在他们之前的工作中,他们发现这些结合位点将DNA的遥远部分紧密结合在一起,形成3D结构,控制哪些基因被打开或关闭。

Khoury博士说:“我们已经确定了CTCF结合位点的一个子集,它们是‘持久的’——也就是说,它们就像基因组中的锚一样,存在于不同的细胞类型中。”“我们假设,如果这些锚出现故障,它可能会破坏基因组的正常3D组织,并导致癌症。”

为了验证这一点,研究人员开发了一种名为CTCF- insite的新型复杂机器学习(ai)工具,该工具使用基因组和表观基因组特征来预测哪些CTCF位点可能是总共12种癌症类型的持久锚点。然后,他们评估了来自国际基因组联盟数据库中诊断为12种癌症类型的患者的3000多个肿瘤样本,发现持久锚富含突变。

Amanda Khoury博士和Susan Clark教授来自澳大利亚悉尼加文医学研究所。资料来源:加文研究所

该研究的第一作者陈文汉博士说:“使用我们的机器学习工具,我们在12种不同的癌症类型中发现了持久性CTCF结合位点。”“值得注意的是,我们发现每个癌症样本在一个持久性CTCF结合位点上至少有一个突变。”

“这项研究证实,持久性CTCF结合位点是癌症中的‘突变热点’。我们认为这些突变使癌细胞具有生存优势,使它们能够增殖和扩散,”Khoury博士补充说。

走向一种通用的癌症治疗方法

这一发现可能对理解和治疗多种类型的癌症具有广泛的意义。“大多数新的癌症治疗必须谨慎地针对特定的突变,而这些突变在不同的肿瘤类型中并不总是常见的,但是因为这些CTCF锚点在多种不同的癌症类型中发生突变,我们正在开辟开发对多种癌症有效的方法的可能性,”加文癌症表观遗传学实验室负责人、该研究的主要作者苏珊克拉克教授说。

研究人员现在正计划使用CRISPR基因编辑进行进一步的大规模实验,以研究这些锚定突变如何破坏3D基因组并潜在地促进癌症生长。

克拉克教授说:“现在我们已经发现了我们认为是基因组的关键锚点,并表明它们对维持基因组结构的内稳态很重要,这些非编码DNA突变会破坏癌细胞中的内稳态,这是有意义的——当我们编辑它们时,我们将对这个假设进行测试。”“观察下游影响,我们希望确定受突变影响的关键基因或基因途径,这可以作为早期癌症检测的标志或新治疗的目标。”

她说:“发现这些隐藏在大量数据中的线索,是人工智能如何促进医学研究的一个有力例子。”“这是癌症研究的一个全新领域,我们很高兴能进一步探索它。”

参考文献:Wenhan Chen, Yi C Zeng, Joanna Achinger-Kawecka, Elyssa Campbell, Alicia K Jones, Alastair G Stewart, Amanda Khoury和Susan J Clark, 2024年7月2日,《核酸研究》,“机器学习使CTCF结合位点突变热点的泛癌鉴定成为可能”。DOI: 10.1093 / nar / gkae530

这项研究得到了国家卫生和医学研究委员会的资助和研究者资助。