对于一小部分癌症患者,医生无法确定癌症发生的原位。这使得为这些患者选择治疗变得更加困难,因为许多癌症药物通常是为特定类型的癌症开发的。

麻省理工学院和丹娜-法伯癌症研究所的研究人员开发了一种新方法,可以使用机器学习更容易地确定那些神秘癌症的发源地。研究人员使用机器学习创建了一个计算模型,可以分析约400个基因的序列,并利用这些信息来预测肿瘤在身体中的起源。

使用这个模型,研究人员展示了他们能够准确分类至少40%的未知原位肿瘤,这些肿瘤的患者数量约为900人。这种方法使得根据癌症的起源为基础的基因组引导定向治疗的患者人数增加了2.2倍。

该研究的第一作者、麻省理工学院电气工程和计算机科学专业的研究生Intae Moon表示:“我们论文中最重要的发现是,这个模型有可能被用于辅助治疗决策,引导医生为原发性位置不明癌症患者提供个性化治疗。”

哈佛医学院和丹娜-法伯癌症研究所的医学副教授Alexander Gusev是这篇发表在《自然医学》杂志上的论文的高级作者。

在3%到5%的癌症患者中,特别是在肿瘤已经扩散到全身的情况下,肿瘤科医生很难确定癌症的原位。这些肿瘤被归类为原发性位置不明的癌症(CUP)。

这种缺乏知识通常阻碍医生能够给患者提供“精准”药物,这些药物通常是针对已知有效的特定癌症类型而批准的。这些定向治疗往往比用于广泛癌症谱系的治疗方法更有效,并且副作用更少,而这些方法通常被用于CUP患者。

Gusev表示:“每年有相当数量的人患上这些原发性位置不明的癌症,由于大多数治疗方法是以特定的原发部位为基础批准的,而你必须知道原发部位才能使用它们,因此他们的治疗选择非常有限。”

Moon决定分析丹娜-法伯经常收集的遗传数据,看看它是否可以用来预测癌症类型。这些数据包括癌症中常发生变异的约400个基因的遗传序列。

研究人员从近30000名被诊断出患有22种已知癌症类型之一的患者的数据中训练了一个机器学习模型。这组数据包括来自Memorial Sloan Kettering癌症中心和Vanderbilt-Ingram癌症中心以及丹娜-法伯癌症研究所的患者。

然后,研究人员在其从未见过的约7000个已知原位的肿瘤上测试了该模型。研究人员称其为OncoNPC的模型能够以约80%的准确率预测肿瘤的起源。对于高置信度预测的肿瘤,其准确率可上升至约95%。

在这些令人鼓舞的结果之后,研究人员使用该模型分析了来自丹娜-法伯癌症研究所的约900个CUP患者的肿瘤。他们发现,对于这些肿瘤中的40%,该模型能够进行高置信度的预测。

研究人员随后将该模型的预测结果与获得数据的一部分肿瘤的生存时间进行了比较,这些数据可以揭示患者是否具有发展特定类型癌症的遗传倾向。研究人员发现,该模型的预测结果更可能与遗传突变最强烈预测的癌症类型相匹配,而不是其他任何类型的癌症。

研究人员还比较了CUP患者接受的治疗类型与模型预测的癌症类型的数据。约10%的这些患者接受了基于他们的肿瘤原位的肿瘤科医生最佳猜测的定向治疗。在这些患者中,接受与模型预测的癌症类型一致的治疗的患者表现比接受通常用于与模型预测的癌症类型不同的其他类型癌症的治疗的患者更好。

研究人员现在希望扩展他们的模型,包括其他类型的数据,例如病理学和放射学图像,以提供更全面的预测,并使用多种数据模态。这也将为模型提供肿瘤的全面视角,让它不仅能预测肿瘤类型和患者预后,甚至能预测最佳治疗方法。

本文译自 medicalxpress,由 BALI 编辑发布。

[ 广告 ]
赞一个 (6)

PREV :
NEXT :