CAS Authentication wanted! 放射组学与人工智能

发表时间：2023-07-04 15:01:04

CAS Authentication wanted!

CASAuthenticationwanted!

YoushouldalreadyhavebeenredirectedtotheCASserver.Clickheretocontinue.

phpCAS1.3.1usingserverhttps://www.medlive.cn/auth/(CAS2.0)

放射学中基于影像组学和人工智能预测癌症预后

人工智能（AI）在医学影像诊断中的成功应用使得基于人工智能的癌症成像分析技术开始应用于解决其他更复杂的临床需求。从这个角度出发，我们讨论了基于人工智能利用影像图像解决临床问题的新挑战，如预测多种癌症的预后、预测对各种治疗方式的反应、区分良性治疗混杂因素与进展，肿瘤异常反应的识别以及突变和分子特征的预测等。我们综述了人工智能技术在肿瘤成像中的发展和机遇，重点介绍了基于人工的影像组学方法和基于深度学习的方法，并举例说明了它们在决策支持中的应用。我们还解决了临床应用过程中面临的挑战，包括数据整理和标注、可解释性以及市场监管和报销问题。我们希望通过帮助临床医生理解人工智能的局限性和挑战，以及它作为癌症临床决策支持工具所能提供的机会，为他们揭开影像组学人工智能的神秘面纱。

在过去的十年中，计算能力和内存的急剧增长使得影像图像处理最先进的人工智能（AI）技术得以发展和实现。目前，我们正目睹这一领域的热情日益高涨，尤其是在肿瘤成像领域。尽管计算机方法自20世纪60年代以来已被用于影像学，早期的研究结果并没有获得太多的动力，因为它们依赖于模拟图像采集和有限的计算资源。在20世纪80年代，数字成像方法的出现以及计算体系结构和存储的改进重新引起了人们对这些计算机辅助检测（CAD）技术的兴趣。人工智能在乳腺癌检测中的初步成功为人工智能方法在肿瘤分类和癌症检测等诊断任务中更广泛的应用铺平了道路。在过去的十年中，基于人工智能的诊断工具得到了不断的改进，并且在许多病例中，他们的诊断能力已经被证明与多种不同癌症类型的人类专家相当，甚至超过他们。这一成功使得人工智能方法目前正在不断发展，以帮助解决更复杂的决策任务，如疾病预测、对不同治疗方式反应的预测、治疗相关变化的识别以及发现与预后相关的表型（例如，性别、年龄或种族）和基因型特征的影像学表现。

从这个角度来看，我们专门关注基于人工智能的影像学生物标记物，以预测疾病结果和治疗反应，最终目标是提供个性化管理。我们的目标是让对人工智能方法感兴趣的临床医生掌握当前用于预后预测的新工具、了解这些方法是如何发展的，特别是不同图像类型可用于人工智能的哪种表示法（影像组学或深度学习（DL））。我们讨论了人工智能在影像学中的临床意义，即根据疾病严重程度和预后对患者进行分级，预测治疗反应，识别不利的治疗结果（例如，超进展），从真实的疾病进展中区分混杂反应（例如假进展），非侵入性地预测显著的分子和基因型特征。

首先，我们定义了人工智能成像生物标记物及其用途，并将其与肿瘤学中现有的生物标记物进行对比。然后，我们将重点放在人工智能成像生物标记物的总体框架上，讨论常用方法的技术基础。我们描述了复杂决策任务中常见的人工智能工具，提供了这些人工智能方法如何用于常见癌症类型的示例。最后，我们总结了临床采用这些方法过程中的一些挑战和障碍，并讨论了未来在肿瘤实践中的影响。本文发表在NatureReviewsClinicalOncology杂志。

1.基于AI的癌症生物标记物成像

生物标记物是“作为生物正常生理过程、致病过程、或对暴露或干预（包括治疗干预）生物反应的指标测量所定义的一种特征”。根据他们可以告知临床决策的类型，生物标记物可分为几类：在肿瘤学中，生物标记物的应用范围从预防（如癌症易感性或风险的生物标记物）到指导临床决策，其中预后和预测性生物标记物是最具临床相关性的。

预后生物标志物传达与疾病风险相关的信息。在肿瘤学中，预后生物标志物常用于根据肿瘤特征确定癌症患者的风险状况。这一方法使临床医生能够诊断预后不良的患者，这些患者可能在治疗或临床试验过程中进一步恶化。相反，如果预先确定，预后良好的患者可能会在降级治疗中获得良好的结果，从而避免癌症治疗的生理损害和经济损失。目前在肿瘤学中使用的大多数预后生物标记物是依赖于复杂多基因特征的分子分析，如乳腺癌中的肿瘤型DX和MammaPrint13和前列腺癌中的Decipher。这些基因组分析包括在国家综合癌症网络（NCCN）指南中，并在临床实践中常规使用；然而，它们不易获得，并且需要通过侵入性方法获得肿瘤组织，因此限制了它们在整个治疗过程中连续监测的可用性和适用性。

预测性生物标记物使临床医生能够通过识别将受益于特定治疗药物的患者，做出知情的方法选择。在肿瘤学中，如果生物标志物阳性与阴性患者的治疗效果存在统计学差异，则认为生物标志物具有预测性。例如，在乳腺，胃和食管等癌症中，HER2状态可作为预测HER2靶向治疗（如曲妥珠单抗和培妥单抗）有效性的生物标志物。在非小细胞肺癌（NSCLC）中，EGFR外显子19缺失或外显子21突变的存在可作为EGFR酪氨酸激酶抑制剂（如奥西米替尼或厄洛替尼）治疗资格的生物标志物。除了预后外，肿瘤型DX也是一种预测性生物标记物，在一项前瞻性临床试验中得到验证，以确定早期乳腺癌妇女化疗的益处。

人工智能驱动的计算机视觉和模式识别技术的快速发展促进了人工智能成像生物标志物的出现。这些生物标记物依赖于从影像图像中提取识别性定量表征，以捕获与临床结果相关的肿瘤表型特性。放射学中有两类主要的基于人工智能的生物标记物：基于人工获得的影像学特征和基于深度学习方法获得的深度影像组学特征（表1）。人工智能开发团队（包括计算机科学家、放射科医生和肿瘤学家）通过人工手动提取获得的影像组学预定义了一组表征，这些表征由特定的算法推导的特征组成。然后将这些特征表示输入机器学习（ML）模型，该模型反过来预测结果。一些常用的影像组学方法主要关注肿瘤内部区域的各种属性（如形状或纹理）以及肿瘤微环境（TME；如纹理或肿瘤脉管系统）（表2）。可公开获得的影像组学特征提取工具使研究人员能够应用这些工具获得影像组学特征，而无需自行开发这些工具。在DL（深度学习）方法中，开发团队定义了一个DL神经网络，该网络可以使用大型数据集进行训练，以发现新的表示形式，这些表示形式可以合成以预测特定的结果。这些方法具有各自的优势和劣势，因此需根据不同的情况采用不同的方法（图1）。

表1：基于人工提取特征的影像组学和深度学习预后与预测比较

特征影像组学深度学习数据要求通常需要较少的带注释的训练数据通常需要大量的图像数据集进行训练；这种需求可以通过迁移学习和扩充等技术来降低图像表示通常预定义；可以从领域无关特性列表中选择，也可以围绕领域知识设计新特性涉及基于模式识别提取的可训练卷积运算学习的新的特征表示预测方法结合影像组学特征的ML模型被训练用于预测癌症结果和治疗反应预测模型可以与学习特征表示同时训练标注通常需要精确描绘肿瘤边界和其他感兴趣的组织以进行特征提取如果有足够的训练数据，模型可以通过疗程定位进行训练，甚至不需要任何位置信息解释性预测可归因于ML模型中包含的单个测量值在解释影响预测的因素方面存在挑战，因此这些方法往往被视为“黑箱”方法；可以与解释性方法（如类激活映射）相结合，提供对模型决策的解释资源开发通常，由于模型参数的数量和训练数据集的大小较小，因此模型训练和推理在计算上并不昂贵在计算上往往比影像组学更昂贵；通常需要一个或多个图形处理单元

图1，影像组学中人工智能生物标志物流程图。

基于影像组学和深度学习方法开发人工智能（AI）影像学生物标记物的典型方案及其临床应用。这两种方法都可以应用于癌症预后预测和生物标记物发现，以评估对治疗、预测和放射基因组学的反应。

基于人工智能的预测或预后成像生物标记物比分子分析具有某些优势。考虑到它们是通过常规临床放射学扫描进行评估的，AI启用的成像生物标记物是非侵入性、非组织破坏性、快速分析、易于序列化、易于获得并且与现有的临床工作流程完全兼容的，类似于基于AI的病理学生物标记物，具有非侵入性的优势。此外，它们还能够在整个3D体积上描述肿瘤的特征，避免异质性肿瘤活检样本可能出现的采样错误，并能够检测TME的变化。由于相对于分子检测具有很大的优势，另一类能够反映肿瘤基因型的人工智能生物标记物已经被研究出来，这种方法被称为放射基因组学。预测肿瘤突变状态的放射基因组学方法可能成为替代已建立的分子生物标记物的非侵入性生物标记物，并可应用于常规成像。这种方法类似于循环肿瘤DNA液体活组织检查方法，这种方法被开发为癌症监测的微创工具。这种测试也可以用于连续检测治疗开始后肿瘤主要基因型的变化，这是导致对靶向治疗产生耐药性的原因，并且这不能通过侵入性分子测试进行准确监测。然而，目前，放射基因组学方法有一些局限性，包括包含图像的综合数据集，基因组学和临床信息的整合以及仅限于回顾性研究，因此目前它们仅限于用于理论研究背景。事实上，在临床应用之前，这些技术需要进一步优化和前瞻性验证。

2.基于人工智能的生物标志物的框架

目前有两种主要的人工智能方法用于开发影像学中的人工智能生物标记物：影像组学和深度学习（表1）。这些方法可以单独使用也可以结合使用。

2.1基于人工的影像组学模型

几个影像组学模型已被证明实现有效的结果预测（图2,表2）。这些表示可以转化为预后或预测模型；通常，使用一组特征对ML模型进行训练。这一过程中常见的第一步是特征选择，通过算法将大量特征缩小到最适合特定任务的较小特征子集。特征选择可以用来优化预测性能、降低特征集内的相关性或实现最大化鲁棒性和稳定性。然后将这种简化的特征表示输入统计ML模型（例如，随机森林分类器）以预测临床结果。

表2,肿瘤中人工手动提取的影像组学特征概述

特征种类特征常见例子基于强度与一阶统计量完全定量模式的直接物理或功能测量，以及表征区域内强度值分布特征的基本统计测量图像强度值的平均值、中值、标准偏差、偏度和峰度，CT上的衰减值，FDG-PET上的最大标准化摄取值异质性与结构图像强度值的空间排列特征和局部异质性灰度共生矩阵，灰度游程矩阵，局部二元模式，Gabor小波，定律能量测度形状与体积二维或三维肿瘤形态测量体积，表面体积比，球形度，紧密度，分形维数瘤周影像组学通过影像组学特征（如纹理）对TME进行表征肿瘤周围肿瘤周围桡骨的结构异质性，间质，淋巴结，潜在转移部位肿瘤血管影像组学测量肿瘤相关血管系统的功能或形状血管曲度和结构组织，肿瘤血管的动力学和结构测量

图2，肿瘤中常用的影像组学特征类型示例。

a,CT检测肝转移病灶的灰度共生矩阵熵;

b,在钆增强T1加权MRI上发现的胶质母细胞瘤的形状；

c,使用对比增强MRI测量乳腺组织中对比增强随时间变化的动力学；

d，瘤周影像组学测量非小细胞癌周围肺间质的结构异质性；

e,对比增强MRI检测乳腺血管系统和肿瘤相关血管网络的形态;

f2-脱氧-2-18F-氟-d-葡萄糖PET-CT扫描的标准化摄取值增强，显示头颈癌的代谢活动增强。

基于强度的特征

在许多情况下，基于图像强度的值对应于组织的某些潜在生理特性，可以在影像学治疗方法中加以应用。例如，CT扫描得出的衰减值直接对应于组织密度，这些值可用于开发预后生物标志物或肿瘤表型。2-脱氧-218F-氟-d-葡萄糖（FDG）-PET扫描的类似生理测量方法，能够基于代谢放射性示踪剂的正电子发射定量肿瘤代谢活性，在早期预测多种癌症类型和患者治疗的预后方面非常有效。体素强度在肿瘤或其他感兴趣区域的分布可以通过更广泛的统计度量（如标准偏差、偏度或峰度）进一步表征，通常称为一阶统计。

异质性和纹理特征

肿瘤的异质性可以通过使用纹理异质性特征的影像学成像来量化，包括确定感兴趣区域内图像体素强度之间的空间关系。统计学方法，如标准偏差，可以提供成像信号可变性，在整个感兴趣区域（在本例中，是整个肿瘤）都使用。相比之下，纹理特征将体素与其周围环境之间的关系量化为距离和强度的函数。因此，纹理特征可能更适合在成像时检测组织结构的异质性。

放射学上的信号测量通常对应于组织的某些物理或生物特性，因此成像上强度变化较大的空间模式通常反映了组织本身潜在的解剖或生理异质性。例如，强度交互特征通常用于探索相邻体素强度之间的相关模式，例如灰度共生矩阵特征。其他种类的纹理特征包括应用目标图像过滤器来分离可能与患者预后相关的空间模式。例如基于laws’纹理能量测度算法对特定纹理图案（例如斑点和波浪）进行筛选。

形状和体积特征

在治疗过程中测量肿瘤大小是肿瘤学的标准方法，通常使用实体瘤的疗效评估标准（RECIST）进行评估。此方法用来评价纵向成像的患者反应。收集有限数量的2D肿瘤测量值，并在检查之间进行比较，以评估肿瘤是否稳定、进展或有反应。然而，放射科医生之间的RECIST测量值可能存在很大差异，并且该标准不适合某些治疗方案，例如识别免疫治疗后的假性进展或监测转移癌患者对系统治疗的反应。影像组学的形状特征是指表征感兴趣组织形状的任何特征，能够对肿瘤的三维形状和生长进行更复杂的分析，其再现性高于放射学图像的临床评估。前瞻性试验表明，在多种癌症类型的纵向监测中，治疗过程中肿瘤体积或肿瘤体积的变化优于平面RECIST评估。更复杂的形态学测量，如表面体积比和分形维数，提供了肿瘤形状和生长畸变的详细特征。通常，肿瘤形状的复杂性增加与不良预后相关。

瘤周和肿瘤微环境（TME）的影像组学

越来越多的影像组学工作探索了在肿瘤以外的影像组学特征，以表征周围肿瘤微环境。TME影像组学方法通常涉及其他影像组学特征来表征信号特性，如非肿瘤间质内的异质性。瘤周影像组学，提取肿瘤周围组织半径范围内的纹理和统计学特征，已被证明在胸部，肺，大脑，食管，胃泌素和前列腺癌，头颈部鳞状细胞癌（HNSCC）等许多治疗背景下具有预测和预后价值。肿瘤周围区域的分析增加了放射特征对肿瘤内影像组学特征的预测能力。专注于肿瘤相关血管系统的专门肿瘤微环境影像组学方法也显示出越来越大的前景，下文将对此进行讨论。

肿瘤血管影像组学

基于形状的影像组学分析也可用于量化肿瘤相关血管系统的结构异常和肿瘤血管生成的影响。血管迂曲是测量肿瘤相关血管系统异常的一类形状特征，在预测乳腺癌或恶性胶质瘤患者对化疗的反应以及乳腺癌脑转移患者对靶向药物的反应方面显示出了前景。血管迂曲度的测量也被证明能够识别接受免疫检查点抑制剂（ICIs）后可能出现超进展的NSCLC患者。这种非典型反应模式的特点是ICIs后肿瘤生长异常加速，需要立即停止治疗。

2.2深度学习人工智能模型

DL方法基于深度神经网络进行模式识别，模式识别通常包括一系列可训练的非线性操作，称为层，每个层将输入数据转换为便于模式识别的表示。随着越来越多的层对输入数据应用转换，这些数据越来越多地抽象为深层特征表示。由此产生的深层特征最终可以由网络的最后一层转化为所需的输出，例如治疗结果的可能性或肿瘤的分子亚型。深度学习是一个广泛的、技术性的、动态发展的领域。我们简要介绍了基于预测的AI影像学中最常见的主题，并对深层神经网络的类型、常用框架、解决数据局限性的方法进行了更详细的补充讨论。所有这些问题在别的研究中都有综述。

用于预测的卷积神经网络

在放射学中，大多数基于DL的生物标记物应用都使用卷积神经网络从成像数据得出预测（图3a）。卷积神经网络是神经网络的一种特殊形式，用于学习图像的空间特征，并且由于它们在诊断任务中的表现，受到了广泛的关注。在几项引人注目的研究中，基于CNN的模型在诊断胸片和CT以及数字乳房X光摄影方面甚至超过了专业的人类专家。正如CNN已被证明能够学习指示恶性肿瘤的图像特征一样，越来越多的研究表明，它们可以根据与预后、风险和分子特征相关的肿瘤性质的细微差异对患者进行分型（图3a）。当使用患者结果数据进行训练时，CNN的卷积层可以学会识别反映预后的新成像表型。CNN可以应用于2D或3D输入，并且可以使用多个输入，以便从图像类型的组合中学习，例如多参数或动态MRI扫描。大量的CNN结构可以选择来用于基于AI的生物标记物研究（补充表2）。补充框2中进一步详细讨论了它们的原理和优势。

用于放射学的其他神经网络

全卷积神经网络（FCNs）（图3b）是一种用于图像输出的卷积神经网络。FCN可用于绘制图像中肿瘤的边界，以便进行影像组学分析（称为分割的过程）或在数据受到限制（例如通过训练卷积自动编码器）情况下进行无监督的特征学习。同样，完全连接的网络（图3c）是没有卷积层的神经网络，可以根据各种测量结果如放射特征）进行预测。其他种类的神经网络可与CNN结合，以处理随时间收集的多组数据，从而实现成像数据的纵向分析（例如，用于响应评估）。补充框1更深入地讨论了这些变化和其他变化。

深度学习模型的训练

神经网络通过训练数据集的子集（称为批次,batch）进行迭代更新来训练深度学习模型。对于每个批次，神经网络首先根据成像数据生成患者结果的预测。然后通过损失函数将这些预测与相应的实际治疗结果进行比较，损失函数是一个衡量网络输出误差性的方程。然后，使用从损失函数获得的值来更新网络层（图1），从而找到使得网络模型表现最差的样本。第二组患者数据（称为调整数据集）用于监测性能，同时在将模型应用于独立数据集（称为测试或外部验证数据集）之前，对模型的配置和学习过程进行训练和优化。

训练神经网络通常需要的数据量远远大于训练影像组学模型所需的数据量。所有机器学习模型都由一组参数定义，这些参数是指定算法所有可能配置的变量。增加模型中的参数数量可以扩大它可以发现的可能解决方案的范围，但是与简单的模型相比，有效学习所需的数据量也会更大。最先进的CNN架构包含数百万个参数，以便直接从原始数据中发现新的预后表示。相比之下，影像组学将预测问题限制在有限的预先指定的特征中，这些特征组合在一个参数较少的统计模型中（通常是几十到几百个）。

图3，常用于医学成像数据的神经网络的构造块和类型。

A，用于预测的卷积神经网络（CNN）模型示例。输入图像或体积通过CNN层，CNN层执行操作并将其转换为目标输出向量。卷积层是将成像数据转换为深度特征表示的一组操作。每个过滤器通过图像，并与非线性激活函数配对，以强调特定任务感兴趣的视觉模式。随着更多的卷积层层叠，CNN可以在图像中学习到更复杂的视觉模式。在整个CNN分类器中，深度特征通过池化操作定期聚合。经过卷积层和池化层处理后，深度特征表示最终被展平为向量。接下来，完全连接的层将这些CNN衍生的图像特征转换为对应于目标输出的向量。这些模型可用于预测治疗反应、预测、肿瘤亚型和生物标志物的分类以及生理值的预测。

B,全卷积神经网络是一种CNN类型，只包含产生图像输出的卷积层，如肿瘤位置图。

C,完全连接的网络可以根据非图像数据进行训练，如影像组学特征和临床变量。

当对模型进行结果预测训练时，对大量数据的需求可能会存在局限性，在这种情况下，可行的患者数据可能比诊断研究更加有限。幸运的是，尽管训练数据很少，但有几种方法可以利用神经网络的优势。例如，迁移学习，其中针对一个模式识别任务训练的模型被重新调整用途以执行新任务，经常用于在训练数据大幅减少的情况下实现强大的CNN性能。其他方法可用于处理有限或有缺陷的训练数据（补充图1）。

3.风险评估和反应预测

3.1预后方法

肺癌。

大多数肺癌的影像组学方法都集中在非小细胞肺癌上。Huang等人是首次使用基于纹理的人工影像组学建立预后诺模图来预测I-II期NSCLC患者无病生存率（DFS）的课题组。有趣的是，他们显示肿瘤内部的一阶统计特征（例如峰度）是肿瘤异质性和3年无病生存率的显著特征，以及它们与常规临床病理数据（如性别和组织学分级）的结合优于肿瘤、淋巴结、转移（TNM）单独分期标准（C指数0.72（95%可信区间0.71–0.73）与0.63（95%可信区间0.62–0.64））。Kamran等人利用有限期小细胞肺癌患者的CT扫描构建影像组学模型，预测2年总生存率（OS）、局部复发和远处转移。他们观察到影像组学上的放射肿瘤扩散与局部复发（HR1.10；P=0.003）和2年生存期（HR1.10；P=0.03）密切相关。Pavic等利用间皮瘤患者的FDG-PET图像建立了一个影像组学模型，以无进展生存率（PFS）和OS为基础对其进行分层。其中长行程高灰度优势(Long-RunHigh-Grey-LevelEmphasis)具有显著的鉴别能力，这反映了PET扫描中标准化摄取值（SUV）的肿瘤内异质性。PFS的C指数为0。66（95%可信区间0.57-0.78）。然而，使用相同患者的CT扫描建立的影像组学模型对结果预测没有辨别力。这项研究值得被强调，因为研究人员在最先进的FDG-PET和CT扫描上应用了新的影像方法来预测间皮瘤（一种罕见的癌症类型）的预后。

在DL领域，Hosny等人使用CT数据训练3DCNN预测放疗后2年的生存率，然后采用该模型基于迁移学习预测手术后的生存率，曲线下面积（AUC）为0.71（95%可信区间0.60-0.82）。这项研究之所以独特，有几个原因：首先，研究人员使用了七个独立的数据集，涉及来自五个不同机构的约1200名患者；其次，基因组关联研究揭示了DL特征表达与细胞周期和转录过程的相关性，提供了生物学解释；第三，肿瘤周围区域的DL特征具有最高的预后信号。

乳腺癌

Park等人训练了一个弹性生存模型，将浸润性乳腺癌患者术前MRI扫描所得的影像组学强度、纹理和形态特征与放射组学所得的预后评分相结合；在测试数据集中，分数越高，无病生存率越差（P=0.0036）。研究人员不仅构建了一种用于乳腺癌预测的影像组学方法，还建立了一种结合影像组学和临床病理学特征的诺模图，用于综合无病生存率的估计，其表现优于单独基于每类特征的得分。Wu等人在对比增强MRI上确定了肿瘤内环境中对应于不同灌注水平的亚区，并通过网络分析量化了这些亚区之间的相互作用。在多变量分析中，显示灌注不良区域丰度和分布的影像组学特征可预测无复发生存率（RFS），调整临床变量，如年龄、体积、受体状态和病理反应。

然而，预后不良的肿瘤在乳腺MRI扫描中灌注不良区域的比例高于惰性肿瘤。另一组利用动态对比增强（DCE）MRI扫描技术，从参与完整临床试验的早期乳腺癌患者身上获得影像组学特征。这些特征独立预测腋窝淋巴结转移和3年无病生存率。这些研究者不仅从肿瘤内和瘤周区域提取影像组学特征，而且从前哨淋巴结和非前哨淋巴结提取影像组学特征。研究表明，腋窝淋巴结的影像组学特征在预后表现上与单独肿瘤影像组学特征或与淋巴结影像组学特征相结合的表现相当。Chitalia等人利用参与完整临床试验的患者的影像学和结果数据，通过预处理DCE-MRI扫描的影像组学特征聚类，形成影像学表型。该特征也在公开可用的数据集上成功验证。这些研究人员表明，AI可以揭示潜在的内在成像表型，对应于不同程度的肿瘤异质性，这反过来可能与组织学上分化较差的肿瘤和较高的有丝分裂分级有关。Drukker等人采用长-短期记忆DL模型，该模型是根据与新辅助化疗期间动态乳腺MRI扫描对比增强动力学相关的影像组学特征构建，该模型预测了两年无复发生存率，C指数为0.8.这项研究的独特之处在于使用了递归神经网络（RNN），这是DL网络的一个特殊类别，它使用来自不同时间点的图像的特征进行集成和学习。

脑肿瘤

大多数关于脑肿瘤的影像组学学人工智能研究集中在胶质母细胞瘤上，胶质母细胞瘤是一种脑肿瘤类型，与严重的不良后果相关。Kickingereder等人基于人工提取特征构建的影像组学模型，结合多参数MRI扫描的体积、形状和纹理特征，并使用监督主成分分析预测胶质母细胞瘤患者的无复发生存率（HR2.43；P=0.002）和总生存率（HR4.33；P

免疫组学与人工智能

前言

免疫疗法的巨大进展改变了目前癌症治疗的模式，然而，鉴于只有少数患者对免疫检查点阻断和其他免疫治疗策略有响应，因此需要更多新技术来破译肿瘤细胞与肿瘤免疫微环境（TME）成分之间复杂的相互作用。

肿瘤免疫组学是指利用免疫基因组学、免疫蛋白质组学、免疫生物信息学等反映肿瘤免疫状态的多组学数据对TME进行的综合研究，它依赖于下一代测序技术的快速发展。高通量基因组和转录组数据可用于计算免疫细胞的丰度和预测肿瘤抗原，然而，由于批量测序代表了异质细胞群的平均特征，因此无法区分不同的细胞亚型。基于单细胞的技术能够通过精确的免疫细胞亚群和空间结构研究更好地解析TME。此外，基于放射组学和数字病理学的深度学习模型在很大程度上有助于肿瘤免疫的研究，这些人工智能技术在预测免疫治疗反应方面表现良好。这些新技术的进展和突破对癌症治疗具有深远意义。

肿瘤免疫微环境

在过去几年中对肿瘤免疫的研究进展，使我们对肿瘤的认识发生了根本的改变。肿瘤的定义也从单纯的肿瘤细胞聚集演变为一个复杂的器官样结构，由肿瘤细胞、免疫细胞、成纤维细胞、血管内皮细胞和周围的其他基质细胞组成。肿瘤附近的各种细胞和成分，如免疫浸润细胞、血管，细胞外基质等构成的结构，也称为肿瘤免疫微环境，已成为肿瘤学最热门的研究课题之一。TME已被证明在癌症发生、肿瘤进展、转移和复发中起着决定性的作用。

TME包含了极其多样的免疫细胞亚群，包括T淋巴细胞、B淋巴细胞、自然杀伤（NK）细胞、巨噬细胞、树突状细胞（DC）、粒细胞和髓源性抑制细胞（MDSCs）等。通常，T细胞、B细胞、NK细胞和巨噬细胞有助于抑制肿瘤生长，而MDSC和调节性T细胞（Treg）倾向于抑制抗肿瘤免疫。然而，现有研究已经证实，鉴于与肿瘤细胞的复杂相互作用，免疫细胞的特定作用可能会发生动态变化，甚至变得完全相反。

总之，各种各样的免疫细胞类型，甚至特定免疫细胞类型的不同功能状态都可能对抗肿瘤免疫产生截然相反的效果。因此，这就需要借助最先进的生物信息学技术，从而在最大程度上系统地描述肿瘤的免疫学特征，并提供更多的信息来增强我们对肿瘤免疫的理解。

NGS时代的免疫基因组学

在过去二十年中，包括全基因组测序（WGS）、全外显子组测序（WES）和RNA测序（RNAseq）在内的NGS已成功开发并应用于获取人类全基因组信息。NGS产生高通量基因组和转录数据，为研究多步免疫应答奠定了基础。

量化TME中的免疫细胞

TME由多种免疫细胞组成，对于肿瘤免疫细胞组分的定量，传统的方法，如流式细胞术和免疫组织化学（IHC），由于其高成本和低组织可用性，不适用于大规模分析。随着NGS的快速发展，我们能够通过NGS数据估计几十种免疫细胞类型的丰度，这些数据也被证实是可靠的。这些分析的来源主要是DNA和RNA测序，尤其是后者。关于RNA序列数据，计算方法的原理主要分为基因集富集分析（GSEA）和逆卷积。

通常，基于GSEA的代表性算法包括ESTIMATE、xCell和MCP计数。基于GSEA的方法的一个共同特点是需要为每个感兴趣的免疫细胞亚群建立特定的基因集。细胞成分的逆卷积是基于基因表达特征的体组织中细胞亚型卷积的反向过程。基于逆卷积的工具包括decornaseq、PERT、CIBERSORT、TIMER、EPIC、quanTIseq和deconf.

肿瘤抗原的鉴定

体细胞DNA突变，包括单核苷酸变异（SNV）和插入和缺失（INDEL），是异常抗原的主要来源。目前，基因组分析工具包（GATK）是通过分析WES、WGS和RNA序列数据来识别SNV和INDEL的行业标准。其范围也在扩大，以涵盖拷贝数变异（CNVs）和结构变异（SVs）。

此外，异常肽需要与HLA结合，以协助T细胞受体（TCR）识别，从而引发免疫反应。预测HLA分型对于识别肿瘤抗原至关重要。HLAminer和Seq2HLA是用于从NGS数据进行HLA分型的两种早期工具，PHLAT、HLAreporter、SNP2HLA、HLA-HD、optype和HLA-VBSeq在不同癌症中的四位、六位和八位分辨率表现都相当出色。在这些工具中，Polysolver是目前使用低覆盖率WES数据的公认标准工具之一。

除了识别异常肽和HLA分型外，抗原MHC结合亲和力是肿瘤抗原预测的下一个重点。许多肽-MHC-I（pMHC-I）亲和力预测工具是基于人工神经网络（ANN）训练方法和位置特异性评分矩阵（PSSM），如目前广泛使用的工具NetMHC和NetMHCpan。而由于MHCII结合肽长度的多样性和结合区的“开放性”，预测pMHCII亲和力更具挑战性，可用的pMHCII亲和力预测方法的数量远远少于pMHC-I。

单细胞时代的免疫组学

尽管利用NGS技术研究肿瘤免疫的研究极大地促进了肿瘤学的发展，但批量测序可能会导致信号稀释到检测限以下，并掩盖单个细胞的反应。这可能会掩盖许多重要的生物学现象。直到最近，单细胞相关方法的技术突破彻底改变了我们对肿瘤免疫的理解，并将研究水平从区域水平过渡到单细胞水平。

多色流式细胞术

多参数分析在功能上和物理上区分不同免疫细胞亚群的能力已促使流式细胞仪发展为常规使用的8参数流式细胞仪。此外，随着技术的进步，可以测量更多参数的仪器设计已经实现，例如30参数和50参数流式细胞仪。然而，由于更可测量的参数精度较低，或更高精度可测量的参数有限，特别是由于荧光染料发射光谱之间的重叠，这些缺点在一定程度上限制了多色流式细胞术的应用和进一步发展。

质谱流式细胞术

质谱是该领域的一项最新创新，也称为飞行时间（CyTOF）流式细胞仪，将流式细胞仪与质谱仪相结合。与传统流式细胞仪相比，质谱仪用金属同位素而不是荧光团标记抗体，然后使用飞行时间检测器对信号进行量化，该检测器可检测至少40个参数，并避免光谱重叠问题。CyTOF已被证实是一种精确的肿瘤组织高维分析方法，用于探索性免疫分析和生物标记物发现。

虽然从理论上讲，质谱流式细胞术允许我们检测每个细胞最多100个参数，但处理速度和通量受到离子飞行的限制。在雾化和电离后，细胞在预处理过程中被完全破坏，导致后续细胞分类应用不可行。此外，关于测量某些低表达分子特征，CyTOF可能因其低灵敏度而不合适。

光谱流式细胞术

光谱流式细胞术是促进传统流式细胞术功效的另一项最新技术进步。与质谱仪不同，光谱流式细胞仪仍然用荧光染料标记抗体，但用色散光学和测量全发射光谱的新型探测器取代了传统光学和探测器。基于相同的原理，传统的流式细胞术和光谱流式细胞术保持了相当好的兼容性，特别是在商业抗体的可用性方面，但可以更好地消除混淆因素，如光谱重叠，以提高效率。随着补偿技术的发展，光谱流式细胞术有可能取代多色流式细胞术。

单细胞RNA测序

基于流式细胞术的技术将特定标签与相应的细胞亚群结合并识别该标签，表明必须在样本采集之前确定目标，而最初的目标限定限制了从这些技术中获得的信息，只能通过这些技术找到“已知的未知的”。

单细胞测序技术的出现将单细胞领域推向了新的高度。不再受流式细胞术等预定目标的限制，可以使用标准NGS协议对单个细胞进行测序，以获得可用于识别“未知”的无偏多组学分析。

目前，scRNA-seq的应用相对其他方法更为成熟，再肿瘤免疫治疗领域为我们提供了很多非常有价值的发现和启示。然而，微量物质放大产生的技术噪音仍然是最重大的挑战。如何分离单个细胞并保持其生物活性，如何解决放大带来的巨大技术噪音并提高灵敏度，如何以最低的价格获得最高数量的可测量基因，如何更有效地分析数据，这些都大大提高了单细胞测序的门槛，限制了它的广泛应用。

免疫组学与人工智能

人工智能在肿瘤免疫研究中的技术进展主要涉及以下几个方面：（1）减轻了人工识别病理切片上免疫浸润的工作量；(2）提供了一种替代技术来识别肉眼难以识别的免疫细胞亚群和空间结构；（3）提供一种非侵入性方法来预测特定患者的TME特征和对免疫治疗的反应。

基于深度学习方法的肿瘤抗原预测

破译肿瘤抗原的第一步是预测异常肽。除了识别SNV的多种算法外，最近设计的CN学习工具也被设计用于检测CNV，表现出良好的性能。关于HLA分型，Bulik等人生成了一个大型综合数据集，包括各种类型癌症组织的HLA类型和HLA肽，并公布了可用于训练完整质谱深度学习模型EDGE的数据，该模型已在非小细胞肺癌（NSCLC）患者中得到验证。此外，最近开发了两种很有前途的计算深度学习方法MARIA和MixMHC2pred，大大提高了MHC-II预测精度。

放射组学在肿瘤免疫中的应用

随着人工智能在医学影像学中的发展，影像已经不仅仅是一张图片，而是一个大规模的数字数据，使用AI技术分析成像数据的过程就是放射组学。应用于肿瘤免疫的放射组学技术主要用于识别反映免疫浸润的生物标记物，并预测ICB治疗患者的治疗反应。

肿瘤免疫中的计算病理学

病理学中的AI，或所谓的数字病理学，通过计算分析，为探索免疫细胞和肿瘤细胞之间的相互作用以及癌症生物学关键行为之间的联系提供了新的见解。

与放射学相似，数字病理学结合深度学习从图像中挖掘出看不见的信息，使我们能够在细胞或分子水平上理解TME。数字病理学可能是研究TME结构以及癌症生物学和治疗之间关系的一种有希望的方法。

免疫组学在肿瘤免疫治疗中的应用

识别ICB的生物标志物用于患者分层

作为ICB的一个靶点，IHC检测到的PD-L1表达水平是第一个发现的预测性生物标记物，但一些临床试验表明ICB对一些PD-L1高表达患者仅具有轻微疗效，而ICB也会对PD-L1低表达患者有响应。因此，迫切需要其他生物标记物来填补这一空白。

2014年，研究人员首次通过WES将肿瘤突变负荷（TMB）与接受CTLA-4抑制剂治疗的患者的临床生存率联系起来。随后，其他回顾性研究也证明，高TMB与持久的临床益处相关。关于用于评估TMB的方法，由于WES的高成本和复杂性，FDA批准了两个替代NGS平台，即FoundationOneCDx（F1CDx）和MSKCC可操作癌症靶点综合突变谱（MSK-IMPACT），并通过多个癌症的前瞻性研究进行了验证。

另一方面，免疫细胞浸润，特别是TIL，在免疫反应中起着关键作用。为了发现更理想的治疗和预后生物标志物，单细胞测序被用于鉴定更多的免疫细胞亚群。已经发现TCF7+记忆样T细胞与抗PD1治疗后黑色素瘤患者的临床改善相关，而干细胞样TCF1+PD1+T细胞经证实，在ICB治疗中有助于肿瘤控制。通过单细胞测序技术，更多与治疗和预后相关的T细胞亚群和功能状态被确定。

ACT治疗中新抗原的预测

过继细胞疗法（ACT）是通过转基因或扩增的自体或异体T细胞重新回输到患者体内，以增强抗肿瘤免疫。免疫组学主要用于在ACT治疗中识别理想的肿瘤抗原。

目前，新抗原特异性TCR-T细胞尚未进入临床应用，然而，令人欣慰的是，一些病例报告显示了免疫组学预测的结直肠癌、乳腺癌和胆管癌患者T细胞识别肿瘤新抗原的有效性。Tran等人对转移性胆管癌患者的样本进行WGS，确定了26种体细胞突变。将由突变基因组成的串联微基因转录并转染到自体APC中，然后将新抗原呈递APC与患者来源的TIL共培养，最终鉴定抗原特异性CD4+Vb22+T细胞克隆，诱导上皮癌消退。

传统的基于自体APC和T细胞共培养的新抗原选择由于其低通量、高成本和耗时的特性而受到限制。为了消除这些障碍，开发了更多高通量免疫原性新抗原检测技术。Li等人建立了一个基于trogocytosis的平台，在该平台中，当TCR和pMHC结合时，表面标记蛋白就从APC转移到T细胞。因此，可以通过分析标记蛋白阳性细胞来识别理想的新抗原。未来，这些新兴的免疫基因组学技术将实现高通量新抗原选择。

为个体化肿瘤疫苗选择新抗原

免疫组学方法已广泛应用于临床研究中的疫苗开发。一般来说，用于生成个性化疫苗的新抗原是通过分析肿瘤和正常组织的WES和RNA序列，并通过算法（如NetMHCpan）预测有效表位来识别的。

与ACT相似，肿瘤疫苗开发的关键参数是理想的新抗原鉴定。为了提高新抗原预测的准确性和免疫原性新表位选择管道，免疫组学技术在这些方面做着不懈的努力。在最近的一项研究中，Wells等人汇编了所有新抗原预测和选择方法，并提供了一个全新的候选测定管道，其中包括MHC呈递和T细胞识别的14个免疫原性特征。本研究为提高肿瘤疫苗的疗效和过继性细胞治疗奠定了坚实的基础。

小结

近年来，伴随着免疫组学领域新兴技术的巨大飞跃，我们现在能够以前所未有的深度解析肿瘤免疫。

在批量测序时代，使我们能够更好地探索肿瘤免疫细胞的个体浸润模式，以及异常肽的预测、HLA分型和肿瘤抗原MHC结合亲和力的预测，使用免疫组学技术预测肿瘤抗原已在临床前和临床研究中证明了其可靠的功效。

此外，随着单细胞免疫相关技术的发展，从多色流式细胞术到CyTOF，单细胞肿瘤免疫图谱帮助我们进行免疫细胞亚群分类，以破译TME成分。人工智能的出现也为免疫组学的发展提供了新的方向。

随着免疫组学技术的蓬勃发展，可持续发展需要考虑几个问题。首先，尽管已经实施了许多质量控制和改进算法原理的方法，但这些技术的有效性仍有待提高。特别是在肿瘤抗原预测、单细胞测序和空间上分辨转录组学方面，技术噪音和混杂因素阻碍了后续分析。其次，期待更具成本效益、更易获取和更自动化的技术出现，从而彻底改变学科的发展。第三，我们还期望研究人员充分利用现有技术探索肿瘤免疫，促进临床转型。

尽管还有很多工作要做，但免疫组学很可能在未来的肿瘤免疫学领域占据主导地位，其临床价值无疑将极大地促进该学科在免疫组学、单细胞和人工智能领域的发展。

参考文献：

1.Technologicaladvancesincancerimmunity:fromimmunogenomicstosingle-cellanalysisandartificialintelligence.SignalTransductTargetTher. 2021;6:312.