博舍

【综述】人工智能在骨关节炎影像诊断中的研究现状与进展 人工智能影像学诊断

【综述】人工智能在骨关节炎影像诊断中的研究现状与进展

医学影像是AI在医学领域的主要应用方向之一[4]。机器学习是人工智能的下属概念,传统的机器学习算法主要包括神经网络、k最近邻、支持向量机、朴素贝叶斯和随机森林等。这些算法均依赖于人工给出的浅层特征[5]。最近兴起的深度学习则无需人工指定特征,机器能够自己学习,提供解决方案,为图像、视频、语音等数据的处理带来了突破[6,7,8]。大多数深度学习算法都基于人工神经网络(artificialneuralnetwork,ANN),ANN是受神经元的生物学过程启发而设计出的模型,通常由多层组成,包括输入层、输出层及中间的隐藏层[7]。

卷积神经网络(convolutionalneuralnetworks,CNN)是ANN的子类,明确其输入内容为图像。典型的CNN结构由多层组成,使其能够学习图像的深层特征[8]。CNN由卷积层、池化层、非线性层和全连接层组成。卷积层是构成CNN的核心模块,由一组可学习的过滤器组成,通常在连续的卷积层之间周期性地插入池化层,以最小化网络中的参数和计算量,避免过度拟合,两者配合具有提取输入图像特征的功能。非线性层使用特定的非线性激活函数实现选择的功能,仅允许部分特征能够被输出。全连接层与前一层的所有激活函数完全连接,充当分类器。CNN在图像处理上表现格外出色,有近似医师的性能,在医学影像处理中应用最广[6,8]。

二、OA影像公共数据库

高质量、已标记的数据是机器学习的基础,通常的做法是将可用的数据划分为3个子集,即训练集、验证集和测试集,分别用于训练和优化神经网络的参数,监控模型的性能和最终评估、报告模型的性能[5]。在此过程中需要大量的数据,公共数据库为研究人员开发、测试和评价研究结果提供了共同的平台。目前OA影像领域的公共数据库仍较为有限,最常用的是骨关节炎创始(osteoarthritisinitiative,OAI)以及多中心骨关节炎研究(multicenterosteoarthritisstudy,MOST)数据库[9,10]。

OAI研究[9]共招募4796例患者,年龄45~79岁,其中女性占58.0%。数据库记录了参与者膝关节OA的生物化学、遗传和影像数据,主要为X线和MRI图像以及相应的半定量评分和定量测量结果,为研究膝OA发生发展的危险因素和自然史提供了资料。

MOST研究[10]在社区人群中招募了3026例年龄在50~79岁之间患有OA或有较高OA风险者,其中女性占60.0%。数据库记录了参与者膝关节OA的危险因素、疾病特点、临床结局以及影像数据,主要为随访的X线和MR图像以及相应的半定量评分和定量测量结果,为研究生物力学、骨关节结构和营养因素在膝OA的放射学和症状中的作用提供了资料。

同时,队列髋和膝(cohorthip&cohortknee,CHECK)[11]、膝关节影像分割2010(segmentationofkneeimages2010,SKI10)[12]以及肌肉骨骼放射影像(musculoskeletalradiographs,MURA)数据库[13]也常被用于OA及肌肉骨骼系统影像研究中。

高质量、已标记的数据是机器学习的基础,通常的做法是将可用的数据划分为3个子集,即训练集、验证集和测试集,分别用于训练和优化神经网络的参数,监控模型的性能和最终评估、报告模型的性能[5]。在此过程中需要大量的数据,公共数据库为研究人员开发、测试和评价研究结果提供了共同的平台。目前OA影像领域的公共数据库仍较为有限,最常用的是骨关节炎创始(osteoarthritisinitiative,OAI)以及多中心骨关节炎研究(multicenterosteoarthritisstudy,MOST)数据库[9,10]。

OAI研究[9]共招募4796例患者,年龄45~79岁,其中女性占58.0%。数据库记录了参与者膝关节OA的生物化学、遗传和影像数据,主要为X线和MRI图像以及相应的半定量评分和定量测量结果,为研究膝OA发生发展的危险因素和自然史提供了资料。

MOST研究[10]在社区人群中招募了3026例年龄在50~79岁之间患有OA或有较高OA风险者,其中女性占60.0%。数据库记录了参与者膝关节OA的危险因素、疾病特点、临床结局以及影像数据,主要为随访的X线和MR图像以及相应的半定量评分和定量测量结果,为研究生物力学、骨关节结构和营养因素在膝OA的放射学和症状中的作用提供了资料。

同时,队列髋和膝(cohorthip&cohortknee,CHECK)[11]、膝关节影像分割2010(segmentationofkneeimages2010,SKI10)[12]以及肌肉骨骼放射影像(musculoskeletalradiographs,MURA)数据库[13]也常被用于OA及肌肉骨骼系统影像研究中。

三、膝关节MR图像自动分割

X线和MRI是诊断和评估OA主要的影像方法,MRI能够提供更丰富的信息。为了从MR图像中提取OA的特征,有必要分割软骨与骨。自动软骨分割方法包括基于模型、基于图集、基于图与图割的算法等。同时,机器学习也被用于解决图像分割问题,已提出了利用k最近邻算法完成软骨的自动分割及使用支持向量机算法同时使用多个MRI序列来解决分割问题的方法[14]。

Prasoon等[15]较早使用深度学习来解决膝关节骨与软骨的分割问题。其研究集成3个正交二维CNN提出了一种多平面软骨分割方法,在114个膝关节MR图像中的测试显示,评价其胫骨软骨分割准确性的Dice相似性系数(dicesimilaritycoefficient,DSC)可达0.8249。司莉萍等[16]使用SKI10数据库训练Ⅴ型网络和Inception网络2种深度神经网络,在临床患者膝关节MR图像中的测试结果显示,骨骼分割的DSC高于0.90,软骨分割的DSC也超过0.70,实现了高于手工标注的性能。Liu等[17]及Ambellan等[18]则整合了CNN与其他机器学习算法,进一步提高了膝关节骨与软骨分割的效率和准确性,以较低的计算成本实现了高精度、可重复的分割。

除了骨与软骨之外,还有学者关注到了膝关节其他结构的自动分割。Tack等[19]组合了二维及三维CNN与三维统计形状模型,实现了对膝关节半月板的分割,内、外侧半月板分割的DSC分别达到0.838和0.889。Norman等[20]使用二维U型CNN实现了对膝关节软骨及半月板的自动分割,软骨分割的DSC在0.770~0.878,内、外侧半月板分割的DSC分别为0.753和0.809,软骨体积和厚度的分割精度与手动分割相当。Zhou等[21]结合了深度CNN以及其他机器学习算法使骨骼、肌肉和其他非特定组织分割的DSC高于0.9,软骨、半月板、股四头肌和髌腱等结构分割的DSC为0.8~0.9。

目前的膝关节MR图像自动分割主要基于CNN[15,17,18,19,20,21],并常通过与其他机器学习算法结合以实现在足够短的时间内提供准确的分割结果[19,20,21],便于在OA研究中常规使用。致力于膝关节所有组织自动分割的研究也已开展,为后续研究提供了技术支持。进一步的研究则把关注点放在了这些分割方法在其他解剖部位应用的可行性。

X线和MRI是诊断和评估OA主要的影像方法,MRI能够提供更丰富的信息。为了从MR图像中提取OA的特征,有必要分割软骨与骨。自动软骨分割方法包括基于模型、基于图集、基于图与图割的算法等。同时,机器学习也被用于解决图像分割问题,已提出了利用k最近邻算法完成软骨的自动分割及使用支持向量机算法同时使用多个MRI序列来解决分割问题的方法[14]。

Prasoon等[15]较早使用深度学习来解决膝关节骨与软骨的分割问题。其研究集成3个正交二维CNN提出了一种多平面软骨分割方法,在114个膝关节MR图像中的测试显示,评价其胫骨软骨分割准确性的Dice相似性系数(dicesimilaritycoefficient,DSC)可达0.8249。司莉萍等[16]使用SKI10数据库训练Ⅴ型网络和Inception网络2种深度神经网络,在临床患者膝关节MR图像中的测试结果显示,骨骼分割的DSC高于0.90,软骨分割的DSC也超过0.70,实现了高于手工标注的性能。Liu等[17]及Ambellan等[18]则整合了CNN与其他机器学习算法,进一步提高了膝关节骨与软骨分割的效率和准确性,以较低的计算成本实现了高精度、可重复的分割。

除了骨与软骨之外,还有学者关注到了膝关节其他结构的自动分割。Tack等[19]组合了二维及三维CNN与三维统计形状模型,实现了对膝关节半月板的分割,内、外侧半月板分割的DSC分别达到0.838和0.889。Norman等[20]使用二维U型CNN实现了对膝关节软骨及半月板的自动分割,软骨分割的DSC在0.770~0.878,内、外侧半月板分割的DSC分别为0.753和0.809,软骨体积和厚度的分割精度与手动分割相当。Zhou等[21]结合了深度CNN以及其他机器学习算法使骨骼、肌肉和其他非特定组织分割的DSC高于0.9,软骨、半月板、股四头肌和髌腱等结构分割的DSC为0.8~0.9。

目前的膝关节MR图像自动分割主要基于CNN[15,17,18,19,20,21],并常通过与其他机器学习算法结合以实现在足够短的时间内提供准确的分割结果[19,20,21],便于在OA研究中常规使用。致力于膝关节所有组织自动分割的研究也已开展,为后续研究提供了技术支持。进一步的研究则把关注点放在了这些分割方法在其他解剖部位应用的可行性。

四、基于AI的OA辅助诊断评估

X线是OA诊断中最常用的影像方法,通常使用凯尔格伦-劳伦斯(Kellgren-Lawrence,K-L)分级系统评估;而依据MRI的半定量评分体系能更好地发现、评估OA发生发展的过程,评价疗效[22]。然而,由于人眼易于疲劳,当图像数量过大时,往往遗漏部分信息,同时人工评分带有主观性。因此,基于X线和MRI的OA辅助诊断评估系统应运而生。基于X线的OA自动诊断系统的研究中,最早的数据量仅有数百例,但研究部位涉及手、脊柱、膝等多个部位。而随着OA影像数据库的建立,研究逐渐集中到膝、髋关节。深度学习使得处理数千例患者的图像成为可能,诊断系统的效能也有了明显提高。Xue等[23]使用420幅骨盆X线训练和测试深度CNN,使其对髋关节OA诊断的敏感度达95.0%、准确度达92.8%,相当于经验丰富的医师水平。Tiulpin等[24]使用MOST数据库训练深度孪生CNN,以OAI数据库测试的结果显示,其ROC曲线下面积(AUC)为0.93,诊断一致性高于医师平均水平。Norman等[25]使用OAI数据库训练和测试密集卷积网络,对正常及不同程度膝关节OA分类的敏感度为68.9%~86.0%,特异度为83.8%~99.1%。这些系统能辅助医师诊断OA,减轻工作强度。近来Brahim等[26]基于OAI数据库使用机器学习开发了完整的计算机辅助诊断系统,使膝关节OA早期诊断准确率达82.98%、灵敏度达87.15%、特异度达80.65%,还能避免摄片因素对诊断的影响。

MR图像能为OA诊断提供更多的信息,自动化的分级评估系统能够减少繁重的评分工作,半定量或定量地评估疾病的状态和进展情况。较早的研究首先使用传统的机器学习算法实现了对于OA的辅助诊断。Wu等[27]使用径向基神经网络分类,检测了46个膝关节MR图像,早期诊断OA的准确度达75%,其中训练集和正常膝关节的准确度达100%。Ashinsky等[28]使用基于层次特征提取及形态学算法检测了19例患者的膝关节MR图像,对软骨退化状态分类的准确度可达86%,可用于OA的临床检测和分级。随后的研究则将深度学习方法引入了OA的辅助诊断及鉴别诊断中。Liu等[29]对175例膝关节疼痛患者的MR图像分别以2个二维CNN实现了软骨的自动分割和自动诊断,同一组放射科医师训练的2个模型的AUC分别为0.917和0.914,且一致性较好,可用于鉴别软骨退变和急性软骨损伤。Pedoia等[30]使用二维U型CNN自动分割软骨和半月板、三维CNN自动检测其病变,评估1478例不同阶段OA、前交叉韧带损伤以及重建后患者的结果显示,系统能识别半月板和髌骨软骨病变,并能对严重程度进行分类。Bien等[31]使用CNN开发的膝关节MRI辅助诊断系统,能进一步鉴别包括OA在内的异常表现、前交叉韧带撕裂以及半月板撕裂,诊断相当于普通放射科医师水平。

X线是OA诊断中最常用的影像方法,通常使用凯尔格伦-劳伦斯(Kellgren-Lawrence,K-L)分级系统评估;而依据MRI的半定量评分体系能更好地发现、评估OA发生发展的过程,评价疗效[22]。然而,由于人眼易于疲劳,当图像数量过大时,往往遗漏部分信息,同时人工评分带有主观性。因此,基于X线和MRI的OA辅助诊断评估系统应运而生。基于X线的OA自动诊断系统的研究中,最早的数据量仅有数百例,但研究部位涉及手、脊柱、膝等多个部位。而随着OA影像数据库的建立,研究逐渐集中到膝、髋关节。深度学习使得处理数千例患者的图像成为可能,诊断系统的效能也有了明显提高。Xue等[23]使用420幅骨盆X线训练和测试深度CNN,使其对髋关节OA诊断的敏感度达95.0%、准确度达92.8%,相当于经验丰富的医师水平。Tiulpin等[24]使用MOST数据库训练深度孪生CNN,以OAI数据库测试的结果显示,其ROC曲线下面积(AUC)为0.93,诊断一致性高于医师平均水平。Norman等[25]使用OAI数据库训练和测试密集卷积网络,对正常及不同程度膝关节OA分类的敏感度为68.9%~86.0%,特异度为83.8%~99.1%。这些系统能辅助医师诊断OA,减轻工作强度。近来Brahim等[26]基于OAI数据库使用机器学习开发了完整的计算机辅助诊断系统,使膝关节OA早期诊断准确率达82.98%、灵敏度达87.15%、特异度达80.65%,还能避免摄片因素对诊断的影响。

MR图像能为OA诊断提供更多的信息,自动化的分级评估系统能够减少繁重的评分工作,半定量或定量地评估疾病的状态和进展情况。较早的研究首先使用传统的机器学习算法实现了对于OA的辅助诊断。Wu等[27]使用径向基神经网络分类,检测了46个膝关节MR图像,早期诊断OA的准确度达75%,其中训练集和正常膝关节的准确度达100%。Ashinsky等[28]使用基于层次特征提取及形态学算法检测了19例患者的膝关节MR图像,对软骨退化状态分类的准确度可达86%,可用于OA的临床检测和分级。随后的研究则将深度学习方法引入了OA的辅助诊断及鉴别诊断中。Liu等[29]对175例膝关节疼痛患者的MR图像分别以2个二维CNN实现了软骨的自动分割和自动诊断,同一组放射科医师训练的2个模型的AUC分别为0.917和0.914,且一致性较好,可用于鉴别软骨退变和急性软骨损伤。Pedoia等[30]使用二维U型CNN自动分割软骨和半月板、三维CNN自动检测其病变,评估1478例不同阶段OA、前交叉韧带损伤以及重建后患者的结果显示,系统能识别半月板和髌骨软骨病变,并能对严重程度进行分类。Bien等[31]使用CNN开发的膝关节MRI辅助诊断系统,能进一步鉴别包括OA在内的异常表现、前交叉韧带撕裂以及半月板撕裂,诊断相当于普通放射科医师水平。

五、基于AI的OA预测模型

OA诊疗需要识别和筛选出最可能从治疗中获益的患者。为此,需要建立医学预测模型精确分析患者个体数据,以预测其患病风险和疾病预后[32]。较早的模型主要基于传统的统计方法建立,难以处理大量的影像数据,因此预测效果欠佳。随着机器学习的兴起,影像数据也被纳入到OA预测模型之中,使预测效果有了较大的提升。

Kinds等[33]和Kerkhof等[34]使用传统的统计方法建立的模型已经充分说明了影像数据对于OA预测的价值。Yoo等[35]最早将机器学习引入OA预测模型中,比较了基于患者临床数据的评分系统结合ANN模型的性能,内部验证显示对于OA的预测性能有明显改善,使用OAI数据的外部验证印证了这一结果。Lazzarini等[36]使用随机森林法建立了基于临床数据和X线等信息的预测模型,预测中年肥胖女性30个月后发生OA的AUC大于0.731,还发现X线较临床数据对于预测更有价值。Minciullo等[37]同样使用随机森林法建立了基于X线的膝关节疼痛预测模型,手工标注X线特征时模型的AUC为0.739,使用全自动X线图像分析时的性能与之相当。MRI的引入进一步提高了模型的应用价值,Ashinsky等[38]使用加权邻域距离算法建立了基于MRI的模型,预测患者进展为症状性OA的准确度达75%。Du等[39]则使用了4种机器学习算法开发了基于MRI的模型,发现ANN预测K-L分级和外侧关节间隙变窄定义的OA性能最佳,AUC分别为0.761和0.695;随机森林法预测内侧关节间隙变窄定义的OA性能最佳,AUC为0.785,提示内侧关节间隙能提供更多OA相关信息。在OA预测模型中引入AI以及影像数据,不仅可提高预测性能,还能对OA发生发展的机制提供线索。

OA诊疗需要识别和筛选出最可能从治疗中获益的患者。为此,需要建立医学预测模型精确分析患者个体数据,以预测其患病风险和疾病预后[32]。较早的模型主要基于传统的统计方法建立,难以处理大量的影像数据,因此预测效果欠佳。随着机器学习的兴起,影像数据也被纳入到OA预测模型之中,使预测效果有了较大的提升。

Kinds等[33]和Kerkhof等[34]使用传统的统计方法建立的模型已经充分说明了影像数据对于OA预测的价值。Yoo等[35]最早将机器学习引入OA预测模型中,比较了基于患者临床数据的评分系统结合ANN模型的性能,内部验证显示对于OA的预测性能有明显改善,使用OAI数据的外部验证印证了这一结果。Lazzarini等[36]使用随机森林法建立了基于临床数据和X线等信息的预测模型,预测中年肥胖女性30个月后发生OA的AUC大于0.731,还发现X线较临床数据对于预测更有价值。Minciullo等[37]同样使用随机森林法建立了基于X线的膝关节疼痛预测模型,手工标注X线特征时模型的AUC为0.739,使用全自动X线图像分析时的性能与之相当。MRI的引入进一步提高了模型的应用价值,Ashinsky等[38]使用加权邻域距离算法建立了基于MRI的模型,预测患者进展为症状性OA的准确度达75%。Du等[39]则使用了4种机器学习算法开发了基于MRI的模型,发现ANN预测K-L分级和外侧关节间隙变窄定义的OA性能最佳,AUC分别为0.761和0.695;随机森林法预测内侧关节间隙变窄定义的OA性能最佳,AUC为0.785,提示内侧关节间隙能提供更多OA相关信息。在OA预测模型中引入AI以及影像数据,不仅可提高预测性能,还能对OA发生发展的机制提供线索。

六、问题与展望

虽然AI在OA影像中的研究已取得了长足进展,但远不及肿瘤、神经等热门领域[3,4,5,6,7,8],仍然存在许多不足,主要如下。(1)中国影像数据库容量不足:目前虽然已经出现了一些公开的OA以及肌肉骨骼影像数据库[9,10,11,12,13],但数据库的容量较为有限,如SKI10数据库[12]仅收录了150个膝关节MR图像。同时公共数据库样本绝大多数来自欧美人群,目前尚未出现以中国或亚洲人群为主的大型OA或肌肉骨骼影像数据库。在此基础上开发的辅助诊断系统或预测模型并不完全适合中国人群,研究面临数据瓶颈。因此,构建以中国人为研究对象的数据库具有重要意义[40]。(2)图像分割与后处理尚不完善:OA是一种全器官疾病[1],但目前的研究主要集中于膝关节软骨与骨的分割[14,15,16,17,18],仅有少量研究关注到了膝关节的其他结构,如半月板、肌肉、韧带等[19,20,21]。下一阶段有必要将膝关节视为一个整体开展研究,实现膝关节所有组织的自动分割。同时,还需进一步探索膝关节AI图像分割方法在其他解剖部位应用的可行性。(3)软件距临床应用还有距离:虽然目前已经基于影像以及其他临床信息开发出了OA辅助诊断以及预测的AI模型,但并无真正在临床推广应用的产品。此外,目前基于影像的AI还不能很好整合影像与病史、体征、实验室检查以及其他检查信息,综合判断以提高诊断的准确率,供临床决策参考。今后的研究需要跨学科的医师、跨专业的理工科研工作者进行深入而广泛的合作,开发真正能够用于临床诊断和鉴别诊断的模型,形成有生命力的产品[40]。

AI在影像中的应用在大量高质量的数据、高性能的计算机硬件以及云储存的支持下成为可能。AI能快速、准确地解读医学图像,变革医学影像诊断模式,与其他领域的AI应用一起推动精准医疗的发展。

虽然AI在OA影像中的研究已取得了长足进展,但远不及肿瘤、神经等热门领域[3,4,5,6,7,8],仍然存在许多不足,主要如下。(1)中国影像数据库容量不足:目前虽然已经出现了一些公开的OA以及肌肉骨骼影像数据库[9,10,11,12,13],但数据库的容量较为有限,如SKI10数据库[12]仅收录了150个膝关节MR图像。同时公共数据库样本绝大多数来自欧美人群,目前尚未出现以中国或亚洲人群为主的大型OA或肌肉骨骼影像数据库。在此基础上开发的辅助诊断系统或预测模型并不完全适合中国人群,研究面临数据瓶颈。因此,构建以中国人为研究对象的数据库具有重要意义[40]。(2)图像分割与后处理尚不完善:OA是一种全器官疾病[1],但目前的研究主要集中于膝关节软骨与骨的分割[14,15,16,17,18],仅有少量研究关注到了膝关节的其他结构,如半月板、肌肉、韧带等[19,20,21]。下一阶段有必要将膝关节视为一个整体开展研究,实现膝关节所有组织的自动分割。同时,还需进一步探索膝关节AI图像分割方法在其他解剖部位应用的可行性。(3)软件距临床应用还有距离:虽然目前已经基于影像以及其他临床信息开发出了OA辅助诊断以及预测的AI模型,但并无真正在临床推广应用的产品。此外,目前基于影像的AI还不能很好整合影像与病史、体征、实验室检查以及其他检查信息,综合判断以提高诊断的准确率,供临床决策参考。今后的研究需要跨学科的医师、跨专业的理工科研工作者进行深入而广泛的合作,开发真正能够用于临床诊断和鉴别诊断的模型,形成有生命力的产品[40]。

AI在影像中的应用在大量高质量的数据、高性能的计算机硬件以及云储存的支持下成为可能。AI能快速、准确地解读医学图像,变革医学影像诊断模式,与其他领域的AI应用一起推动精准医疗的发展。返回搜狐,查看更多

CAS Authentication wanted!

CASAuthenticationwanted!

YoushouldalreadyhavebeenredirectedtotheCASserver.Clickheretocontinue.

phpCAS1.3.1usingserverhttps://www.medlive.cn/auth/(CAS2.0)

综述阅读:人工智能在肺癌影像基因组学方面的研究与进展

    肺癌是世界范围内导致癌症死亡的主要原因。70%的肺癌诊断是在晚期局部或转移性疾病出现症状后进行的,诊断后的 5 年生存率约为 16%。只有当肺癌患者被确诊时仍是局部症状,生存率才会达到 50%以上。不幸的是,肺癌患者的疾病进展和对治疗的反应差异很大,只有 15%的肺癌在早期阶段被诊断出来。因此,准确的诊断与预后对于每个肺癌患者的治疗选择和规划至关重要。

    本文描述了人工智能方法在肺癌影像基因组学领域用于诊断与预后的相关研究进展。首先介绍了人工智能在影像基因组学中的角色与应用,以及人工智能技术在肺癌影像基因组学的主要研究方向,分别从肺癌基因表型识别、影像基因双向相关分析、预后预测三个方面进行了综述,并且评估了放射组学与深度学习算法在每个问题中的优缺点以及面临的问题和挑战。

研究思路:

在肺癌基因表型鉴别的应用中,分别从放射组学方法和深度学习技术的角度总结与梳理了肺癌中EGFR、KRAS基因识别的应用现状,并且简单分析了后续可继续进行的研究。

在肺癌智能诊断中影像与基因的相关性分析方面,分别从统计学方法以及深度学习两个角度进行分析。虽然取得了一定的成果,但大多研究都是统计学意义上的一些相关性,没有给人呈现直观的视觉效果,而基于深度学习的影像基因双向相关性则可以实现,但仍然处于尝试阶段,需要进一步研究探讨相关技术及方案。

在肺癌预后预测方面,简单总结了肺癌基于影像和影像基因进行生存复发预测以及疗效评估预测两个方面的工作,而基于人工智能算法的疗效反应评估研究内容还较少,较分散,需要进一步挖掘。

影像基因组学与人工智能

    影像基因组学(又称放射基因组学)是一门将医学成像技术与基因组学技术相结合的交叉学科,是一种将成像特征与基因组数据相关联的高通量研究方法。它不仅从图像数据中提取反应诊断的定量图像表型特征,而且从生物学数据中提取基因型特征,进而分析肿瘤的影像学特征与分子表型之间的关系影像。

    影像基因组学被应用于疾病的成像诊断、基因表型鉴别、预后预测及疗效评估等。其方法主要分为以下 4 个步骤:

        ①图像采集和处理;

        ②感兴趣区域(ROI)分割;

        ③特征提取和量化;

        ④构建预测和预后模型。

    在肺癌的诊断和治疗过程中,产生了大量丰富的具有不同数据类型的数据,包括文本、图像、生命体征数据、基因组数据等。

一、影像基因智能方法在肺癌基因表型方面的鉴别

        基因表型在肺癌的治疗决策中起着核心作用,基于影像预测肺癌中2个基本致病基因表皮生长因子受体(EGFR)和鼠类肉瘤病毒(KRAS)的突变状态是一种无创、成本较低的方法,具有靶向治疗的价值,检测肺癌患者的多种基因改变是决定靶向治疗适用性的关键。        肿瘤的特征是体细胞突变,例如特定的基因突变,可以影响参与肿瘤发展和进展的生物过程,最终反映在肿瘤表型上。EGFR 和 KRAS 的突变状态对于 NSCLC 患者的靶向治疗至关重要,因为它们是靶向治疗前了解肺癌致病的关键基因。

        利用传统机器学习方法来识别EGFR 突变状态,虽然上述放射组学、机器学习和统计方法已经成功地识别了肺癌患者基因突变,但它们需要复杂和严格的程序,需要经验丰富的成像医生的全面指导,从检测分割到特征提取和特征选择,非常耗时耗力,且结果是不可重复的。               目前证实了深度学习在预测肺腺癌中 EGFR 突变状态方面的潜力。这些方法主要采用多层卷积神经的方法使用 CT图像作为输入,并自动提取高级特征表示,用于 EGFR 突变状态预测。

        将人工智能和放射组学应用于肺癌基因突变识别任务的进一步研究正在进行中,临床上迫切需求智能诊断技术加以辅助。表1详细描述了基于非侵入图像处理在肺癌基因突变状态识别中的应用现状,研究图像类型主要包括肺癌CT、PET图像等,预测任务包括识别EGFR、KRAS基因突变等。研究方法主要包括放射组学方法(朴素贝叶斯分类器、k-最近邻、随机森林、支持向量机、决策树、Logistic回归等)以及深度神经网络(CNN、ResNet、LSTM、DenseNet、InceptionV-等)。评价指标主要采用准确率(ACC)、精确度(Pre)、敏感性(SE)、特异性(SP)、AUC值、召回率(Recall)、F1-score、马修斯相关系数(MCC)等。

        虽然利用放射组学方法和深度学习技术已经逐步实现了基于影像预测肺癌基因的突变状态,但是放射组学方法要依靠有经验医生的标注及分割,进而手工提取特征,耗时耗力。深度学习技术虽然避免了手工特征的提取,实现了端到端训练,但是提取的深度特征具有不可解释性。大多这些方法只考虑了单任务预测基因突变,多基因之间的关联性是否影响预测结果还不清楚,需要通过实验进一步验证。在后续的研究中,可以侧重基于多类型影像数据、多基因、多任务(如重建+预测、自动分割+预测等)等去鉴别肺癌基因的表型,并考虑增强模型的可解释性与泛化性能。

        董云云基于非小细胞肺癌(NSCLC)CT图像提出了一种多通道、多任务的端到端深度学习(MMDL)模型,用于同时预测EGFR和KRAS突变状态。该模型首先将每个三维肺结节分解为9个视图。然后,对每个视图使用预先训练的inception-attention-resnet模型来学习结节的特征,再通过结合9个inception-attention-resnet模型进行自适应加权训练来预测肺结节的基因突变类型。

二、影像与基因在肺癌智能诊断方面的相关性分析

        临床常规影像学检查通常是捕捉肿瘤行为最直接和最好的方法,有可能帮助提供疗程中整个肿瘤和所有肿瘤的更全面的视图。基因测序技术的进步使我们能够识别分子特征,这些特征有助于监测肿瘤生长,以指导疾病的预防和治疗。然而,由于肿瘤的异质性,这些技术受到活检的局限;基因测序的价格以及时间因素导致不少患者丧失了靶向药物治疗的最佳时机。因此,图像特征与基因组数据相结合的方法在提供更好的个性化决策支持方面具有巨大的前景。

        肿瘤异质性(多样性)是指肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出分子生物学或基因方面的改变,从而使肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等各方面产生差异。它是恶性肿瘤的特征之一。

        活检的局限是因为肿瘤具有异质性,对于癌细胞已经发生转移的患者而言,仅仅取某个部位的肿瘤组织,并不能反映患者的整体情况,但对所有的肿瘤组织都取样检测又不切实际;某些患者自身的情况决定了他不适合做组织活检;受到手术的扰动之后,有些肿瘤有加速转移的风险;组织活检的滞后性对患者的治疗也是不利的。

    基因测序的局限性,有的疾病与遗传性因素没有关系、关系很小、或暂未发现任何关系;研究人员发现,仅仅是对肿瘤基因组测序而不将其与其他组织细胞的基因组进行对比,就有可能导致对癌症的误诊和误治。

    然而,只有少数研究整合了基因组数据和图像数据,构建了这些信息相关性的放射基因组学框架。传统上(统计学方法),连接图像特征和基因表达谱的放射基因组图谱在非侵入识别特定类型疾病的分子特性方面具有巨大的潜力。这种图谱可以分为三个独立的步骤:

1)对元基因的基因聚类,2)图像特征的提取,3)元基因与图像特征之间统计相关性的分析。

每一步都是单独执行的,并依赖于各自的度量方法,而不考虑彼此之间的相关性。

        以上研究大多是通过分析组织样本来识别医学图像特征和分子特征之间的统计学意义上的显著相关性,不能给出直观的病理情况的视觉结果。此外,具有手工制作特征的放射基因组学研究是模糊的,对临床医生没有解剖学意义,且这些特性大多是冗余的,并强烈地依赖于领域知识。随着深度学习的发展,研究者们开始考虑整体和端到端的策略去寻找影像基因间的相关性。

        SuiD等人(2021)提出了一个基于深度学习的放射基因组框架,构建肺肿瘤图像与基因组数据的关系,进而实现生成过程,形成一个双向框架来表征多源医学数据。首先,采用基于U-Net的分割方法从原始CT图像中获得肿瘤区域(TR)。然后,利用自动编码器对基因条件下的图像进行编码,从不同层次的编码器中提取图像特征,将这些特征、预后数据和基因用于一系列分析实验,证明这些多源数据之间的相关性。最后,改进的CVAE-GAN将基因转化为相应的TR,并给出了直观的结果。

三、影像基因智能方法在肺癌预后预测方面的研究

        大多数肺癌目前是在晚期被发现和诊断的,生存率较低。虽然早期肿瘤发现和治疗可以提高肺癌患者的生存率,但如既往研究报道,恶性肿瘤手术切除后的肺癌复发率仍在30%-60%之间。因此,为了更有效地治疗和管理肺癌患者,建立有效的临床标志物或预测模型对更准确地预测肿瘤手术预后至关重要。

        疾病预后是对某种疾病的了解,除了先了解其临床表现、化验及影像学、病因、病理、病情规律等方面之外,重要的是根据治疗时机和方法结合治疗操作中所发现的新情况,对疾病的近期和远期疗效、转归恢复或进展程度的评估。

1、生存复发预测

        研究人员已经探索了不同的基因组生物标志物来识别肺癌发展和生存复发预测。尽管结果很有希望,但使用基因组生物标记物仍面临多种挑战,并存在一些局限性,如具有较高的成本、仪器检测错误、主观评分的处理错误以及较低的特异性。

        在目前的临床实践中,影像学检查仍然在肺癌的检测、诊断和预后评估中起着至关重要的作用,但是阅读和解释大量肺癌病例图像对放射科医生来说是困难的。因此,随着计算机辅助技术的快速发展,各种机器学习和深度学习方法的应用在癌症预后预测中发挥着越来越重要的作用。人们对基于从肺癌图像中计算出新的定量图像标记物预测癌症生存复发越来越感兴趣,各种预测算法正被不断探索。

    表3详细描述了影像智能方法在肺癌生存复发预测方面的应用,数据类型包括CT、PET/CT、临床数据等,研究方法主要包括放射组学方法(SVM、RF、DT、KNN、Cox比例风险、Logistic回归、多层感知器等)以及深度神经网络(CNN、ResNet、DenseNet等)。

        评价指标主要采用ACC、AUC、SE、SP、一致性指数(C-index)、平均绝对误差(MAE)、风险比例(HR)等。

        然而,上述技术仅使用图像信息,其预测性能是有限的。许多研究试图使用临床可接受的基因表达信息和图像相结合的方法(影像基因组学)来最大限度地提高肺癌生存复发的预测性能。一方面,研究者们利用非深度学习方法在肺癌影像基因数据的基础上开展肿瘤生存复发预测。 

2.疗效评估预测

        在肺癌诊治过程中,有效的疗效评估预测对于制定和调整临床治疗方案具有重要价值。近年来,肺癌的治疗工作取得了前所未有的进展。影像组学和影像基因组学将临床、基因以及影像大数据结合起来,对肺癌患者的分子和基因改变以及癌细胞免疫逃避机制的不断了解,为新的靶向药物、免疫治疗药物及个体化治疗(术后特异性化疗、放疗)铺平了道路。随着研究的不断深入和拓展,人工智能结合医学图像分析和数据挖掘方法的无创技术,在肺癌治疗反应评估中的潜在应用也引起了相当大的关注。

        肺癌治疗结果评估和影像学检查需要进行常规随访和肿瘤复发监测。然而,为了充分解决肺癌的异质性本质和治疗完成后可能的复发,还需要更个性化的监测。不少学者将目光置于影像组学及影像基因组学对肺癌治疗疗效反应的预测。

        放射组学试图从患者的医学图像(包括预处理和随访图像)中提取大量有价值的信息,并定量地将图像特征与诊断和治疗结果联系起来,取得了一定的研究成果。

        深度学习可以整合多个时间点的扫描图像,自动提取图像特征和识别复杂数据中的非线性关系,以改善临床结果预测。

        虽然医学影像一直能提供对疾病的个人评估,但基于影像生物标记物的人工智能算法有望准确地对患者进行分层,并为个性化医疗服务提供新的研究途径。这种新兴的方法允许早期诊断和定制患者特定的治疗,从而在正确的时间为正确的患者提供适当的医疗护理。表5详细描述了影像基因智能方法在肺癌疗效评估预测方面的应用现状,研究图像类型主要包括肺癌CT、PET/CT图像、临床数据等,疗效评估包括预测接受SBRT治疗的反应、放化疗及手术后的反应、接受抗PD1免疫治疗的反应状态、TKIs或ICIs治疗敏感反应等。研究方法主要包括放射组学方法(统计学分析、SVM、DT、RF、AdaBoost、无监督聚类、LASSO逻辑回归、Cox比例风险回归等)以及深度神经网络(3DCNN、RNN等)。评价指标主要采用C-index、AUC、HR等。从综述来看,基于人工智能算法进行疗效评估还存在许多障碍,包括需要标准化的数据收集方法、评估标准、前瞻性验证和报告协议等,这些在精确医学内的最大临床预期影响都需要进一步的研究。此外,基于影像基因组学的人工智能算法在疗效评估预测方面的研究还较少,后续也可以进行尝试性的探讨研究。

总结:

        基于影像基因组学的人工智能算法在提高肺癌基因表型鉴别、预后评估和预测治疗反应的准确性方面具有重要意义,为整个疾病过程中的患者护理提供了有价值的信息。影像基因组学结合人工智能有很大的前景,可以通过利用基因表达和分子谱信息来帮助理解放射性表型的生物学基础,还可能显示放射组特征、生物途径和基因表达状态之间的相关性。同时它能帮助建立放射组生物标志物作为基因组预后生物标志物的替代物,提高了预测模型的性能。影像基因智能算法的研究需要更大的数据集和更准确的信息标准化,进而提供有意义的和临床适用的结果,为精准医疗和个性化治疗策略的选择提供支持。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇