文献综述:人工智能在肺癌诊断中的研究进展
X线片是基层医疗卫生单位应用最广泛的影像学检查,也是肺部疾病初筛的检查方式,但是传统的胸部X线片(CXR)对于早期肺结节检出率极低。研究[14]指出CAD应用于CXR辅助诊断肺结节检出,敏感度和特异度分别为62%、58%,特异度低的CAD会产生较多的假阳性肺结节。随后Cha等[15]设计了一种基于深度卷积神经网络(deepconvolutionalneuralnetworks,DCNNs)的深度学习模型,这种系统在ResNet-50和ResNet-101的深残留网络基础上,又插入了一个新的全卷积网络(FCN-16S)。在LIDC-IDRI数据库中和当地医疗机构选取了经手术确诊的1483张癌性肺结节X线片作为测试集,对比6名放射科医师和深度学习模型对于结节的检出率,结果显示人工检出的平均曲线下面积(AUC)为82%(75%~86%),深度学习模型的AUC为90%,具有较好的检测效能。
1.2人工智能预测肺癌病理分型
实施精准化治疗的基础是正确区分肺癌的病理分型。当前治疗方案的选择,包括常规手术治疗、放化疗以及最新的靶向治疗和免疫治疗,均根据组织学分类选定[16]。临床上肺癌分为小细胞肺癌和非小细胞肺癌(non-smallcelllungcancer,NSCLC),NSCLC占肺癌绝大多数,也是肺癌死亡的主要病理类型,NSCLC主要包括肺鳞癌(lungsquamouscellcarcinoma,LUSC)和肺腺癌(lungadenocarcinoma,LUAD)[17]。活检是确定肺癌病理分期分型的金标准,同时也是一种有创操作,可能会造成严重的并发症。一项研究[18]探索基于CT图像特征分析的机器学习方法对NSCLC进行病理分型,运算过程中使用随机森林算法减少基尼杂质并选择最优图像特征分析肺癌的分型,结果显示该模型对LUAD和LUSC具有较高的分类精度,且LUAD的预测精度大于LUSC。研究发现氟代脱氧葡萄糖(18F-FDG)代谢在LUSC和LUAD之间具有差异性。Hyun等[19]根据PET-CT影像学特征设计开发机器学习预测模型鉴别LUSC和LUAD,该研究运用基尼系数从4个临床特征和40种图像特征中确定了9个最优特征子集。在396例患者中回顾性地评估了随机森林、神经网络、朴素贝叶斯方法、逻辑回归和支持向量机5种分类器的性能,当特征选择数量大小为15时,AUC分别为79%、85%、76%、86%和77%,并应用逻辑回归分类器获得性别、最大标准摄取值(SUVmax)、灰度长度不均匀性、灰度不均匀性和全病变糖降解为LUAD最佳预测因子。
若癌变发生在支气管时,常规的支气管镜活检是高效获取病理信息的方法,由于同一肿瘤内部不同区域存在异质性,镜检只能显示局部的病理信息,不能全面显示整块病变的情况[20]。传统的CAD可以通过白光支气管镜获得的图像进行黏膜和肿瘤分类,并取得了成功。Feng等[21]提出了一种用于鉴别肺癌类型的新型CAD系统,将白光支气管镜图像中的直观红-绿-蓝(RGB)转化为色调-饱和度-值(HSV),提取HSV每个彩色通道中的14个GLCM纹理特征对肿瘤分型进行定量分析,对纳入的22例LUSC和LUAD患者图像进行分析,准确率、灵敏度、特异度和AUC分别为86%、90%、83%和82%。
1.3人工智能对肺癌标志物测定
除了利用影像组学检出肺部恶性病变外,肿瘤标志物在癌症检测中也有至关重要的作用。标志物检测的阳性结果能够提示肿瘤可能发生,可作为早期检测肺癌的指标之一。目前临床用来诊断肺癌的肿瘤标志物并不是很多,且大多数都不具有特异度。新的证据表明肺癌患者体内某些长链非编码RNA(longnon-codingRNA,lncRNA)是异常的,一些lncRNA可以促进或抑制癌症的进展,并且可以作为诊断标志物[22]。Wang等[23]将机器学习和加权基因共表达网络(weightedgeneco-expressionnetworkanalysis,WGCNA)、Lasso算法、随机森林算法、支持向量机等技术用于癌症基因组图谱(thecancergenomeatlas,TCGA)数据库1364个lncRNA中筛查LUAD最佳生物学标志物。TCGA数据库是国家癌症研究所和国家人类基因组研究所的一个联合项目[24]。最终LANCL1-AS1、MIR3945HG、LINC01270、RP5-1061H20.4、BLACAT1、LINC01703、CTD-2227E11.1和RP1-244F24.1被确定为LUAD标志物,MIR3945HG同时也是LUSC诊断价值最高的生物学标志物且与生存期密切相关[25]。
免疫组织化学(immunohistochemical,IHC)生物标志物已经越来越多应用于肿瘤诊断、转移、治疗规划和疗效评估等方面。Ki67(也称MKi-67)染色在肿瘤学中常被用来估计肿瘤的增殖指数,通过采取组织活检并进行IHC分析,将阳性和阴性作为诊断结果来判断肿瘤是否增殖[26]。有研究[27]表明,Ki67水平不仅是二元的,在一个细胞周期,Ki67在S、G2、M期增高,在G0、G1期降解,定量分析Ki67水平可推断细胞最后一次分裂的时间以及对细胞增殖进行分类。肺癌内部的异质性可能是晚期肺癌低生存率的主要原因,理论上可通过量化分析影像图像特征和灰度空间分布来动态监测Ki67表达引起全肿瘤内部生物行为学特征,从而避免活检的有创性和局限性[28-29]。最近一项研究[30]通过机器学习放射组学分类器来预测NSCLC中Ki67表达水平,该研究基于图像摄取、肿瘤分割、特征提取和建立分类器工作流程共纳入245例NSCLC患者进行分析。在纹理特征提取之前,使用灰度归一化尽量减少对比度和亮度变化的影响[31],并用随机森林法选出最优特征子集,分别测试放射组学分类器、主观成像特征分类器和组合分类器性能,综合比较发现放射组学分类器性能优于其它两种分类器,其检测敏感度、特异度和AUC分别为73%、66%和78%。这是第一项利用CT影像资料无创预测Ki67表达水平的研究,同时也为肿瘤标志物的检测提供了更加快捷、安全、全面、准确的思路。
1.4人工智能对早期肺癌血液检测
癌症液体活检作为一种新型非侵入性诊断手段,通过检测血浆中的循环肿瘤细胞(circulatingtumorcells,CTCs)和循环肿瘤DNA(circulatingtumorDNA,ctDNA)等获取患者体内肿瘤异常生长信息并用于肿瘤的诊断。ctDNA是游离DNA(cell-freeDNA,cfDNA)的一种,目前对cfDNA的起源和分子特征了解很少。Cristiano等[32]开发了一种可以评估整个基因组中cfDNA裂解方式的模型,发现健康个体和癌症患者在基因图谱发生不同的改变,分别为白细胞的核小体改变和片段性改变,并用此方法分析了包含6种癌症的236例患者和245名健康个体的cfDNA片段特征,这些分析结果为以后癌症的筛查检测提供了原理方法。
来自斯坦福大学的研究团队Chabon等[33]研发并前瞻性地验证了一种称为“血浆中肺癌可能性”(lung-CLIP)的机器学习模型用于早期NSCLC的筛查(表1)。研究发现克隆性造血细胞与肿瘤细胞均可以产生ctDNA,但两者在变异等位基因频率(VAF)、cfDNA片段碱基取代谱、分子片段长短和TP53基因突变方面存在不同。在确定了不同来源cfDNA片段的差异性特征后,将血浆分子靶向测序、单核苷酸变体(SNV)模型和深度测序(CAPP-Seq)的全基因组拷贝数分析与机器学习模型整合在一起设计出Lung-CLIP,并设计了更具有优点的被称为灵活的纠错双工适配器(“FLEXAdaptors”)用于该模型中,增加了Lung-CLIP的鲁棒性。该团队早期使用包含104例早期NSCLC患者和56例风险匹配对照患者对Lung-CLIP进行了训练,在80%特异度下,Ⅰ期NSCLC敏感度为63%,且Lung-CLIP可以根据临床不同的需要调整检测的特异度。随后又前瞻性地验证了独立机构招募的46例早期NSCLC患者和48例风险匹配对照患者中Lung-CLIP的表现,其结果与训练中的表现相似,这种验证方法降低了模型过度拟合的风险,从而避免较高的假阳性结果。这种筛查方式可能使美国肺癌患者被救治的生命数量从目前的每年约600例增加到接近预期的最大值约12000例。此外,研究结果发现ctDNA水平与早期NSCLC的预后密切相关,未来可以将治疗前的ctDNA测量结果纳入NSCLC分期,并启用结合治疗前和治疗后变量的实时风险模型,以个性化预测患者预后。
2人工智能应用的不足与局限性人民生活水平的逐步提高对医疗健康的需求与日俱增,加剧了医疗资源的紧缺,需要有新的技术解决这一挑战。随着神经网络、深度学习算法等关键技术的突破和应用,AI应用于医疗卫生行业的潜力不断被挖掘,在疾病的诊断与监测、疗效评价、生存预测、药物试验和健康管理等方面发挥重要作用,并得到了医学专家的认可[34-36]。目前虽有大量AI医疗产品问世,但是AI仍处于起步阶段,在肺癌的诊断中存在较多问题。首先是AI在医学上的应用正在超越法律的监管和限制。由于AI在医疗运用中的有效性和可靠性仍未被明确证明,现行的法律没有清晰规定AI应当承担的责任范围,AI在医疗服务中出现的失误需要医生来承担责任,但医生并不是这方面的专家,不能鉴定产品的好坏,再加上内部处理器存在“黑匣子”问题,使得AI责任评估更加困难[37]。当下急需建立AI责任归属相关的法律,从法律层面划分医生、患者与AI企业应当承担的责任,这样才能督促企业完善产品的性能并保护患者隐私。其次,目前所有诊断的AI技术都是基于回顾性研究分析来确定诊断效能,且样本量小,用来训练的数据库一般都是LIDC-IDRI等公开数据库,存在一定的取样偏倚。有报道发现在诊断皮肤癌方面胜过临床医生的AI技术产品主要接受了高加索人种患者的数据培训,当将相同类型的诊断算法应用于其他人种时,准确性会急剧下降,目前应当建立属于我们自己的高质量数据库,用来进行AI产品的训练。最后,绝大多数医疗AI产品均是检测单一病种,在实际应用环境中,患者可能患有多种肺部疾病,如何区分并且辨别病种是AI发展的另一挑战。AI技术检测小结节的准确度低,可以进一步提高AI技术检测的精度。AI技术同时应该投入临床中开展大规模的前瞻性队列研究,也需要培训临床医生与患者沟通有关AI在诊断和治疗中的作用,以进行有效的信息传递交流,并将AI使用过程中的缺点反馈给AI企业,在实践运用中发现问题并解决问题才能设计出更符合当前需求的产品。
3小结与展望综上所述,AI检测肺癌研究模型被广泛开发,这些模型将具有客观性、高效性、多角度性且可重复性的技术手段应用于肺癌诊断中,能很大程度缓解临床医生的工作压力,减少医生由于疲劳导致的误诊,可能会改变当前的医疗模式,有望使医生作为一个决策者的身份工作。AI技术已经越来越多应用于临床诊疗实践中,在2020年抗击新型冠状病毒疫情工作中,如AI天眼CT等影像学AI产品已应用于火神山、瑞金等多家医院进行新型冠状病毒肺炎的初步筛查,有效减少患者之间的接触,且诊断率可以达到90%以上。在未来的发展过程中,将放射图像、基因组学、病理学、电子健康记录等多个数据流聚集到强大的综合诊断系统中并结合5G可以是AI发展的一个方向,使得弱AI时代迈向真正的AI时代,并进一步缩小我国医疗资源发展的不均衡。
参考文献
杨宁,金大成,陈猛,王兵,贺晓阳,张斯渊,苟云久.人工智能在肺癌诊断中的研究进展.中国胸心血管外科临床杂志,2020,27(12):1466-1471.doi:10.7507/1007-4848.202005014
返回搜狐,查看更多