泰安市卫生健康委员会 市直动态 肺结节人工智能(AI)诊断系统,让肺结节“无处可逃”——泰安市中医医院肺病一科让您远离肺癌
近年来,癌症患者日渐增加,特别肺癌增长更快,根据世界卫生组织(WHO)报告显示,中国每年新发肺癌患者65万人,且以每年27%的速度上升,肺癌已成为中国发病率高、死亡率高的肿瘤。随着肺癌发病率的不断提高以及年轻化趋势,肺癌已成为威胁我国人群健康的第一癌症杀手。
肺癌早发现,早治疗,可以极大提高患者生存率(高达90%以上),但早期肺癌多表现为小结节病灶,体积小,成分复杂(实性结节、磨玻璃结节、磨-实结节),不同医生主观判断性的差异,容易造成部分小结节(早期肺癌、原位癌)漏诊、误诊,病灶大小测量不准确,不利于对结节病变的定性,随访观察,不利于及时发现结节大小、成分的变化,影响小结节病灶的及时诊断及制定治疗方案。
经过近2个月的测试运行,近日,泰安市中医医院肺病一科率先引进了目前全球最先进的肺结节人工智能(AI)诊断系统。这意味着,医生联手“人工智能”,可让更多肺癌患者在早期就能得到及时治疗。
人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。通过人机合作“组队”阅片,借助人工智能的力量,就能快速对所有完成的胸部低剂量螺旋CT扫描图像进行筛查,并自动对可疑肺小结节进行精准定位,量化分析结节成分(实性结节、磨玻璃结节、磨-实结节),用色框清晰标注小结节坐标提示医生,并对结节的可疑病灶数、性质、直径、体积、CT值等信息以及影像学表现进行描述,直观显示肺结节与肺组织结构关系,多角度精准定位监控肺结节,提供个性化早期肺癌风险评估,帮助医生提高阅片效率,同时为随访提供准确依据。
肺结节人工智能诊断系统对肺结节的检出,可实现0-30mm结节的秒级检出、良恶性预测、智能随访、自动化结构报告等功能。对磨玻璃结节、0-5mm微小结节等临床诊断难点,AI都可精准识别与定位,并可对肺结节进行定期随访和监测。人工智能通过自动配准技术,实现结节生长周期的全面观测,对大小、密度、形态的变化进行对比分析,识别疾病进展风险,提升临床对患者的疾病管理能力。该系统提供自动化的图文报告,为临床提供图文并茂的诊断报告,提供更加丰富的诊断依据。
相对于人工阅片诊断,AI辅助智能诊断很好地发挥了速度和准确率两方面的优势,帮助医生轻松应对高强度的影像阅片工作量,同时对结节检出的准确率也进一步提高,智能分析有临床价值的结节及肿块病灶,根据系统风险评估,做出详细的良恶性评估,并给出相应治疗、随访意见,确保每次分析真实有效,有意义,确保发现早期肺癌,提高生存率,同时也在科内建立健康档案,以备复诊查阅。
温馨提示:
做肺结节人工智能分析需要准备什么?
如果是在我院做的肺CT,在门诊缴纳刻录光盘费,前往CT室进行光盘刻录,刻录完成后持光盘前往门诊即可,上传系统后会自动提取你的影像资料进行分析。如果是外院做的CT,需要提供院外CT刻录的光盘,图像格式必须是DCOM格式。
哪些人需要做筛查?
年龄≥40岁且具有以下任一危险因素者:
1.吸烟≥20包/年(或400支/年)或曾经吸烟≥20包/年(或400支/年),戒烟时间
人工智能在肺癌诊断中的研究进展
杨宁1,2,金大成1,2,陈猛1,2,王兵1,2,贺晓阳1,2,张斯渊1,2,苟云久2
1.甘肃中医药大学(兰州 730000)
2.甘肃省人民医院胸外一科(兰州 730000)
通信作者:苟云久,Email:gouyunjiu@163.com
关键词: 肺癌;人工智能;深度学习;神经网络
引用本文:杨宁,金大成,陈猛,王兵,贺晓阳,张斯渊,苟云久.人工智能在肺癌诊断中的研究进展.中国胸心血管外科临床杂志,2020,27(12):1466-1471.doi:10.7507/1007-4848.202005014
摘要
肺癌的早期诊断和相应的治疗措施是降低死亡率至关重要的因素。人工智能作为新兴的科学技术飞速发展,与医疗领域相结合,为肺癌的早期诊断提供了新思路,并取得了显著的成效。人工智能极大地缓解了临床工作压力,改变了当前医疗模式,有望使医生作为一个决策者的身份工作。本文主要阐述人工智能在肺结节良恶性鉴定、病理分型、标志物测定、血浆循环肿瘤DNA检测等方面的研究进展。
正文
肺癌是目前发病率最高的癌症,也是癌症性死亡的主要病因,每年近180多万人因肺癌死亡。随着我国人口规模和人口老龄化的增加,肺癌的患病率将不断上升[1-2]。虽然各种各样新的肺癌诊治方式不断应用于临床,但是目前肺癌患者的生存结果仍不乐观。归根结底是肺癌的早期诊断率低,大多数患者确诊时已到达晚期(晚期5年生存率为18%),对肺癌早期有效诊断并给予相应的治疗措施,患者生存率可以提高20%[3-5]。医学影像组学和生物分子标志物诊断等技术进步有望解决目前肺癌诊断中面临的挑战,但同时也伴随着大量数据的产生,如何深度解读数据信息以及应对繁重的临床工作任务又是一大难题。近年来人工智能(artificialintelligence,AI)科学技术突飞猛进,广泛应用于物流、家居、交通、医疗卫生等行业,深刻改变着人类的生活。AI与医疗卫生行业的相互结合极大地克服了目前医学面临的难题,AI在肺癌的检测、诊断和治疗方面取得了突破性的进展[6]。本文旨在阐述AI在肺癌诊断中的应用现状和发展趋势。
1 人工智能应用现状和进展
1.1 人工智能鉴别肺结节的良恶性
肺部体检筛查经常发现许多不确定的实性结节、部分实性结节和纯磨玻璃密度结节,这些早期病变中只有一小部分最终被诊断为恶性。结节良恶性的确定是指导治疗的基础,可以有效防止恶性结节的进一步发展和减少良性结节的过度医疗[7]。临床医生通过使用CT、正电子发射计算机断层显像(PET-CT)、X线片和穿刺活检等方法诊断结节的良恶性。由于穿刺活检具有侵入性,可能会造成严重并发症,放射组学检查是最合适的肺结节辅助诊断方法。随着影像学成像技术的不断革新,更薄层的CT成像能提高肺结节的检出灵敏度,但同时生成的影像学切片图像数量会使得影像科医生的工作任务翻倍,增加漏诊、误诊以及降低工作效率。计算机辅助诊断系统(computer-aideddiagnosis,CAD)是一种可被用来检测肺结节并能区分良恶性的医学影像AI系统,具有不疲劳性和高效性。CAD系统是基于数据纹理提取、预处理、分割,结节检测和良恶性判断这几个基本步骤来实现肺结节的诊断[8]。
CAD系统在结节检测和定位方面具有一定的优势,但由于某些良恶性结节在形态上极为相似,不同的研究人员发现传统CAD对于肺结节的诊断率为38%~100%,肺结节良恶性的诊断仍是一个具有挑战性的难题[9]。概率神经网络(probabilisticneuralnetwork,PNN)能够将神经网络与统计相关理论结合,其在CAD系统中的应用极大改善了这一现况。有研究者[10]使用了一种改进的乌鸦搜索算法(crow-searchalgorithm,CSA)的PNN模型检测肺结节,改进后的混沌乌鸦算法(chaoticcrow-searchalgorithm,CCSA)通过提取CT图像中最优特征子集及改变子集长度并用于当前最流行的纹理特征分析工具灰度共生矩阵(gray-levelco-occurrencematrix,GLCM)分析,减少了GLCM分析特征的数量[11]。研究对比发现,使用包含所有分析特征的GLCM分析系统检测肺结节准确率为82.5%,而使用CCSA的GLCM特征分析系统检测准确率提高到了90%,通过提取显著的图像特征可以提高诊断率。在卷积神经网络(convolutionalneuralnetwork,CNN)对影像学图像分析方面取得的最新成果的基础上,Nasrullah等[12]对之前研究中使用过的深度学习肺结节检测模型进行了大量的修改,使用多种策略的深度学习模型对肺结节进行自动检测和分类,该系统分别使用两种深度三维(3D)自定义混合链接网络(customizedmixedlinknetwork,CMixNet)架构进行肺结节检测和分类,通过快速区域-卷积神经网络(regionconvolutionalneuralnetwork,R-CNN)进行检测,并通过U-Net编解码结构的CMixNet学习结节特征,结节的分类是通过梯度增强机(gradientboostingmachine,GBM)对从检测的3DCMixNet结构中学习到的特征进行的,并结合生理症状和临床生物标志物进行最终判定。此系统还可以通过无线身体区域网络(wirelessbodyareanetworks,WBAN)对患者进行持续监测,有助于诊断慢性疾病,特别是肺癌的转移情况。使用该系统在肺部图像数据库联盟和图像数据库资源计划(LungImageDatabaseConsortiumandImageDatabaseResourceInitiative,LIDC-IDRI)[13]中训练,敏感度和特异度分别为94%、91%。
X线片是基层医疗卫生单位应用最广泛的影像学检查,也是肺部疾病初筛的检查方式,但是传统的胸部X线片(CXR)对于早期肺结节检出率极低。研究[14]指出CAD应用于CXR辅助诊断肺结节检出,敏感度和特异度分别为62%、58%,特异度低的CAD会产生较多的假阳性肺结节。随后Cha等[15]设计了一种基于深度卷积神经网络(deepconvolutionalneuralnetworks,DCNNs)的深度学习模型,这种系统在ResNet-50和ResNet-101的深残留网络基础上,又插入了一个新的全卷积网络(FCN-16S)。在LIDC-IDRI数据库中和当地医疗机构选取了经手术确诊的1483张癌性肺结节X线片作为测试集,对比6名放射科医师和深度学习模型对于结节的检出率,结果显示人工检出的平均曲线下面积(AUC)为82%(75%~86%),深度学习模型的AUC为90%,具有较好的检测效能。
1.2 人工智能预测肺癌病理分型
实施精准化治疗的基础是正确区分肺癌的病理分型。当前治疗方案的选择,包括常规手术治疗、放化疗以及最新的靶向治疗和免疫治疗,均根据组织学分类选定[16]。临床上肺癌分为小细胞肺癌和非小细胞肺癌(non-smallcelllungcancer,NSCLC),NSCLC占肺癌绝大多数,也是肺癌死亡的主要病理类型,NSCLC主要包括肺鳞癌(lungsquamouscellcarcinoma,LUSC)和肺腺癌(lungadenocarcinoma,LUAD)[17]。活检是确定肺癌病理分期分型的金标准,同时也是一种有创操作,可能会造成严重的并发症。一项研究[18]探索基于CT图像特征分析的机器学习方法对NSCLC进行病理分型,运算过程中使用随机森林算法减少基尼杂质并选择最优图像特征分析肺癌的分型,结果显示该模型对LUAD和LUSC具有较高的分类精度,且LUAD的预测精度大于LUSC。研究发现氟代脱氧葡萄糖(18F-FDG)代谢在LUSC和LUAD之间具有差异性。Hyun等[19]根据PET-CT影像学特征设计开发机器学习预测模型鉴别LUSC和LUAD,该研究运用基尼系数从4个临床特征和40种图像特征中确定了9个最优特征子集。在396例患者中回顾性地评估了随机森林、神经网络、朴素贝叶斯方法、逻辑回归和支持向量机5种分类器的性能,当特征选择数量大小为15时,AUC分别为79%、85%、76%、86%和77%,并应用逻辑回归分类器获得性别、最大标准摄取值(SUVmax)、灰度长度不均匀性、灰度不均匀性和全病变糖降解为LUAD最佳预测因子。
若癌变发生在支气管时,常规的支气管镜活检是高效获取病理信息的方法,由于同一肿瘤内部不同区域存在异质性,镜检只能显示局部的病理信息,不能全面显示整块病变的情况[20]。传统的CAD可以通过白光支气管镜获得的图像进行黏膜和肿瘤分类,并取得了成功。Feng等[21]提出了一种用于鉴别肺癌类型的新型CAD系统,将白光支气管镜图像中的直观红-绿-蓝(RGB)转化为色调-饱和度-值(HSV),提取HSV每个彩色通道中的14个GLCM纹理特征对肿瘤分型进行定量分析,对纳入的22例LUSC和LUAD患者图像进行分析,准确率、灵敏度、特异度和AUC分别为86%、90%、83%和82%。
1.3 人工智能对肺癌标志物测定
除了利用影像组学检出肺部恶性病变外,肿瘤标志物在癌症检测中也有至关重要的作用。标志物检测的阳性结果能够提示肿瘤可能发生,可作为早期检测肺癌的指标之一。目前临床用来诊断肺癌的肿瘤标志物并不是很多,且大多数都不具有特异度。新的证据表明肺癌患者体内某些长链非编码RNA(longnon-codingRNA,lncRNA)是异常的,一些lncRNA可以促进或抑制癌症的进展,并且可以作为诊断标志物[22]。Wang等[23]将机器学习和加权基因共表达网络(weightedgeneco-expressionnetworkanalysis,WGCNA)、Lasso算法、随机森林算法、支持向量机等技术用于癌症基因组图谱(thecancergenomeatlas,TCGA)数据库1364个lncRNA中筛查LUAD最佳生物学标志物。TCGA数据库是国家癌症研究所和国家人类基因组研究所的一个联合项目[24]。最终LANCL1-AS1、MIR3945HG、LINC01270、RP5-1061H20.4、BLACAT1、LINC01703、CTD-2227E11.1和RP1-244F24.1被确定为LUAD标志物,MIR3945HG同时也是LUSC诊断价值最高的生物学标志物且与生存期密切相关[25]。
免疫组织化学(immunohistochemical,IHC)生物标志物已经越来越多应用于肿瘤诊断、转移、治疗规划和疗效评估等方面。Ki67(也称MKi-67)染色在肿瘤学中常被用来估计肿瘤的增殖指数,通过采取组织活检并进行IHC分析,将阳性和阴性作为诊断结果来判断肿瘤是否增殖[26]。有研究[27]表明,Ki67水平不仅是二元的,在一个细胞周期,Ki67在S、G2、M期增高,在G0、G1期降解,定量分析Ki67水平可推断细胞最后一次分裂的时间以及对细胞增殖进行分类。肺癌内部的异质性可能是晚期肺癌低生存率的主要原因,理论上可通过量化分析影像图像特征和灰度空间分布来动态监测Ki67表达引起全肿瘤内部生物行为学特征,从而避免活检的有创性和局限性[28-29]。最近一项研究[30]通过机器学习放射组学分类器来预测NSCLC中Ki67表达水平,该研究基于图像摄取、肿瘤分割、特征提取和建立分类器工作流程共纳入245例NSCLC患者进行分析。在纹理特征提取之前,使用灰度归一化尽量减少对比度和亮度变化的影响[31],并用随机森林法选出最优特征子集,分别测试放射组学分类器、主观成像特征分类器和组合分类器性能,综合比较发现放射组学分类器性能优于其它两种分类器,其检测敏感度、特异度和AUC分别为73%、66%和78%。这是第一项利用CT影像资料无创预测Ki67表达水平的研究,同时也为肿瘤标志物的检测提供了更加快捷、安全、全面、准确的思路。
1.4 人工智能对早期肺癌血液检测
癌症液体活检作为一种新型非侵入性诊断手段,通过检测血浆中的循环肿瘤细胞(circulatingtumorcells,CTCs)和循环肿瘤DNA(circulatingtumorDNA,ctDNA)等获取患者体内肿瘤异常生长信息并用于肿瘤的诊断。ctDNA是游离DNA(cell-freeDNA,cfDNA)的一种,目前对cfDNA的起源和分子特征了解很少。Cristiano等[32]开发了一种可以评估整个基因组中cfDNA裂解方式的模型,发现健康个体和癌症患者在基因图谱发生不同的改变,分别为白细胞的核小体改变和片段性改变,并用此方法分析了包含6种癌症的236例患者和245名健康个体的cfDNA片段特征,这些分析结果为以后癌症的筛查检测提供了原理方法。
来自斯坦福大学的研究团队Chabon等[33]研发并前瞻性地验证了一种称为“血浆中肺癌可能性”(lung-CLIP)的机器学习模型用于早期NSCLC的筛查(表1)。研究发现克隆性造血细胞与肿瘤细胞均可以产生ctDNA,但两者在变异等位基因频率(VAF)、cfDNA片段碱基取代谱、分子片段长短和TP53基因突变方面存在不同。在确定了不同来源cfDNA片段的差异性特征后,将血浆分子靶向测序、单核苷酸变体(SNV)模型和深度测序(CAPP-Seq)的全基因组拷贝数分析与机器学习模型整合在一起设计出Lung-CLIP,并设计了更具有优点的被称为灵活的纠错双工适配器(“FLEXAdaptors”)用于该模型中,增加了Lung-CLIP的鲁棒性。该团队早期使用包含104例早期NSCLC患者和56例风险匹配对照患者对Lung-CLIP进行了训练,在80%特异度下,Ⅰ期NSCLC敏感度为63%,且Lung-CLIP可以根据临床不同的需要调整检测的特异度。随后又前瞻性地验证了独立机构招募的46例早期NSCLC患者和48例风险匹配对照患者中Lung-CLIP的表现,其结果与训练中的表现相似,这种验证方法降低了模型过度拟合的风险,从而避免较高的假阳性结果。这种筛查方式可能使美国肺癌患者被救治的生命数量从目前的每年约600例增加到接近预期的最大值约12000例。此外,研究结果发现ctDNA水平与早期NSCLC的预后密切相关,未来可以将治疗前的ctDNA测量结果纳入NSCLC分期,并启用结合治疗前和治疗后变量的实时风险模型,以个性化预测患者预后。
2 人工智能应用的不足与局限性
人民生活水平的逐步提高对医疗健康的需求与日俱增,加剧了医疗资源的紧缺,需要有新的技术解决这一挑战。随着神经网络、深度学习算法等关键技术的突破和应用,AI应用于医疗卫生行业的潜力不断被挖掘,在疾病的诊断与监测、疗效评价、生存预测、药物试验和健康管理等方面发挥重要作用,并得到了医学专家的认可[34-36]。目前虽有大量AI医疗产品问世,但是AI仍处于起步阶段,在肺癌的诊断中存在较多问题。首先是AI在医学上的应用正在超越法律的监管和限制。由于AI在医疗运用中的有效性和可靠性仍未被明确证明,现行的法律没有清晰规定AI应当承担的责任范围,AI在医疗服务中出现的失误需要医生来承担责任,但医生并不是这方面的专家,不能鉴定产品的好坏,再加上内部处理器存在“黑匣子”问题,使得AI责任评估更加困难[37]。当下急需建立AI责任归属相关的法律,从法律层面划分医生、患者与AI企业应当承担的责任,这样才能督促企业完善产品的性能并保护患者隐私。其次,目前所有诊断的AI技术都是基于回顾性研究分析来确定诊断效能,且样本量小,用来训练的数据库一般都是LIDC-IDRI等公开数据库,存在一定的取样偏倚。有报道发现在诊断皮肤癌方面胜过临床医生的AI技术产品主要接受了高加索人种患者的数据培训,当将相同类型的诊断算法应用于其他人种时,准确性会急剧下降,目前应当建立属于我们自己的高质量数据库,用来进行AI产品的训练。最后,绝大多数医疗AI产品均是检测单一病种,在实际应用环境中,患者可能患有多种肺部疾病,如何区分并且辨别病种是AI发展的另一挑战。AI技术检测小结节的准确度低,可以进一步提高AI技术检测的精度。AI技术同时应该投入临床中开展大规模的前瞻性队列研究,也需要培训临床医生与患者沟通有关AI在诊断和治疗中的作用,以进行有效的信息传递交流,并将AI使用过程中的缺点反馈给AI企业,在实践运用中发现问题并解决问题才能设计出更符合当前需求的产品。
3 小结与展望
综上所述,AI检测肺癌研究模型被广泛开发,这些模型将具有客观性、高效性、多角度性且可重复性的技术手段应用于肺癌诊断中,能很大程度缓解临床医生的工作压力,减少医生由于疲劳导致的误诊,可能会改变当前的医疗模式,有望使医生作为一个决策者的身份工作。AI技术已经越来越多应用于临床诊疗实践中,在2020年抗击新型冠状病毒疫情工作中,如AI天眼CT等影像学AI产品已应用于火神山、瑞金等多家医院进行新型冠状病毒肺炎的初步筛查,有效减少患者之间的接触,且诊断率可以达到90%以上。在未来的发展过程中,将放射图像、基因组学、病理学、电子健康记录等多个数据流聚集到强大的综合诊断系统中并结合5G可以是AI发展的一个方向,使得弱AI时代迈向真正的AI时代,并进一步缩小我国医疗资源发展的不均衡。
利益冲突:无。
作者贡献:杨宁负责论文设计、数据整理与分析、论文初稿撰写与修改;金大成、陈猛、王兵、贺晓阳、张斯渊负责论文审阅与修改;苟云久负责论文设计。
CAS Authentication wanted!
CASAuthenticationwanted!YoushouldalreadyhavebeenredirectedtotheCASserver.Clickheretocontinue.
phpCAS1.3.1usingserverhttps://www.medlive.cn/auth/(CAS2.0)