人工智能肺部结节辅助诊疗系统预测肺结节的良恶性及浸润情况
此外,在胸部CT首次发现肺结节时,临床医生常常建议患者3个月或6个月后复查胸部CT,在两次或多次复查胸部CT后,我们可以得到结节体积的动态变化,也就是结节的生长速度[6],我们常常用肺部结节的体积倍增时间(volumedoublingtime,VDT,指结节体积增大一倍所用时间[7])表示结节的生长速度。我们通过传统CAD系统对结节体积进行三维测量,该系统可以自动估算出结节的VDT。根据一些相关文献[8-10]报道,不典型腺瘤样增生(atypicaladenomatoushyperplasia,AAH)的VDT约为(859.2±428.9)d,炎性结节随访期间体积可能缩小或完全吸收,VDT在30~360d要高度警惕恶性肿瘤的可能。在本研究中通过回顾性分析肺结节手术患者的病理结果,探究使用该智能系统计算肺结节的恶性概率和VDT,用于预测术后病理良恶性及浸润程度的可靠性。
1资料与方法
1.1临床资料和分组
选取2019年1月至2020年8月厦门大学附属第一医院收治的87例肺结节患者,其中男33例(37.9%),平均年龄(55.1±10.4)岁,女54例(62.1%),平均年龄(54.5±14.1)岁。结节平均直径(1.017±0.383)cm。共90枚结节,其中恶性结节80枚(88.8%)、良性结节10枚(11.1%)。将结节分为恶性肿瘤组(80枚)和良性病变组(10枚),其中恶性肿瘤组又分为浸润性腺癌组(60枚)和非浸润性腺癌组(20枚)。
1.2纳入和排除标准
纳入标准:(1)肺结节最大径0.9具有较高准确性。由于恶性概率与VDT检验方向相反,故对恶性概率做倒数处理。P0.05);通过分析智能系统得出的恶性概率发现,恶性结节的恶性概率明显高于良性病变(87.2%±9.1%vs.28.8%±29.0%,P=0.000),使用ROC曲线评价恶性概率鉴别良恶性结节的能力,AUC为0.949(0.863~1.000),敏感度和特异性分别为96.3%和90.0%。此外,良性病变组结节最大径大于恶性结节组最大径[(1.270±0.481)cmvs.(0.990±0.361)cm,P=0.026];良性病变组的VDT明显长于恶性结节组[(1083.600±258.180)dvs.(527.025±173.176)d,P=0.000]。绘制ROC曲线评价VDT鉴别良恶性结节的能力,AUC为0.975(0.946~1.000),敏感度和特异性分别为91.3%和100.0%;见表1、图1。
表1恶性肿瘤组与良性病变组比较(/例/%)
图1恶性肿瘤组与良性病变组VDT和恶性概率的ROC曲线
VDT、恶性概率的AUC分别为0.975、0.949;ROC曲线:受试者工作特征曲线;VDT:体积倍增时间;AUC:曲线下面积
2.3浸润性腺癌组与非浸润性腺癌组比较
两组患者在性别、年龄方面差异无统计学意义(P>0.05)。恶性概率在两组间差异无统计学意义(P>0.05)。绘制ROC曲线评价恶性概率鉴别恶性结节的浸润情况能力,AUC为0.630(0.474~0.786),敏感度和特异性分别为50.0%和86.7%;浸润性腺癌组结节最大径大于非浸润性腺癌组最大径[(1.350±0.355)cmvs.(0.863±0.271)cm,P=0.000];浸润性腺癌组VDT明显较非浸润性腺癌组短[(392.200±138.050)dvs.(571.967±160.633)d,P=0.000]。绘制ROC曲线评价VDT鉴别恶性结节的浸润情况能力,AUC为0.829(0.714~0.944),敏感度和特异性分别为70.0%和86.7%;见表2、图2。
表2浸润性腺癌组与非浸润性腺癌组比较(/例/%)
图2浸润性腺癌组与非浸润性腺癌组VDT、恶性概率的ROC曲线
VDT、恶性概率的AUC分别为0.829、0.630;ROC曲线:受试者工作特征曲线;VDT:体积倍增时间;AUC:曲线下面积
3讨论
随着人民生活经济水平的提高,胸部CT逐渐取代普通X线平片,越来越多地出现在居民常规体检项目中,胸部CT可以发现普通X线平片难以发现的肺小结节,对早期发现肺癌有着重要的作用。但由于不同医院甚至不同医生对肺结节的认识不尽相同,其对肺结节性质的判断可能也会有所偏差。在本研究中尝试使用智能系统和传统CAD提供的信息来预测肺结节的性质,探究其对肺结节病理情况预测的效能。
本研究中使用人工智能系统,对患者肺癌良恶性概率进行分析,发现术前胸部CT得出的恶性概率在恶性肿瘤组中显著高于良性病变组(P0.05),AUC为0.630,其对恶性结节的浸润程度预测准确性较低。以上数据表明该智能系统能较为准确地鉴别出结节的良恶性,但无法区分出恶性结节的浸润程度,这与提供给智能系统学习的影像与病理信息有关。在训练智能系统时,仅仅提供结节影像与病理良恶性的情况,并未提供相应影像所对应的恶性结节浸润程度,所以智能系统在没有学习相关恶性结节浸润程度的情况下,无法对恶性结节的浸润程度做出预测也在情理之中。如果可以进一步完善该系统,可以给予智能系统更加完善的训练资料,以达到对肺部结节更加全面的分析预测。
Walter等[11]分析了680例患者,共1020枚结节,发现VDT在新发结节方面对鉴别肺恶性肿瘤有很高的准确度(AUC=0.91)。裘杨波等[12]分析了143例早期肺腺癌发现,附壁生长为主型肺腺癌的VDT为(594±272)d,伴少量附壁生长成分浸润性腺癌的VDT为(520±285)d,完全浸润性腺癌的VDT为(371±183)d。在本研究中,通过智能系统测量结节体积,软件自动估算两次CT间隔时间内的结节VDT;见图3。在区分结节良恶性和浸润程度方面,良性病变组和恶性肿瘤组的VDT差异有统计学意义[(1083.600±258.180)dvs.(527.025±173.176)d,P=0.000],ROC曲线显示AUC为0.975,临界值为782.0d,特异性为100.0%;在浸润性腺癌组和非浸润性腺癌组间的VDT差异同样有统计学意义(392.200±138.050)dvs.(571.967±160.633)d,P=0.000];在ROC曲线中,AUC为0.829,临界值为423.5d。以上数据表明VDT能较为准确地区分出结节的良恶性和浸润程度,782.0d和423.5d可以分别作为肿瘤的良恶性和恶性肿瘤浸润与否的临界值。特别值得注意的是,在VDT临界值为782.0d时鉴别结节的良恶性的特异性达到100.0%,说明其对纳入研究的恶性结节有非常良好的鉴别排除能力,可帮助临床医生在术前对肺部结节的病理情况提前进行评估,对术前设计手术方式提供重要的参考。
图3基于人工智能的肺部结节辅助诊疗系统所提供的肺结节倍增时间
除了恶性概率与VDT外,结节的直径也与肺结节的病理密切相关。Zhang等[13]和Son等[14]的两项研究表明,肺结节的最大径被认为是浸润性腺癌和非浸润性腺癌分类的一个预测因子。在本研究中同样发现结节的最大径分别在肺部良性肿瘤与恶性肿瘤、非浸润性腺癌与浸润性腺癌之间存在显著差异,在术前评估结节的情况时,结节的最大径依然是需要考虑的指标之一。
由于需要分析结节的VDT,需排除术前只做了1次胸部CT的患者。然而,考虑到大部分术前只需要做1次CT检查即有明显手术指征的肺结节,常常具有明显恶性征象,其恶性度常常也较高,本研究却排除了这一类患者,因为这个原因所造成的数据偏倚,可能导致入组的肺结节VDT偏大,实际上的肺结节VDT更短。
综上所述,目前应用的基于人工智能的肺部结节辅助诊疗系统所提供的恶性概率和倍增时间等信息,可以在术前对肺部结节的良恶性分类和浸润情况进行初步分析,其中恶性概率能够较为准确地鉴别肺部良性病变与恶性肿瘤,而倍增时间对于结节的良恶性及浸润情况均有较好的区分能力。
利益冲突:无。
作者贡献:曹孟昆负责论文设计、论文初稿撰写;蔡夕倩、朱晓雷、李宁、刘鸿鸣、邓城庆负责数据整理与分析;姜杰、耿国军、王剑翁、林俊峰负责论文审阅与修改。
参考文献略。
返回搜狐,查看更多