人工智能辅助恶性肿瘤诊断的应用进展
0引言基因组学、代谢组学和影像组学的不断发展,为肿瘤患者精准医疗提供了大数据支撑,但也给肿瘤医师数据分析带来巨大挑战。人工智能(artificialintelligence,AI)尤其是深度学习(deeplearning,DL)能够大批量处理高维数据,在影像识别方面AI能够自动识别和动态监测靶病灶,辅助临床医师获得更准确的影像学评估,提高工作效率,减少工作负荷,在肿瘤诊断、复发检测和个体化诊疗方面具有重要价值。尽管AI在肿瘤辅助诊断领域取得了丰硕成果,但在临床实践中尚面临数据可及性、模型鲁棒性(Robustness)和泛化性以及结果可解释性等诸多挑战。本文主要对AI基本原理、前沿进展、面临挑战和未来展望等方面探讨AI在恶性肿瘤诊断领域的应用进展。
1AI概述及基本原理人工智能是利用计算机算法执行类似人类的智能行为并完成相关任务的技术,最早于20世纪50年代提出[1],源于数学和计算机科学,是一种迭代的“自学习”技术,可发现数据间的内在联系,并更快地执行任务。
机器学习(machinelearning,ML)是AI的分支,兴起于20世纪80年代。ML主要研究计算机如何模拟或实现人类的学习行为,获取新知识、完善已有知识框架和自身性能。ML可在无明确编程指令的情况下执行任务,发现数据间的隐藏关系[2],进行数据分析,常用的Logistic回归、线性回归、决策树、随机森林(randomforest,RF)、朴素贝叶斯和K-means聚类分析、多层感知机(multi-layerperceptron,MLP)、支持向量机(supportvectormachine,SVM)等[3]均属于ML,其中Logistic回归广泛用于肿瘤学研究[4]。ML可分为有监督学习、无监督学习和增强学习。有监督学习是将有明确标签的数据按一定规则或比例随机分为训练集和验证集,对训练数据进行拟合获得模型,通过验证集检验该模型的效能,从而得出结论,常用于处理数据回归和分类问题。例如,通过统计儿童性别、各年龄阶段的身高和体重等数据,得出儿童身体发育模型(回归),进而用于判断普通儿童的发育状态(分类)。无监督学习是指数据没有分类标签,计算机根据数据间的相似性或差异进行聚类[5],使同类数据差异最小,不同类数据差异最大,常用于数据降维处理和聚类分析。例如人脸识别系统,客户端将面部图像进行特征提取(降维),与用户信息一起输入服务器终端,当需要识别时内部系统会对新的面部特征与终端进行匹配,即使与录入时的光线、角度不同,仍能准确识别用户身份(聚类)。增强学习,是指先利用未分类数据进行训练,建立初步模型,再通过反馈性评价模型优劣指导下一步学习,通过不断地试错和反馈进行“自我学习”,一般解决序列决策和智能控制问题。我们熟知的“Alpha-Go”和“无人驾驶汽车”就是增强学习模型的典型代表,其中无人驾驶汽车是通过车载传感器感知车辆周围环境,并根据车况和路况控制车转向和速度,从而实现安全行驶。
人工神经网络(artificialneuralnetworks,ANN)和深度学习是机器学习的新领域,旨在通过计算机模拟人类大脑进行数据分析。AI、ML和DL三者关系,见图1。ANN源于人大脑神经元相互连接的生物学习模式[6],具有级联、变化和分层等能力。DL是ANN的进阶,使用分层ANN开发更为复杂的学习模型,以理解不同维度的数据[7]。DL包括深度信念网络(deepbeliefnetwork,DBN)、卷积神经网络(convolutionneuralnetworks,CNN)和递归神经网络(recurrentneuralnetwork,RNN)等,其中卷积神经网络算法在图像处理方面具有独特优势,已用于临床影像数据特征提取和分析,递归神经网络算法通过对时间序列数据进行分析,用于疾病动态监测。传统ML需将原始数据进行特征提取并处理为结构化数据集,无法直接处理非结构化的数据。DL能直接处理包括图像、声音、语言在内的非结构化数据,在临床影像分类、病历文本分析和肿瘤诊断[8-9]方面具有优势。
AI:artificialintelligence;ML:machinelearning;DL:deeplearning.图1AI、ML和DL三者关系图Figure1RelationamongAI,MLandDL图选项2AI与恶性肿瘤诊断AI可利用异质性数据辅助肿瘤诊断、判断预后、制定个体化诊疗方案[10-13],还可连接众多的移动设备,如智能手机或可穿戴装备等终端,开发“数字生物标记物”,预测临床结果。DL在肿瘤诊疗领域的相关研究近年来突飞猛进,见图2。下面我们将深入探讨AI在皮肤肿瘤、肺癌、前列腺癌、乳腺癌及卵巢癌诊断和肿瘤放疗的应用进展。
图2近十年“Medline/PubMed”中“Deeplearning”在肿瘤诊疗领域文章发表情况Figure2PublicationofdeeplearninginthefieldoftumordiagnosisandtreatmentinMedline/PubMedinthepasttenyears图选项2.1AI与皮肤肿瘤皮肤肿瘤位于体表,其诊断主要依靠病变部位的颜色变化和形态特征,并通过病理确诊。AI中CNN算法可有效处理皮肤肿瘤的图像数据,进行分割、内部特征提取和分类。2018年德国海德堡大学一项前瞻性研究[14]显示,AI较皮肤科医生能更准确地诊断皮肤黑色素瘤。该研究通过卷积神经网络(CNN)深度学习20例恶性黑色素瘤和80例良性痣的图片,与17个国家58名皮肤科医生的诊断进行比对,结果显示,CNN算法的诊断符合率(AUC)为0.86,高于皮肤科医生的0.79(P