博舍

【优秀论文】美国人工智能医疗器械监管与应用分析 人工智能在医疗健康中的应用论文题目

【优秀论文】美国人工智能医疗器械监管与应用分析

本文关键词:    人工智能;医疗器械监管;上市审批;美国食品药品监督管理局         

引言 

近年来,人工智能技术在医疗器械领域的应用发展迅速,为多种疾病的诊断、慢性病的监测与管理提供了更为高效的技术手段[1-2],而人工智能医疗器械的注册审批是决定该技术能否产品化、获得市场准入并进行规模化临床应用的前提条件。不同于传统医疗器械,人工智能医疗器械具有迭代速度快、算法可释性差、对诊疗影响较大等特点,产品审批涉及产品划分、算法评估、临床评价、数据处理等多方面内容,难度较大,对管理机构和人员在审批途径、方法、指标等方面的选择提出挑战[3-4]。2017年8月,美国出台《数字健康创新行动计划》(DigitalHealthInnovationActionPlan),提出要鼓励创新,提高管理效率,实现监管现代化[5]。作为医疗器械的监管机构,美国食品药品监督管理局(FoodandDrugAdministration,FDA)认为传统审批程序不能很好适用于人工智能医疗器械产品,计划通过开展软件预认证试点项目等改革探索,创新审批模式,提高对产品上市后真实世界数据的利用效率,为上市前审批创造较为宽松的空间,并在上市后持续保障产品的安全、有效[6-7]。与此同时,FDA针对人工智能医疗器械传统途径审批也已展开,多种用途产品陆续上市,已积累一定审批经验。本研究旨在通过对FDA人工智能医疗器械准入制度的改革创新和已上市产品审批与应用的分析,总结前沿监管思路与方法,以期为我国行政管理部门和制造商对人工智能医疗器械产品的监督与管理提供参考。          1美国人工智能医疗器械注册框架  

1.1上市前风险分类管理 

 1976年美国通过《医疗器械修正案》(MedicalDevice Amendments)[8],提出对医疗器械上市前和上市后监管的理念,建立了以产品风险为依据的医疗器械分类管理制度,将医疗器械按照风险程度分为Ⅰ—Ⅲ类[9]。FDA对Ⅰ类低风险产品实行一般控制,除极少数产品外,大多数Ⅰ类产品仅需备案管理,而不需要进行上市前通告[510(k)];Ⅱ类为中等风险产品,FDA对其实施特殊控制,需要进行510(k)审批,将拟申报医疗器械与已上市的参照器械在功能、性能、技术等方面进行对比,通过实质等同证明申报器械的安全性和有效性,从而获准上市,也有少量Ⅱ类产品可豁免510(k);对于Ⅲ类高风险医疗器械,FDA则要求制造商进行更为严格的上市前审批(Premarket ApprovalApplication,PMA[10]目前美国上市的人工智能医疗器械多数属于Ⅱ类中等风险医疗器械。 从头开始(DeNovo)通道是FDA针对高风险以外的医疗器械新品种提供的审批通道,设立于1997年,同510(k)与PMA一样,依据法律框架《联邦食品、药品和化妆品法案》(FoodDrug&CosmeticAct)下的条款513(f)(2)设立[11]。FDA规定企业进行510(k)申请时,在收到没有实质等同(NoSubstantialEquivalence,NSE)通知的30天内,可以提交DeNovo申请,请FDA对器械进行风险评估并分类,按照实际风险类型的要求进行审批。FDA会对产品使用的收益和风险进行衡量,给出是否通过的决定[12],如果DeNovo被批准,不仅该器械会被允许在美国市场销售,还会随之建立一个医疗器械新类型,后续同类产品则可以使用该分类以510(k)途径进行上市前申请[13]。在此通道设立前,无论产品风险高低,只要已上市产品中不存在相同类型,就需要提交Ⅲ类器械的PMA申请。DeNovo通道的设立加快了中低风险创新医疗器械的审批效率,降低了产品的上市成本。2016年,根据美国《21世纪治愈法案》(21stCenturyCuresAct[14]的新规定,制造商可自行就是否存在同类型上市产品做出判断,不再需要提前获得FDA的NSE即可提交DeNovo申请。 1.2软件预认证试点项目为应对人工智能软件快速持续学习、不断进化等特性所带来的监管挑战,FDA于2017年启动了软件预认证试点项目,提出将尝试建立基于制造商质量与组织卓越文化(CultureofQualityandOrganizationalExcellence,CQOE)的审批模式,作为完全基于产品的传统审批模式的选择性补充(图1)。该项目旨在通过对制造商及其产品上市后表现及管理行为的收集,评估制造商是否已建立CQOE,能否做到保障软件在全生命周期内的安全、有效[15]。2017年FDA已从100家制造商中选出9家参与首期项目,其中包括苹果、罗氏、Fitbit、强生等,并着手进行更多制造商的评选[16]。  

图1 FDA软件预认证试点项目产品监管模式

2019年,FDA公布软件预认证试点项目1.0版工作模型,根据流程,FDA将先对软件制造商的卓越性进行评价,从企业资源、用户使用、学习与成长和管理过程四个角度评价企业在患者安全、产品质量、临床责任、网络安全责任和前瞻性文化五个方面的管理水平和既往表现,评价问题多达140余项。经认可的制造商也将被分为两级,具有卓越文化且软件监管经验较多的制造商被评为二级,其低风险和中等风险产品不再需进行FDA上市审批;而具有卓越文化但软件监管经验较少的制造商为一级,仅低风险产品不需要审批。经认可制造商仍需要审批的产品将通过流程化程序进行审批,FDA将参考制造商在CQOE评估中提交的产品资料,结合制造商在证明产品分析性能、临床表现和安全性测量方面提交的材料,给出最终审批决定。FDA希望在流程化审批中更早介入与制造商的互动以提高审批效率,缩短上市所需时间。预认证项目框架另一特点在于重视上市后真实世界的产品表现和受管理情况。经认可制造商在产品上市后需要持续关注产品表现,收集用户体验、产品性能、临床结果等数据,并持续保障产品的安全性,解决出现的风险问题。此外,制造商在CQOE申请中所声明和承诺的内容也将在产品上市后的管理中由FDA进行核实与查证。1.3人工智能医疗器械预修正框架 FDA将数字医疗器械软件主要分为四类,即医疗器械独立软件、移动医疗应用程序、临床决策支持软件和医疗器械数据系统[17-18]。前三种软件涉及疾病检测、监测、诊断、治疗等功能,是目前运用人工智能技术的主要软件类型。FDA参考国际医疗器械监管机构论坛标准,根据软件所申明的用途和所针对疾病的严重性对其进行风险分类[19]。而最后一类软件功能以医疗数据的储存、传输和管理为主,通常作为低风险软件管理,不作为人工智能软件监管的重点。 以独立软件为代表的人工智能医疗器械在使用过程中会根据真实世界数据和反馈不断自我学习与进化,FDA希望能根据软件特性制定新的管理框架和监管范式,在不影响产品上市后安全性和有效性的基础上,允许其在一定程度内学习和进化以提高软件性能,且不需要重新审批[20]。2019年2月,FDA发布了《人工智能医疗器械独立软件修正监管框架(讨论稿)》(ProposedRegulatoryFrameworkforModificationstoArtificialIntelligence/MachineLearning(AI/ML)-BasedSoftwareasaMedicalDeviceDiscussionPaper),提出对人工智能独立软件进行全生命周期监管的思路与方法[21]。FDA认为人工智能软件持续的改进和迭代可以遵循以下原则:①制造商需要建立质量标准监管系统,以及包括数据管理、特征抽取、训练和评价在内的机器学习质量管理规范;②制造商可以在提交上市申请时同时提交产品在使用时发生“学习”后,性能等方面预期发生的变化,并提供产品发生预期变化后仍保持安全性和有效性的方法;③当产品发生预期变化后收集资料做好记录,如产品发生预期外变化则需与FDA沟通,将变化控制在预期之内或提交新的预期变化申请;④加强管理透明度和产品真实世界性能监测,并提交周期性报告。2上市产品情况

2.1产品分类及用途 

自2017年美国第一个人工智能医疗器械软件上市以来,该类型器械在FDA的审批数量持续上升,截至2019年底,已有数十种产品通过审批进入市场,主要审批途径为510(k)和DeNovo。这些获批产品的主要类型包括放射诊断器械、临床化学检测系统、心血管诊断和监测器械、神经病学诊断器械和眼科诊断器械等,其中以医学影像诊断软件数量最多,用途包括多种疾病诊断(表1),而目前上市的产品基本为“锁定”算法软件[22]。表1FDA批准上市的典型人工智能医疗器械(软件)注:资料来源为FDA数据库。2.1.1影像分析辅助诊断软件 2017年1月,FDA批准了首个人工智能医疗器械软件ArterysCarioDL,该软件可以通过对心脏血流和血管的核磁影像数据的分析,为医生和专家提供临床决策支持。无论是从产品名称还是产品的对外宣传都可以发现这是一款应用了深度学习技术的人工智能软件,然而在FDA发布的产品概要中却没有关于算法的描述。而且,这款产品的审批通道是510(k),其选择进行实质等同对比的两款参照器械也并未说明是人工智能软件。一年后该公司用于肿瘤学辅助诊断的产品ArterysOncologyDL上市,此次的产品概要中就明确提出应用了深度学习模型。 ContaCT是FDA通过Denovo通道获准上市的第一个影像计算机辅助分级提示软件,它通过人工智能算法对脑血管CT影像中闭塞的大血管数量进行分析,将超过阈值的影像返回医生进行复核,医生可以通过移动应用程序预先浏览这些图片的压缩版。软件概要在用途的说明中明确表示,不会在图片上做任何标记和提示,也不做出任何诊断,是医生标准诊断流程的额外辅助。为验证产品的有效性,制造商用300张脑血管CT影像对产品进行测试,并将产品判断结果与多位神经放射学专家读片标定的真实结果进行比较,结果显示产品ROC曲线下面积(AreaUnder Curve,AUC)为0.91,灵敏度和特异性分别为87.8%和89.6%。此外,制造商还进行了产品检测时间与传统流程下检测时间的对比,证明该产品的使用可以提高医生的诊断效率。FDA基于该软件设置的新分类为影像计算机辅助分类提示软件,此后又有多家公司的数款产品以该分类通过FDA准许上市,功能包括乳腺癌检查等。 OsteoDetect是一款影像计算机辅助骨折诊断软件,通过对成人后前位和侧位手腕X射线影像的分析,辅助医生识别桡骨远端骨折。产品使用深度学习算法,通过三层结构运行,即网络层、表示层和决策层。制造商对使用该产品医生和未使用该产品医生诊断结果的AUC、灵敏度、特异性、阳性预测值、阴性预测值等数据进行对比,以证明OsteoDetct可以辅助医生进行诊断。 2.1.2心电数据监测与诊断软件 AI-ECGPlatform是FDA以510(k)通道批准上市的人工智能心电图产品,其功能是进行12导联心电图数据的测量和自动化结果的分析与解释,为医生提供心率不齐、心肌梗塞、心室肥大等心脏异常的判断。医生可自行在软件判断的基础上做出确认、修正或删除的决定。该产品选择与两种参照器械分别在数据测量和数据分析上实质等同,其中一种是同公司的心电图产品,另一种是2005年上市的可编程心电图诊断软件。AI-ECGPlatform虽引入了人工智能算法,在算法上与参照软件有所不同,但产品预期功能不变且未引入影响安全性与有效性的新问题,FDA则仍判定该产品与已上市的参照器械实质等同。同样以510(k)通道获准上市的产品还包括KardiaAI等。 作为人工智能移动医疗应用程序的代表,Apple公司的两款配合其智能手表使用的非处方移动医疗应用程序ECGAPP和IrregularRhythmNotificationFeature也通过FDA的DeNovo通道获准上市,分别用于心率失常的识别和基于不规则心率的心房纤颤提醒。通过可穿戴设备获取并分析生理数据,用于特定疾病的监测也是人工智能器械的重要应用方向之一。 2.1.3糖尿病视网膜病变诊断 IDx-DR是由FDA眼科评审专家组以DeNovo途径审批通过的首个糖尿病性视网膜病变诊断软件,基于该软件设立的新分类为视网膜诊断软件。IDx-DR采用基于服务器的自适应算法,通过对眼底照相机获得的眼底彩色图像进行识别,判断视网膜病变及其程度,并由软件自动给出检测出轻度以上糖尿病视网膜病变(morethanmildDiabeticRetinopathy,mtmDR)、未检测出的mtmDR或图片质量不足以进行判断的结果,但该软件仅用于已确诊糖尿病但从未检测出糖尿病性视网膜病变的成年患者。软件从FDA收到DeNovo申请到审批上市历时仅3个月。 2.1.4生化数据监测与疾病预测软件 DreaMedAdvisorPro是由FDA临床化学评审专家组审批通过的胰岛素疗法调节器械,也是该分类下的第一款产品。该产品根据I型糖尿病患者的动态血糖监测、自我血糖监测和胰岛素泵数据的计算,就患者胰岛素泵使用的基础输注率、碳水化合物比率、校正系数以及患者行为做出优化建议,辅助医生进行临床决策。制造商提供了两组短期小规模临床试验数据,其中一组为15人的多中心试验,对比针对同一患者产品和专家所给出的建议结果,另一组为6人的单一中心试验,对比应用产品和专家的决策方案后,血糖的数据情况,结果证明DreaMedAdvisorPro与内分泌专家给出胰岛素使用方案基本相似。DIP/U.S.UrineAnalysisTestSystem是FDA通过510(k)途径上市的一款家用尿检测处方软件,由应用程序、色板和尿检测试剂条组成,用于半定量分析尿样本中的葡萄糖、蛋白质、血、尿液比重和pH值,以及定性判断尿中是否含有亚硝酸盐。该软件可以辅助医生管理并诊断影响肾脏功能导致内分泌失调的代谢性疾病或系统性疾病,而患者端是无法看到检测结果的。该软件图像识别算法运行时基于后端的云计算服务器,运用服务器端算法进行数据分析,输出检测结果。制造商通过两组试验对产品的精确性、可用性、准确性、稳定性、干扰、检测极限等指标进行评价,结果表明其各项性能皆优于其选择的参照器械,从而证明实质等同。此后,该公司用于检测尿液中白蛋白和肌酐的软件ACRLABUrineAnalysisTestSystem也通过相同途径获准上市。2.2产品审批特点 2.2.1按产品功能分类 无论从分类编号还是参与评审的专家组来看,美国人工智能医疗器械的审批与其他医疗器械一样,根据产品的功能与用途进行分类。一些影像辅助诊断产品在功能未发生改变的情况下,虽引入了人工智能算法,但仍能被视为与十余年前上市的参照器械等同,通过510(k)途径获准上市,不需要开展大规模临床实验。具有新的功能和用途的中等风险人工智能医疗器械通过DeNovo途径上市后,也将为其后续具有相似功能的产品建立新的分类,并将成为后续产品的实质性等同的参照器械,从而加快产品的上市速度。 2.2.2未突出算法解释 虽然FDA对Ⅱ类特殊控制的人工智能器械提出了算法说明要求,但从目前获准上市器械的概要文件中可以发现,产品对于算法部分的描述较为简单且没有统一标准。部分产品明确提出运用了人工智能技术或机器学习、深度学习、卷积神经网络等算法、模型,而部分产品仅提到算法,甚至少量产品未对算法进行描述,这个现象在影像辅助诊断以外的产品中尤为明显。制造商大多通过短期、小规模临床实验从产品的灵敏度、特异性等角度证明产品性能优于已上市参照器械,且在用途上未引入其他风险,即可获得实质等同的判定。 2.2.3数量与种类快速增长 近年来,美国人工智能医疗器械上市产品数量快速增长,除本土产品外,以色列、意大利、中国等多个国家都已有产品在美国上市,这一方面说明美国市场的巨大吸引力,另一方面也肯定了美国注册准入制度的效率。从已上市产品来看,人工智能软件的分类代码不断增加,既有通过DeNovo审批途径后新设立的,也有既有类型产品在技术改进后引入人工智能技术的,已实现了多种疾病的监测、诊断和检测。此外,该领域还存在同一家公司产品用途迅速扩展的特点,ZebraMedicalVision仅在2019年就有颅内出血、气胸、胸腔积液等多款产品相继上市,而AidocMedical的BriefCase也从首款颅内出血诊断产品陆续实质等同出大血管闭塞诊断等多种产品。 3讨论与总结从监管制度建设与产品上市进展来看,美国人工智能医疗器械的发展仍处于起步阶段,器械上市审批仍沿用传统审批程序,已上市的数十种产品应用范围仅包括癌症、心脑血管、眼科和骨科等领域小部分疾病的辅助诊断、检测和监测。但同时,该领域发展受到联邦政府的高度重视,上市产品数量与用途迅速增长,注册审批经验不断积累,多个针对人工智能特点制定的审批模式正在探索、试点阶段,管理当局希望能通过对制度的创新和对上市后真实世界数据的有效利用,继续加快产品上市速度,保障产品使用安全,并顺应产品特点,允许其在上市后继续“进化”。  相比于美国,中国人工智能医疗器械的准入管理更为严格,2018年8月正式施行的新版《医疗器械分类目录》对于诊断功能软件有着明确界定,通过算法对病变部位进行自动识别并提供明确诊断提示的软件,按照第Ⅲ类医疗器械进行管理[23]。基于此分类原则,目前国内提交申请的大部分新一代人工智能医疗器械都将被判定为第Ⅲ类器械进行注册与监管,需要进行严格的临床试验。此外,虽然中国在2015年发布《医疗器械临床评价技术指导原则》中就已提出同品种评价的概念,但鲜有产品通过该评价方法获批上市,所以美国常用的实质等同审批在我国较难实现[24]。我国医疗器械管理存在“严进宽出”的特点,上市后监管力度不足,数据难以获得和利用,依靠上市后数据和CQOE辅助评价的“美国模式”在当前阶段也并不适用。我国人工智能医疗器械管理需要借鉴国外已有经验并结合我国行业发展特点,就国内外器械研发方向尽快建立目标疾病的测试数据库,从产品的试验设计、临床表现、工作流程和数据安全管理等方面做好上市前评价,并逐步完善上市后监管机制,积累器械全生命周期管理数据和经验,为领域长期发展做好准备。 目前,国家药品监督管理局及其下属机构已发布《深度学习辅助决策医疗器械软件审评要点》《医疗器械生产质量管理规范附录独立软件》《医疗器械软件注册技术审查指导原则》等临床与注册指导性文件[25-27],并已着手进行眼底影像、肺部影像等数据库的建设。截至2020年底,我国已有8个国产和1个进口人工智能医疗器械通过审批并在国内上市,类型包括眼科图像诊断、心电数据监测与诊断、生化数据监测和影像分析辅助诊断等软件和器械。 

[参考文献]

[1]孟祥峰,王浩,王权,等.影像类人工智能医疗器械评价方法研究[J].中国医疗设备,2018,33(12):14-21. 

[2]GulshanV,PengL,CoramM,etal.DevelopmentandValidationofaDeepLearningAlgorithmforDetectionofDiabeticRetinopathyinRetinalFundusPhotographs[J].JAMA,2016,316(22):2402-2410. 

[3]蔡小舒,吕晖,于广军.美国FDA医疗人工智能软件审核指南研究[J].中国数字医学,2019,14(11):38-42. 

[4]孟祥峰,王浩,张超,等.人工智能医疗器械辅助诊断及探测性能评估参数的讨论[J].中国药事,2019,33(9):1026-1031. 

[5]FDA.DigitalHealthInnovationActionPlan[EB/OL].(2017-07-27) [2020-12-28].https://www.fda.gov/media/106331/download. 

[6]沈翀.美国FDA医疗器械和放射健康中心(CDRH)医疗器械监管模式概述[J].中国医疗设备,2010,25(3):129-131. 

[7]FDA.DigitalHealth[EB/OL].(2019-07-01)[2020-01-02].https://www.fda.gov/medical-devices/digital-health. VOL.36No.02 

[8]FDA.MedicalDeviceAmendments[EB/OL].(1976-05-28)[2020-12-28].https://www.govinfo.gov/content/pkg/STATUTE-90/pdf/STATUTE-90-Pg539.pdf. 

[9]塔娜,李思,李耀华.美国医疗器械上市前通告制度的演变及启示[J].中国药事,2019,33(6):698-704. 

[10]塔娜,李思.美国医疗器械上市前监管概述与启示[J].中国医疗设备,2020,35(3):160-163. 

[11]FDA.FederalFood,Drug,andCosmeticAct[EB/OL].(2018-03-29)[2020-12-28].https://www.fda.gov/regulatory-information/laws-enforced-fda/federal-food-drug-and-cosmetic-act-fdc-act. 

[12]FDA.DeNovoClassificationProcess(EvaluationofAutomaticClassIIIDesignation)[EB/OL].(2017-08-30)[2020-01-02].https://www.fda.gov/media/72674/download. 

[13]AllenB.TheroleoftheFDAinensuringthesafetyand efficacyofartificialintelligencesoftwareanddevices[J].JAmCollRadiol,2019,16(2):208-210. 

[14]Congresss.21stCenturyCuresAct[EB/OL].(2016-12-13) [2020-12-28].https://www.congress.gov/bill/114th-congress/house-bill/34.

[15]彭亮.软件预认证:有望开启医疗器械监管新篇章[N].中国医药报,2019-06-04(8). 

[16]FDA.Softwareprecertificationprogram2019mid-yearupdate[EB/OL].(2020-1-28)[2020-2-2].https://www.fda.gov/media/129047/download.

[17]KurtAY,MichaelM,GalY,etal.UnitedStatesregulatoryapprovalofmedicaldevicesandsoftwareapplicationsenhancedbyartificialintelligence[J].HealthPolicyTechnol,2019,8(2):192-197. 

[18]郭嘉杰,丁一.对美国FDA移动医疗应用指南文件的研究解读[J].中国医疗器械信息,2015,21(8):22-25. 

[19]InternationalMedicalDeviceRegulatorsForum(IMDRF).SoftwareasaMedicalDevice:PossibleFrameworkforRisk CategorizationandCorrespondingConsiderations[EB/OL].(2014-09-18)[2020-02-04].http://www.imdrf.org/docs/imdrf/final/technical/imdrf-tech-140918-samd-framework-riskcategorization-141013.pdf. 

[20]HwangTJ,KesselheimAS,VokingerKN.LifecycleRegulationofArtificialIntelligenceandMachineLearning-BasedSoftware DevicesinMedicine[J].JAMA,2019,322(23):2285-2286. 

[21]FDA.ProposedRegulatoryFrameworkforModificationstoArtificialIntelligence/MachineLearning(AI/ML)SoftwareasaMedicalDeviceDiscussionPaper[EB/OL].(2020-10-05)[2020-12-28].https://www.fda.gov/medical-devices/software-medicaldevice-samd/artificial-intelligence-and-machine-learningsoftware-medical-device. 

[22]胡凯,甄辉,杨辉,等.美国上市影像类人工智能辅助诊断软件临床评价的研究与思考[J].中国医疗器械杂志,2019,43(5):71-75. 

[23]中国药品监督管理局.总局关于发布医疗器械分类目录的公告[EB/OL].(2017-09-04)[2020-12-28].https://www.nmpa.gov.cn/xxgk/ggtg/qtggtg/20170904150301406.html.

[24]国家药品监督管理局医疗器械技术审评中心.医疗器械临床评价技术指导原则[EB/OL].(2017-09-04)[2020-12-28].https://www.cmde.org.cn/CL0112/6152.html.

[25]国家药品监督管理局医疗器械技术审评中心.关于发布深度学习辅助决策医疗器械软件审评要点的通告[EB/OL]. (2019-07-03)[2020-02-04].https://www.cmde.org.cn/CL0050/19360.html. 

[26]国家食品药品监督管理局.国家药监局关于发布医疗器械生产质量管理规范附录独立软件的通告(2019年第43号)[EB/OL].(2019-07-05)[2020-02-14].http://www.cdr-adr.org.cn/ylqx_1/Medical_zcfg/zcfg_zdyz_m/201907/t20190716_40479.html.

[27]国家食品药品监督管理局.医疗器械软件注册技术审查指导原则[EB/OL].(2015-08-05)[2020-02-14].http://www.scio.gov.cn/xwfbh/xwbfbh/wqfbh/2015/33239/xgxwfbh33245/Document/1444592/1444592.htm.

人工智能在临床领域的研究进展及前景展望

人工智能(artificialintelligence,AI)最初由JohnMcCarthy在1956年提出[1],KAPLAN和HAENLEIN[2]将AI描述为系统性处理并学习外部数据以实现特定目标和任务的能力。AI是指可模仿人类智能特征的计算机算法,其成功得益于计算能力及数据可用性的巨大增长。过去十年来,基于机器学习(machinelearning,ML)算法的AI应用已在计算机视觉(computerversion,CV)等领域中取得了巨大突破。AI的研究内容主要包括机器学习、神经网络、智能机器人、自然语言理解、语义识别和图像处理等[3]。

20世纪70年代开始,AI方法被应用于医疗领域以提升疾病诊治的效率,进而出现了医学人工智能(artificialintelligenceinmedicine,AIM)[3]。20世纪80年代后,决策树、随机森林、支持向量机等多种ML算法被提出,使AIM得以发展成熟。经典ML算法可分为有监督学习、无监督学习及强化学习等3类。ML是当今最常用的AI技术,其数学模型是基于庞大的训练数据集而设计的。自21世纪以来,深度学习(deeplearning,DL)的出现使AIM进入了崭新的发展阶段。目前DL已成为AI领域最流行的研究方法。

目前,医学界已利用AI技术对临床实践的不同步骤进行自动化研究,为临床决策提供支持。在各医学领域中应用AI方法有利于提高诊断的准确性并减少时间和人力消耗。基于AI的最新进展,智能筛查、智能诊断、风险预测和辅助治疗等是正经历颠覆性转变的典型应用。

当今,我们比既往任何时候都更接近AI的临床应用,基于AI的个性化远程医疗时代即将到来,如图1。因此,临床领域的专业人士均需了解AI技术的基础知识,帮助医学界获得AI相关的背景知识,包括AI的研究进展及前景展望,旨在带来更高质量的研究并激发新的研究方向。

医学数据可从便携式检查仪器中收集,随即通过互联网传输到远程医疗平台;基于AI的远程医疗平台将分析医疗数据进行诊断,并为用户提供个人精确医疗的补充建议图1基于AI的个性化远程医疗示意图图选项1AIM的常见技术

AI的发展主要出现了符号主义和连接主义两个历史方向(图2)。20世纪80年代开始流行的专家系统是符号主义的经典例子;自20世纪90年代以来,基于连接主义的学习方法逐渐兴起,其优势在于由数据而非人工专家提供准确性保证[4]。

图2AI技术的发展方向图选项1.1机器学习

机器学习(machinelearning,ML)的概念由SAMUEL在1959年提出,可表述为数据赋予计算机无需明确编程即可学习的能力[5]。QUINLAN(1986年)[6]提出了决策树(decisionTree,DT)算法,可依据既定规则完成数据分类。VLADIMIR(1995年)提出了支持向量机(supportvectormachines,SVM),它是一种广泛使用的监督ML算法,常用于分类和回归问题[7]。HO(1998年)[8]提出了随机森林(randomforest,RF)算法,可有效完成特征提取。

近年来,ML已被越来越多地应用于医疗领域,旨在帮助医师预测疾病及预后效果。ML的发展已经达到了重要的里程碑,可获得与人类专家相似甚至更好的准确率。典型的监督任务包含回归和分类,无监督任务包含降维、聚类、离群值检测等,而半监督学习是介于有监督和无监督之间的混合框架,其应用示例包括使用部分标记数据对图像进行分割或分类等[9]。三者关系见图3。

红色、蓝色代表已知的两个分类,灰色代表未分类标签;有监督学习依赖于已知的输入-输出对;若某些输出标签难以获得或代价高昂,则可考虑使用半监督学习;若无可用标签,则无监督学习允许获取更具探索性的数据方法A:有监督学习;B:半监督学习;C:无监督学习图3有监督、半监督及无监督学习展示图选项

ML技术仍存在较大的不足及改进空间。临床医师希望了解临床决策所依据的科学基础,以便能独立判断有效性并确保其适用于各类患者。然而,临床医师无法从ML技术中直观地获取底层机制,进而了解如何针对特定临床情况提出具体建议,这通常被称为“黑箱”问题。尤其是当临床医师的既往经验与AI方法的建议存在冲突时,医师往往会对AI方法缺乏信任,推进“可解释AI”的工作可能会在将来解决此问题。

1.2深度学习

自20世纪90年代以来,ML方法不断发展和改进,进一步诞生了目前流行的深度学习(deeplearning,DL)。DL一词最早由AIZENBERG和HINTON等于21世纪初提出[10],是指ML算法的一个子集,其称为“深度”的原因是在多个层次上分层组织,可自动从大数据中提取有意义的特征。图像识别的发展包括文本识别、数字图像识别和目标识别3个阶段。近年来,基于DL技术的图像处理逐渐被提出与推广,出现了一些以全自动医学图像检测分类和分割为目的的研究。

目前,卷积神经网络(convolutionalneuralnetwork,CNN)被广泛应用于医学图像处理,该架构具有两条路径以提取不同尺度的特征;此后树状结构的多任务全卷积网络(FCN)被提出,具有高效的端到端网络结构[11]。RONNEBERGER等[12]提出了U形卷积网络(U-Net),在各种医学图像分割任务中表现良好,目前已成为医学图像分割的基准网络,见图4。

U-Net包含编码器(下采样)、解码器(上采样)和跳跃连接部分,有利于高效提取医学图像特征图4U-Net网络结构图选项

当前,DL在医学图像领域的应用已得到了广泛进展,但其仍存在一定的应用限制。首先,医学数据集具有不均衡性,且往往为单中心、少样本量数据,但DL对于高质量大数据的依赖性较强,可能带来较大的经济学成本。其次,DL模型中学习参数量较多、存在过拟合风险,在应用中缺乏稳定性与可重复性。最后,与ML技术类似,DL同样存在“黑箱”问题,影响了临床应用中医患双方的接受程度。因此,应选择适宜的医疗领域应用DL技术,以提升辅助诊治的准确性。

1.3专家系统

专家系统(expertsystem,ES)是模拟人类专家决策能力的计算机系统,它可利用现有的知识系统推理和解决一系列复杂问题,是较早获得成功的AI软件之一[13]。ES的开发阶段大致可分为启蒙期(1965-1971年)、发展期(1972-1977年)和成熟期(1978年至今)3个阶段。当前,ES已经表现出了较强的临床决策能力,在疾病筛查及诊断等方面具有较大优势。但ES较为依赖人工专家,而人工专家可能犯错或具有主观倾向性。后续应用中仍需整合医师的临床经验和患者病史,进而提升系统的准确性。此外,ES的应用中需要不断更新医学知识和发现,进而为临床医师提供前沿诊断和治疗计划。

1.4智能机器人

1979年,美国机器人研究所提出了智能机器人(intelligentrobots,IR)的概念,将其定义为一种可重新编程的多功能机械手,旨在利用各种编程材料、部件、工具以执行任务[14]。自20世纪80年代开始,IR已逐渐被应用于外科手术。目前,经FDA批准的机器人手术系统包括宙斯(ZUES)、达芬奇(DaVinci)和自动内窥镜系统等。IR具有微创、精准及智能的优势,已被广泛应用于骨科、妇科、泌尿科及口腔科等诸多领域。

既往临床实践中应用的IR往往是移动能力受限的离散型机器人。近年来,连续型机器人被提出,是一种具有“无脊椎动物”柔性结构的新型仿生机器人,其具有灵活的弯曲特性及良好的环境适应性,将有望逐渐取代离散型机器人、成为未来外科手术的主力军[15]。但IR目前仍然存在成本较高、体积较大及应用范围受限等劣势。

1.5医疗物联网

物联网可被定义为具有通信和传感能力的网络物理系统的普遍存在,目前已被广泛应用于医疗领域,进而诞生了医疗物联网(theInternetofmedicalthings,IoMT)的概念[16]。IoMT主要采用移动传感器收集医疗相关的人体数据,进而支持临床诊治决策,具有较好的经济性、易用性和可访问性[17]。

IoMT使用各种传感器实时监测患者的健康状况,进而实时获取体温、心率、脉搏及血氧等生命体征。这些医疗设备监控患者的健康状况,收集临床数据并通过远程云数据中心发送给医生。基于IoMT的可穿戴医疗系统可以提供连续监测功能并收集大量医疗数据,进而为医师提供预测患者未来状况的有效依据。

2AIM的典型应用2.1智能筛查

目前AIM技术已应用于多种恶性肿瘤的筛查中,可对疑似癌变区域的良恶性进行自动筛查。表1总结了近几年AIM技术应用于智能筛查方面的典型实例。

表1AIM技术在智能筛查方面的典型应用第1作者年份AI技术应用领域应用效果WU[18]2019DL胃癌盲点漏诊率5.9%CHEN[19]2020DL胃癌盲点漏诊率3.4%KIANI[20]2020DL肝癌测试准确度84.2%MORI[21]2018ML结肠癌预测准确率98.1%WANG[22]2019DL结肠癌腺瘤检出率29.1%SU[23]2020DL结肠癌腺瘤检出率28.9%LIU[24]2020DL结肠癌腺瘤检出率27.0%WANG[25]2020DL结肠癌腺瘤检出率34.1%VANDENBERGHE[26]2017DL乳腺癌分类准确率83.1%STEINER[27]2018DL乳腺癌转移检出率91.0%BARINOV[28]2019ML乳腺癌AUC值86.5%MANGO[29]2020ML乳腺癌AUC值87.0%LOTTER[30]2021DL乳腺癌灵敏度提升14.0%YOO[31]2018ML甲状腺癌检出灵敏度92.0%MASOOD[32]2018DL+IoMT肺癌分类准确率84.6%SIM[33]2020DL肺癌平均灵敏度70.3%URUSHIBARA[34]2021DL宫颈癌AUC值93.2%ESTEVA[35]2017DL皮肤癌分类效果与医师相当ABRÁMOFF[36]2018DL糖尿病视网膜病变灵敏度87.2%KANAGASINGAM[37]2018DL糖尿病视网膜病变特异度92.0%KEEL[38]2018DL糖尿病视网膜病变灵敏度92.3%NATARAJAN[39]2019DL糖尿病视网膜病变灵敏度85.2%WU[40]2019DL白内障AUC值99.7%LIN[41]2019DL白内障准确率87.4%WU[42]2018DL角膜炎灵敏度89.3%ML:经典机器学习;DL:深度学习;IoMT:医疗物联网;AUC:ROC曲线下面积表选项2.1.1消化肿瘤的筛查

WU等(2019年)[18]及Chen等(2020年)[19]各自构建了基于DL的食管胃十二指肠内镜(esophagogastroduodenoscopy,EGD)图像处理系统,实现食管、胃及十二指肠疾病的早期筛查,盲点漏诊率各自降至了5.9%和3.4%,均明显低于未使用AI技术的传统方法。KIANI等(2020年)[20]构建了基于DL的肝脏病理图像处理系统,实现了肝细胞癌、胆管癌的自动筛查,在验证集上准确率为88.5%,在独立测试集上准确度为84.2%。MORI等[21]构建了基于ML的结肠镜图像分析系统,主要用于区分需要切除的腺瘤和不需要切除的非肿瘤息肉,其预测准确率为98.1%。WANG等(2020年)[25]构建了基于DL的结肠镜图像处理系统,结果表明AI组腺瘤检出率(adenomadetectionrate,ADR)明显优于传统组,可有效提高结肠镜下息肉及腺瘤的筛查效率。

2.1.2其他肿瘤的筛查

VANDENBERGHE等(2017年)[26]提出了基于DL的切片病理图像分析系统,可实现乳腺癌的自动诊断、分类,以病理学结果为金标准时的总体准确率达到了83.1%。STEINER等(2018年)[27]提出了基于DL的胸部CT处理系统,转移检测的灵敏度达到了91.0%,实现了转移性乳腺癌的自动筛查。LOTTER等(2021年)[30]提出了一种具有注释效率的DL方法,该方法在乳房X光片分类等方面实现了最先进的性能,相较于乳腺影像专家,AI方法的平均灵敏度提升了14.0%。YOO等(2018年)[31]提出了基于DL的超声图像分析系统,将甲状腺癌的筛查灵敏度由84.0%提升至92.0%,实现了甲状腺结节良恶性的自动筛查。MASOOD等(2018年)[32]构建了基于IoMT和DL的肺部CT图像处理系统,实现了肺结节的恶变阶段预测,分类准确率达到了84.6%。

2.1.3眼科疾病的筛查

NATARAJAN等(2019年)[39]利用DL方法处理视网膜图像,实现了糖尿病视网膜病变的自动筛查及严重程度分级,AI方法诊断严重病变的灵敏度和特异度各自为100.0%和88.4%,诊断总体病变的灵敏度和特异度各自为85.2%和92.0%。WU等(2019年)[40]构建了基于DL的眼部图像处理系统,白内障分类的ROC曲线下面积(areaundercurve,AUC)达到了99.3%~99.7%,实现了白内障的自动筛查及协作管理。WU等(2018年)[42]关于真菌性角膜炎诊断的研究表明,自动菌丝检测技术的灵敏度为89.3%、特异性为95.7%,AUC值为94.6%,可及时、准确、客观和定量地为真菌性角膜炎提供评估标准。

目前,AI智能筛查已广泛应用于肿瘤及眼科疾病的筛查中。但需要注意的是,模型准确性对医师的临床决策存在重大影响,当模型预测不准确时,其辅助筛查的效果往往大幅降低。此外,对于发病率较低、样本量较少的疾病,假阳性的存在是不容忽视的问题,建议采用人工审查的方式再次验证。因此,将AI模型应用于临床时仍存在较大挑战,当设计AI工具时应考虑模型辅助筛查的潜在负面影响。

2.2智能诊断

当前,ML、DL、ES及IoMT技术均已应用于各类疾病的诊断,取得了较好的自动化效果,AIM技术应用于智能诊断的典型实例总结见表2。

表2AIM技术在智能诊断方面的典型应用第1作者年份AI技术应用领域应用效果ESHEL[43]2017ML疟疾灵敏度99.0%TURBÉ[44]2021DL艾滋病准确率97.8%MINAEE[45]2020DLCOVID-19灵敏度98.0%HUANG[46]2020DLCOVID-19严重程度预测AHUJA[47]2021DLCOVID-19准确率99.4%SHORFUZZAMAN[48]2021DLCOVID-19精确度95.5%QUIROZ[49]2021MLCOVID-19AUC值96.0%ARBABSHIRANI[50]2018DL脑卒中AUC值84.6%TITANO[51]2018DL脑卒中AUC值73.0%NAGARATNAM[52]2020DL脑卒中上门时间缩减45minLO[53]2021DL脑卒中AUC值99.27%BIBI[54]2020DL+IoMT白血病平均准确率99.6%HAMEDAN[55]2020ES慢性肾病灵敏度95.4%PARK[56]2019DL动脉瘤预测准确率85.9%WONG[57]2018ML溃疡预测准确率84.3%BIEN[58]2018DL膝关节外伤AUC值93.7%LINDSEY[59]2018DL骨折灵敏度91.5%FU[60]2019DL骨折可视化骨折分析YAO[61]2019DL+IoMT胆囊结石预测结石化学成分ML:经典机器学习;DL:深度学习;IoMT:医疗物联网;ES:专家系统;COVID-19:新型冠状病毒肺炎;AUC:ROC曲线下面积表选项2.2.1传染疾病的诊断

2020年,新型冠状病毒肺炎(coronavirusdisease2019,COVID-19)的爆发为AIM技术提供了适宜的应用时机。AIM技术在COVID-19的诊断、分型、风险预测和辅助治疗等方面均取得了较好的进展。SHORFUZZAMAN等(2021年)[48]提出了一种结合迁移学习理念的深度学习融合框架,实现了对COVID-19患者的智能诊断,融合模型的分类精确度达到了95.5%。QUIROZ等(2021年)[49]证实,ML方法可用于COVID-19的自动严重程度评估,其有助于对COVID-19患者进行分类诊断,AUC值为96.0%、灵敏度为84.5%、特异度为92.9%,继而可确定后续诊治的优先级。

2.2.2内科疾病的诊断

随着医学影像技术的发展及临床诊断精度的提升,基于DL技术的临床诊断方法得到了蓬勃发展。ARBABSHIRANI等[50]及TITANO等(2018年)[51]各自构建了基于DL的颅脑CT图像处理系统,AUC值达到了73.0%和84.6%,实现脑卒中等急性神经事件的自动检测。LO等(2021年)[53]基于DL提出了缺血性脑卒中自动诊断方法,灵敏度为98.1%、特异度为96.9%、AUC值为99.3%,可有效为临床医师提供急性缺血性卒中的诊断建议。BIBI等(2020年)[54]开发了一个基于DL和IoMT的系统,实现了白血病的快速安全识别与分类,平均准确率达到了99.6%;该系统可让医患双方实时沟通白血病的检测、诊断及治疗,进而有效节省临床医师的时间和精力。HAMEDAN等(2020年)[55]利用ES对慢性肾病进行分析,将AIM技术与人工专家意见结合,结果表明ES预测慢性肾病的效果较好,准确率、灵敏度和特异度分别为92.1%、95.4%和88.9%。

2.2.3外科疾病的诊断

基于DL的图像识别技术在临床诊断中具有重要意义,可提高外科病变部位预测的准确度。BIEN等(2018年)[58]提出了基于DL的膝关节MRI处理系统,实现前交叉韧带撕裂、半月板撕裂等膝关节外伤的自动检测,AI模型可以从内部和外部数据集中快速生成准确的膝关节病理分类。LINDSEY等(2018年)[59]构建了基于DL的X线图像处理系统,实现骨折的检测与定位;在应用AI技术辅助后,临床医师检测骨折的灵敏度由80.8%提升至91.5%,特异度由87.5%提升至93.9%。FU等(2019年)[60]着眼于CT图像分析系统,实现股骨间骨折的自动诊断及可视化分析,识别最可能的骨折断裂区域。

目前,一些新兴AI技术已被广泛应用于内、外科疾病及传染病的智能诊断中,在临床决策中发挥了重要作用。AI模型的能力受纳入训练集规模的限制,基于某类数据集训练的模型可能无法在另一类数据集中获得良好表现,应注重在模型训练中适当加入外部测试集以评估其泛化能力。此外,多数基于AI技术的智能诊断方法仅限于分析医学影像信息,但临床上有效的研究终点需要基于医师对患者各项指标的总体评估。因此,在未来的研究中,应注重各项临床数据的综合运用,提高AI模型的有效性与可推广性。

2.3风险预测

AIM可实现风险的自动评估与预警,提供有效的临床决策支持。AIM技术应用于疾病风险预测的典型实例见表3。

表3AIM技术在风险预测方面的典型应用第1作者年份AI技术应用领域应用效果MCCOY[62]2017ML败血症住院死亡率下降60.2%SHIMABUKURO[63]2017ML败血症住院死亡率下降58.0%GIANNINI[64]2019ML败血症预警特异度98.0%GINESTRA[65]2019ML败血症临床接受度45.0%CHEN[66]2018ML+IoMT糖尿病5G智能糖尿病系统KUMAR[67]2018ML+IoMT糖尿病移动医疗保健应用程序ROMERO-BRUFAU[68]2020ML糖尿病患者接受度58.0%BOUTILIER[69]2021ML糖尿病+高血压预测准确率91.0%CONNELL[70]2019ML肾衰竭移动检测应用程序AOKI[71]2020DL小肠破裂有效降低阅片时间BRENNAN[72]2019ML肾脏手术AUC值85.0%WIJNBERGE[73]2020ML心脏手术低血压时间缩减16.7minZHOU[74]2020MLCOVID-19预后相关标注物预测BOOTH[75]2021MLCOVID-19AUC值93.0%ML:经典机器学习;DL:深度学习;IoMT:医疗物联网;COVID-19:新型冠状病毒肺炎;AUC:ROC曲线下面积表选项2.3.1感染风险的预测

严重败血症的死亡风险较高,因此败血症风险预测是提高干预效果的重要保障。MCCOY等(2017年)[62]提出了基于ML的电子健康档案(electronichealthrecords,EHR)数据处理系统,实现了败血症的风险预测。相较于实施前,实施后与败血症相关的住院死亡率下降了60.2%。SHIMABUKURO等(2017年)[63]同样对败血症进行了风险预测,平均住院时间降低了3d,平均住院死亡率下降了58.0%。GIANNINI等(2019年)[64]利用ML分析EHR数据,可用低灵敏度但高特异性的标准对严重败血症和败血症休克进行早期预警,该AI方法的特异度为98.0%。GINESTRA等(2019年)[65]分析了临床医师对败血症预警系统的接受程度,结果表明临床接受程度仍存在较大提升空间。

2.3.2慢病风险的预测

CHEN等(2018年)[66]提出了5G智能糖尿病系统,为糖尿病患者生成全面的传感和分析,进而有效地为患者提供个性化诊断和治疗建议。KUMAR等(2018年)[67]设计了一种基于IoMT的移动医疗保健应用程序,实现了糖尿病的发病风险及其严重程度的判断。ROMERO-BRUFAU等(2020年)[68]利用ML分析患者数据,进而为血糖控制提供临床决策支持,患者接受度58.0%。BOUTILIER等[69]利用ML预测糖尿病及高血压的危险分级,将糖尿病预测准确率由67.1%提升至91.0%,将高血压预测准确率由69.8%提升至79.2%,且极大降低了糖尿病和高血压的预测成本。

2.3.3治疗风险的预测

围手术期风险的发生与医疗成本及死亡率的增加密切相关。在智能决策支持平台中构建数据驱动的预测风险方法有利于减少临床医师的工作负担,提升风险预测效率。BRENNAN等(2019年)[72]利用基于ML的EHR数据处理系统实现肾脏手术术后并发症风险的自动评估;当使用AI算法后,风险评估AUC值由69.0%提升至85.0%。WIJNBERGE等(2020年)[73]构建了基于ML的血流动力学指标分析系统,实现了心脏手术术中低血压风险的自动预警;AI干预可将低血压中位时间由32.7min缩减至8.0min。BOOTH等(2021年)[75]构建了基于ML的COVID-19个性化死亡率风险评分系统,结果表明C反应蛋白(CRP)、血尿素氮(BUN)、血清钙、血清白蛋白和乳酸等血清生物标志物与COVID-19的严重程度及死亡风险密切相关。

目前,基于AI方法的预警系统已被提出和小规模实施,其应用领域包括感染风险预测、慢性病风险预测及治疗风险预测等。但临床医师对此类工具的看法仍存在分歧,分析原因在于以ML、DL为代表的AI方法,一般具有不透明性、不确定性,存在预测效果不稳定的风险,使部分临床医师对利用复杂AI方法开发的工具缺乏信任。此外,既往风险预测仅局限于单中心研究,其泛化性能尚未得到充分验证,后续需要对更多的群体进行深入研究,充分评估AI方法的安全性和可推广性。在可预见的将来,AI不太可能取代临床医师,但AI可以依据医疗大数据提供相关建议,进而作为临床医师的高效辅助。

2.4辅助治疗

AIM技术应用于辅助治疗已有较多案例,效果比较理想,见表4。

表4AIM技术在辅助治疗方面的典型应用第1作者年份AI技术应用领域应用效果BIRD[76]2021ML直肠癌治疗剂量规划YANG[77]2021ML前列腺癌准确率84.6%NICOLAE[78]2020ML前列腺癌有效降低规划时间KATZMAN[79]2018ML+IoMT乳腺癌预测个性化治疗建议MCNAMARA[80]2019ML乳腺癌预测准确率95.3%KHOZEIMEH[81]2017ES皮肤疣预测准确率83.3%VOERMAN[82]2019ML败血症成本降低49.0%RAWSON[83]2021ML败血症抗菌处方建议SEGAL[84]2019ML心脏病预警有效率85.0%WANG[85]2019ML心脏病指导治疗时机HOOSHMAND[86]2020DLCOVID-19研发潜在药物KE[87]2020DLCOVID-19研发潜在药物ZHANG[88]2020IR骨科手术提升操作准确性XIE[89]2021IR胆道手术安全性和可行性好MATTHEIS[90]2019IR咽喉手术切除效果彻底TROISI[91]2019IR肝脏手术术后恢复更快ML:经典机器学习;DL:深度学习;IoMT:医疗物联网;ES:专家系统;IR:智能机器人;COVID-19:新型冠状病毒肺炎表选项2.4.1治疗决策支持

放射治疗是多种肿瘤治疗的重要手段,治疗过程中需要密集地划定风险器官(organatrisk,OAR),进而为放疗提供指导,并预测预后。BIRD等[76]使用多中心数据集构建了ML模型,旨在获取适用于直肠癌准确、可推广的放疗方案。通过适当的验证研究和监管批准,以上方法可提高放疗的准确性和有效性。YANG等(2021年)[77]利用ML方法预测器官敏感性,进而估算出每个器官接受放射剂量的阈值,还分析了放射剂量与远期生活质量指标的相关性。NICOLAE等(2020年)[78]构建了基于ML的前列腺种植体规划系统,将治疗规划时间降至(2.38±0.96)min,为前列腺癌提供临床治疗决策支持。KATZMAN等(2018年)[79]提出了一个基于IoMT的智能健康监测系统,可展示个性化治疗建议并延长乳腺癌患者的生存时间。

2.4.2药物研发管理

处方错误可引发高发病率和医疗负担。现有的处方错误预警系统效果较差,且伴随严重的虚假预警风险。RAWSON等(2021年)[83]构建了基于ML的抗菌处方决策系统,为抗生素管理提供临床决策支持,AI处方建议已达到接近临床医师的水平。SEGAL等(2019年)[84]提出了基于ML的处方识别系统,实现心脏病患者处方错误的自动预警及纠错,临床有效率为85.0%。HOOSHMAND等(2020年)[86]利用DL方法寻求抑制COVID-19的潜在药物,可识别出副作用最小、前景最好的COVID-19药物。KE等(2020年)[87]利用DL方法识别具有治疗COVID-19潜力的上市药物,最终确定了80余种有能力抗击冠状病毒的潜在药物。

2.4.3机器人手术

目前,IR已广泛应用于骨科、胆道、咽喉及肝脏手术等领域。ZHANG等(2020年)[88]将IR技术应用于脊柱手术,可有效提升螺钉置入的准确性、减少术中透视次数并降低术后并发症发病率。XIE等(2021年)[89]利用达芬奇手术系统治疗1岁以下儿童胆道囊肿,结果表明IR具有较好的安全性与可行性。MATTHEIS等(2019年)[90]将经口机器人手术(TORS)应用于咽喉肿块切除,其可视化效果好,且未发生严重不良反应。TROISI等(2019年)[91]将IR用于肝脏手术,其优势包括减少失血与粘连,进而缩短入院时间与术后恢复时间。

当前,多种基于AI方法的决策支持工具已达到了与疾病专家判断一致的水平,可有效改善经验治疗决策、缩短治疗时间、降低成本。但目前多数辅助工具仅针对特定疾病,应用过程难度较高。用于分析的数据集中缺乏普遍接受和经过验证者,尤其是关于长期随访预后的数据,影响了决策支持工具的预测效果。增加病例的多样性有利于提高决策支持的价值。未来需扩充更多数据集,开发多中心、多站点规划系统以更好地进行临床治疗指导。

3AIM的前景展望3.1大数据质量治理

医疗大数据是指医疗过程中产生的庞大而复杂的数据集,包含临床数据、影像数据、基因数据和移动健康数据等。医疗大数据具有海量性、准确性、易变性、多元性和隐私性,其质量是AIM发展的核心保证。AI方法通常需要大量样本的训练数据以提高灵敏度,将AI方法与大数据结合可在未来实现更高的预测精度和更广泛的应用。优化数据的收集与整理过程、提升数据质量是未来AIM发展推广的关键。训练数据库的错误或偏差通常直接反映在模型行为中,并对模型性能及临床结果均产生重大影响,因此数据质量是发挥医疗大数据价值的必要条件。

当前,医疗大数据收集的自动化程度仍然较低,数据收集和整理过程存在时间较长、成本较高的劣势。且因为各个医疗系统信息孤岛问题的存在,现有医疗大数据在完整性、准确性、细致性和一致性等方面存在诸多问题。正如医师需要熟悉临床指南一样,临床团队也应熟悉AI时代数据收集和管理的指导原则。AI领域最流行的数据整理原则包括可查找性、可访问性、可操作性和可重复性,而在临床应用中还需考虑医学领域的特殊性。

3.2新技术赋能革新

通用人工智能(artificialgeneralintelligence,AGI)是未来AI发展的高级目标,旨在让AI像人脑一样自主学习、应用并解决各知识领域的问题。AGI的目标在于构建可媲美人类的AI,其实现方式、风险挑战是整个AI领域的研究热点问题。目前,强化学习、小样本学习及元学习等新型技术已被提出,可能成为AGI实现的重要契机,并为AIM的高质量未来发展赋能。

强化学习(reinforcementlearning,RL)又名增强学习,其应用特征为在交互中学习,利用交互所得信息调整学习策略,最终实现特定目标。在医学领域,RL可与DL技术结合为深度强化学习(deepreinforcementlearning,DRL),其优势在于综合了DL的感知能力及RL的决策能力,进而可获取实现目标的最优策略[92]。

小样本学习(few-shotlearning,FSL)可从少量样本中学习对象类别,一方面强调在少量样本中实施快速学习,另一方面强调对于新任务的泛化性能。医学数据往往存在样本量过少、数据标签有限和分布不均衡的问题,因此FSL将成为未来AIM的重要发展趋势之一。半监督、无监督或自监督学习有利于解决数据标签受限的问题;利用预训练过的模型(迁移学习)或组合模型(集成学习)同样是较为有效的联合策略。

元学习(metalearning)又名“学会学习”(learningtolearn),指利用既往的知识经验指导新任务的学习,可成为AI发展的又一个关键突破口[93]。当前DL的特征是只能从头开始训练,而元学习的提出有利于更好地利用既往知识,进而提高处理新任务的效率。将元学习和其他算法相结合有利于完成各项任务,例如用元学习方法实现RL或FSL。元学习方法还可与其他方法融合运用,进而发挥各自优势,如小样本元学习具有较高的实践价值。未来,元学习的发展目标是让AI拥有核心自主意识,是实现AGI的关键。

3.3多领域知识整合

AI方法从符号主义到连接主义的转变、从浅层架构到深层架构的转变等均为医学领域带来了颠覆性的变革。只有医学界逐步接受AI技术,并将所有特定领域的知识整合到最先进的AI方法中,下一代用于医疗应用的AI方法才会出现。当前,AI应用仍存在研究设计难、效果预期难及原理解释难等挑战。整合特定领域的知识不仅有助于提高AI模型的先进性能,还可提高结果的可解释性,有效解决当前AI方法的局限性。黑箱问题的解决有利于提升ML的准确性和算力,进而为医学领域作出更大贡献。

多学科研究领域的整合是AIM的重要发展方向,包括医学成像、图像融合、自然语言处理等,可对疾病诊治的整个过程进行追踪研究。此外,利用基因组学、蛋白组学、影像组学等多组学数据融合的方式进行疾病诊治同样是近年研究热点,值得进行深入研究[94]。

总体而言,在过去几年中AI方法已经达到了重要的里程碑,在自动化医疗实践方面具有较大的潜力。然而,要将这些AI方法安全、完善地集成到临床工作流程中仍需要计算机科学、统计学、数据科学和医学等多学科的共同努力,进而支持下一代强大的AI方法,确保基于AI解决方案的稳健性及可解释性。

3.4个性化医疗决策

在未来的发展中,AI在临床领域将面临更大的挑战。在数据挖掘和ML领域,研究人员发明了第五代无线技术(5G)及IoMT集成的连续机器人;在图像识别领域,需构建更有效的训练模式,以不断扩展数据集、为临床医师提供更多信息。

在过去十年中,随着我国、欧洲和美国的研究人员在AI领域取得了重大成就,与AI相关的文献数量也得到了迅速发展。借助5G网络的高速传输,远程协作手术的实时技术指导可保证手术的稳定性、可靠性及安全性。值得一提的是,中国正逐渐成为AI领域的领导者[95]。

为使每位患者获得最佳的治疗效果,个性化远程医疗的概念逐渐被提出和推广。为此,需要使用大数据训练并依据反馈更新高精度AI算法。随着便携式设备的发展,患者可在家完成简单的测试,并从AI计划中获得即时转诊建议。同时,所有数据也可发送至医疗中心,由医师检查并依据患者自身特点采取个性化治疗策略。通过这种方式,患者可显著减少就诊时间,同时仍能获得最佳的个性化治疗建议。在AI的帮助下,未来的患者可及时、准确地获得疾病相关的个性化医疗决策。我们有理由相信,基于AI的个性化远程医疗时代即将来临。

本文总结、梳理了人工智能在临床领域应用的常见技术及其典型应用,并对应用前景进行了展望。研究表明,机器学习(ML)、深度学习(DL)、专家系统(ES)、智能机器人(IR)和医疗物联网(IoMT)是最常用的AI技术,其应用领域包括智能筛查、智能诊断、风险预测和辅助治疗等。AI彻底改变了传统医学模式,显著提高了医疗服务水平,并在各个方面保障了人类健康。因此,医学AI具有十分广阔的发展前景,其未来发展方向包括大数据质量治理、新技术赋能革新、多领域知识整合及个性化医疗决策等。

人工智能背景下中医诊疗技术的应用与展望

中医学在医学领域具有丰富的实践经验、技术和理论,因此形成了中医特定的“形神合一”“整体审查”“四诊合参”等整体观和辨证论治,使中医学在诊疗的评价研究中更具特色和可行性[1]。辨证论治是中医临床诊疗的核心,其理论体系经过中医数千年的临床实践与检验,充分体现了中医学理论的独特性和实践的有效性,也是中医学有别于现代医学诊疗体系的特色和优势[2]。这种以“诊法―辨证―治疗”为核心的诊疗理论体系和大量的经验数据成为中医研究和发展的重要资源。传统中医主要通过整体、动态、个性化了解身体状态来诊断疾病的理念超前,然而方法却依赖于经验,使其巨大潜力未能充分发挥,导致这一状况的关键在于缺乏实现这种先进理念和方法的技术手段[3]。随着中医现代化和国际化的发展,传统中医的价值已逐步被国际社会认可,利用现代先进的智能信息技术解决中医诊疗过程中的技术标准化和数据化等关键问题,深入挖掘中医诊疗技术的科学内涵,进一步提升中医诊疗模式的科学性和有效性,借助信息科学等多学科技术推动中医学的发展已成为中医及相关学科领域研究的重要课题[4-5]。

人工智能(artificialintelligence)作为计算机科学的一个重要分支,经过60多年的发展已经奠定了重要的理论基础,并取得了诸多进展[6]。特别是在深度学习理论指导下的以AlphaGo为代表的人工智能技术的成功应用,更凸显了人工智能领域中人工神经网络(artificialneuralnetwork,ANN)将学习和训练融合来实现智能化的优势。人工智能技术的发展为医学发展提供了全新的契机,在现代医疗健康领域应用广泛[7-8]。大数据是人工智能技术的基石,是决定人工智能技术能否有效输出的重要输入口。大数据有其特殊性,即数据即时处理的速度、数据格式的多样化与数据量的规模[9]。同时价值性[10]及真实性等的提出说明只有保证数据的科学性和有效性,才能使人工智能真正从狭义定义成为可以媲美人类思维、智能、意识的通用人工智能[4]。

医学诊疗过程是一个典型的智能处理过程,其包括信息获取-分析-处理-反馈-评价-综合的思维全过程,而中医诊疗过程是以中医辨证思维为指导的智能化处理过程,也是一个典型的人工智能技术应用领域。因此,将人工智能技术运用于中医诊疗可以促进中医诊疗技术的跨越发展,解决中医诊疗现代发展的主要问题。基于此,本文梳理了目前中医诊疗技术与人工智能技术结合的现状及趋势,并进行阐述。

1基于文献数据的中医诊疗决策智能化研究

中医文献和临床医案是中医学术思想和临证经验的重要载体,对其海量信息进行归纳和整理是近年来中医临床经验传承的重要方法。面向全新的科技时代,利用海量的案例数据建立中医临床病症诊疗决策支持系统是目前值得关注的领域;通过对文献和案例的学习来深化、拓展临床思维与视野,然后采用智能算法进行自我学习,从而为中医诊疗提供智能信息支持[11]。

目前中医文献、医案中研究较多的是利用聚类(clustering)、关联规则(associationrule,AR)、决策树(decisiontree,DT)、无尺度网络(scale-freenetwork,SN)、粗糙集理论(roughsettheory,RST)等数据挖掘技术从复杂症状中提取、归纳中医证型,分析症状与症状、症状与方药、症状与证型、证型与方药、方药与方药等之间潜在的关联规则。从数量庞大的方药中发现药物配伍规律及潜在药物、核心药物、核心处方等不仅可为临床医师提供诊疗策略,模拟中医思维方法和处方生成过程,而且对中医理论的创新发展及其客观化、规范化研究具有重要的推动作用[12-13]。许多学者在中医文献、医案中对“病―证―药”之间的规律挖掘进行了大量研究,如采用中医处方智能分析系统对《伤寒论》中112张方剂的知识点进行研究,分析各方剂的君、臣、佐、使,总结各方剂的气、味、归经规律及辨证处方规律,探讨主症与方证之间的关系[14]。此外,基于临床病案文献数据进行糖尿病证候聚类分析,基于心血管疾病血瘀证案例采用关联规则对药物配伍、药―病、药―证关系进行对应分析,以及开展糖尿病性周围神经病变组方诊治规律、药物使用频次等研究,均显示较好的支持结果[15-16]。

基于文献数据挖掘的诊疗系统研究也有很多建设性成果。北京交通大学研究人员提出了临床数据仓库(clinicaldatawarehouse,CDW)系统,该系统整合了结构化的电子医疗档案,通过支持向量机、DT分析、贝叶斯网络等多种分类算法,使用监督学习的方法从大量无固定结构的中医诊断文本中对症候进行学习,从而实现病症的经验推理[17-18]。清华大学研究团队摒弃了从单一诊断语句和诊断文档中抽取关联关系的方法,他们基于大规模中医诊断语料库,以网络挖掘的视角构造异构实体网络,首次提出了HFGM(heterogeneousfactorgraphmode)模型,并使用半监督学习的方法评估HFGM模型的参数;通过超过10万份中医诊断书的数据集验证,发现HFGM模型的平均准确度比支持向量机算法提升了11.09%[19]。董国华[20]研究了数据挖掘方法在哮喘病案数据分析中的应用,他采用一种粗糙集属性约简算法(MIBARK算法)提取哮喘主症状,建立病案数据库,从而获得中药配伍规律、用药与症状的关联关系,进而寻找症―证间的匹配规律,建立中医病案数据挖掘系统。总之,以证―药的规律挖掘为目的的中医文献数据挖掘方法具有良好的研究基础,为进一步研发中医智能化诊疗决策支持系统提供了重要支持。

2现代中医诊断技术与中医智能诊疗系统研究

现代信息技术的发展为中医诊断手段的发展带来新的契机,随着中医传统诊断方法现代化研究的深入,脉诊仪、舌诊仪、色诊仪、闻诊仪、经络仪等已成为新兴的现代中医诊断技术。现代中医诊断技术是传统中医诊断方法的发展和延续,逐步实现了中医诊断技术的信息化、数字化、标准化,也逐渐突破了中医诊断方法主观性强、缺乏客观数据的瓶颈,为人工智能技术的应用奠定了坚实的数据基础。以现代中医诊断技术及其数据为支撑,以中医辨证思维为核心的智能中医病证诊疗研究已逐渐展开[21]。

2.1国内外四诊的技术化、仪器化研究

20世纪70年代国内就开始了中医脉诊、舌诊等诊法客观化、仪器化的研究,为诊断技术信息化应用奠定了重要基础。传统的中医四诊多依赖主观感觉,缺乏客观依据,现代中医诊断技术正在逐渐改变传统中医诊疗的主观依赖性,提升中医诊法客观化。将传统中医诊断方法,尤其是脉诊、舌诊等具有中医特色的诊断方法标准化必将促进中医诊疗模式向更科学的方向发展。目前,国内高校和科研单位已在中医诊法技术化、仪器化研究领域进行了大量富有成效的基础性研究,内容包括:(1)四诊信息的客观化、标准化表达。将传统中医用语言描述的表达方式归类为定量化、标准化的客观表达方式,如脉象的“位、数、形、势”量化表达方式,舌诊、面色中颜色量化的正确表达方式,问诊系统症状的量化表达方式等[22]。(2)四诊特征信息的提取及分析方法的研究。利用现代计算机技术(神经网络、贝叶斯网络等)、数学建模,以及图像分析、声音频谱分析等技术研究脉象信号、舌象信息、问诊、闻诊等特征信息的获取、识别和判读方法等;在面色、脉象、舌象等信息采集上也逐渐形成规范[16,23-24]。(3)仪器设备的研发与应用。利用现代科技研发适合脉象、舌象、面色诊、闻诊(包括声音、气味)等四诊信息检测的传感器和检测仪器,并开展四诊信息融合的研究,开展仪器设备的临床观察与应用[22,25]。目前已有中医诊断仪器设备进入临床应用,如2010年上海中医药大学与公司合作研发的四诊信息分析仪被列入俄罗斯火星-500(MARS500)研究计划,用于监测和分析模拟条件下宇航员的身体健康状态[26-27]。此外,在国家“863”计划、“十二五”科技支撑计划、“十三五”重点研发计划的支持下,上海中医药大学研究团队对舌面诊和脉诊采集设备与技术的研究取得进一步提升和发展,并深入开展四诊技术在健康辨识和诊断领域中的应用研究[28-31]。综上所述,基于人工智能技术的飞速发展,目前在中医诊断领域,以舌诊、脉诊、色诊为代表的四诊客观化技术逐渐成熟,形成了舌诊仪、脉诊仪、色诊仪等多种中医诊断仪器,中医现代诊疗技术在健康、疾病、中医证候等领域也取得良好进展。

2.2四诊信息技术在病证诊断和疗效评价中的应用

现代中医诊断技术为辨证论治的疗效评价提供了技术手段,其在面色、舌质、舌苔、语音、脉搏等症状信息方面实现客观数据化,在问诊主观症状方面实现规范化和定量化[21]。以四诊信息客观量化、信息化为前提,应用中医特色客观量化指标,针对临床病证诊断、疗效分析评价等建立具有中医特色的现代诊疗和疗效评价方法已经可行,许多尝试性研究也逐渐显示出特色和优势。

2005年中国中医科学院推动了“中医优势病种临床研究专项”研究,以中医治疗有优势的疾病或疾病某一阶段的临床研究为重点开展中医治疗心血管疾病、肿瘤、糖尿病等临床研究。四诊信息化研究尤其是舌诊、脉诊在常见慢性优势病种的疾病诊断、疗效评价方面已取得一定的成果。在疾病诊断分类方面,Zhang等[32]通过标准舌象图像提取特征参数并建立基于支持向量机算法的糖尿病诊断模型,结果显示通过机器学习的方法能得到较好的分类准确率,为糖尿病诊断提供了思路。Li等[33]对205例冠心病患者的脉搏波信号进行了研究,脉冲信号分别使用Hilbert-Huang变换和时域进行分析和提取,发现所得脉冲信号的时域参数h1、h3、h4、h3/h1等与对照组比较差异均有统计学意义。此外,有学者发现肿瘤患者的舌脉象具有特异性表现,且患者的舌脉参数与肿瘤指标有关[34-35]。在证型诊断分类方面,师晶丽等[36]观察了原发性肾小球疾病患者在气虚、阳虚、阴虚、气阴两虚4种证型下的舌苔和舌质,通过聚类得到舌象颜色的色彩空间分布,并采用最近邻聚类算法获得每个舌象的颜色分布。许文杰等[37]采集了528例冠心病患者的中医脉图信息,基于支持向量机算法分别应用脉象信号时域特征参数和递归定量分析特征参数并结合问诊、望诊参数建立了冠心病证候诊断模型。在疗效评价方面,崔龙涛等[38]和崔骥等[39]观察了亚健康状态大学生不同证型在中药干预前后舌象、脉象客观量化指标的变化,为中医客观诊断和亚健康的疗效评价提供了依据。燕海霞等[40]观察了经中西医结合治疗前后50例肺癌患者的舌脉象参数变化,结果显示治疗后患者的舌苔润燥指数升高、腐腻指数升高、厚薄指数降低、裂纹指数升高,提示舌象客观检测参数可作为中西医结合治疗肺癌临床疗效评价的参考指标之一。Chen等[41]通过舌诊仪、脉诊仪等四诊辅助设备,判断肝癌患者与健康人群之间的舌脉差异,结果显示四诊辅助设备可以作为判断人体健康状态与疾病的仪器装置,且四诊仪器可以提升疾病诊断和中医标准化的准确性和速度。Li等[42]采用计算机辅助分类方法提取口唇图像中的3种特征,应用支持向量机算法进行分类,为中医口唇部诊断的定量检测提供了方法与思路。

3人工智能技术在中医诊疗领域中的应用

人工智能技术是现代信息技术领域快速发展起来的技术方法,目前其在数据分类、医学诊断、智能计算等领域已取得显著成就[43]。中医诊疗决策支持系统是利用上述数据挖掘方法,从大量的中医四诊数据库中抽取隐含、未知、有意义的与诊断分类、证候分类有关的知识模型或分类规则。中医信息化系统在临床辅助诊断、远程医疗、个人健康管理等方面具有广阔的前景,中医智能化决策系统的需求也越来越明显。中医诊疗决策支持系统是一门集中医诊断学、计算机科学、管理科学等为一体的新兴研究方向,它的发展与相关学科发展密不可分[44]。因此,中医临床诊断与专家系统相结合成为中医现代化发展中更具挑战性的方向。一批人工智能领域的专家已经致力于中医智能诊疗决策支持系统的研究,并与中医药领域研究人员紧密合作开展了大量辨证智能分析研究,取得了很多研究经验[45]。以周昌乐教授为代表的学者们在人工智能领域提出了一系列中医诊疗智能化研究和实施方案[46],尤其是利用软计算理论辅以四诊数据化技术探索解决中医辨证逻辑形式化这一关键问题,为今后中医智能化诊疗技术发展奠定了重要基础。

4问题与展望

尽管人工智能技术在中医诊疗领域的应用已经有很多卓有成效的探索工作,但不难发现既往研究主要以理论层面为主,计算机系统主要作为存储数据、融合信息和可视化工具,而非真正实现智能化决策支持。具体原因在于:(1)四诊辨证自身技术的规范化和数据化问题,四诊数据的支持性不够,主观性太强的四诊症状信息在数据稳定性、可重复性、纯净性上均存在很大问题,没有实现真正意义上的数据化。(2)缺乏与临床实践兼顾的理论模型指导“决策支持”;(3)缺乏设计完善、病证结合的临床大样本数据的支撑。以四诊信息技术数据化为前提,结合现代医学临床数据,在病证共性的前提下以数据融合为基础、人工智能技术为核心,有效扩大中医辨证论治的数据依据,则有望建立集诊断、治疗、疗效评价为一体的智能化辨证论治方法体系。

随着人工智能、大数据等信息技术的发展,这一新的诊疗模式探索已经可行。应用人工智能技术将中医药大量理法方药数据进行智能化处理,为中医临床诊断提供决策支持,可以最大限度发挥人机结合优势。因此,以中医辨证论治理论为核心、现代中医诊断技术为支持,借助系统科学和人工智能技术,病证诊疗结合、中西数据汇通,通过病证临床诊断、治疗、疗效评价决策方法的研究,最终建立具有辨证论治内涵的智能中医诊疗决策系统,可为中医临床诊断提供智能决策辅助支持,进一步促进中医诊疗规律的提升和总结,推动中医现代化发展。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇