人工智能助力检验医学发展
《新一代人工智能发展规划》中提出,要发展智能医疗,我们的首要任务就是推广应用人工智能治疗的新模式新手段,建立快速精准的智能医疗体系[1-2]。临床检验主要是运用物理学、化学和生物学等实验方法对各种标本进行定性或定量分析,为医生临床诊断提供可靠依据[3]。近年来,人工智能(AI)在医疗检验领域大放异彩,人工智能在样本处理,形态学检验,检验结果审查等过程中发挥着重要作用,有效减少了检验工作人员因主观性导致的误差,提高了检验人员的工作效率,人工智能与检验的结合满足了临床对检验专业日益增高的质量要求[4]。人工智能大潮汹涌而来,我们作为工作在临床一线的检验人更应该顺应潮流,担当使命,积极接受新事物并将其转化为更先进的检验手段,更好地服务于医疗事业。
1人工智能技术1.1人工智能的概念人工智能是研究、开发用于模拟、延伸和扩展人的理论、方法、技术及应用系统的一门新的技术科学[5]。人工智能由计算机科学衍生而来,尝试利用计算机模拟人脑做出智能反应,目前人工智能的研究涵盖机器人、语言识别、图像识别、自然语言处理和专家系统等多个领域。
1.2人工智能发展历程1945年世界上第1台通用电子计算机ENIAC出现,尽管该计算机计算速度有限,操作过程繁琐,但依然为人工智能的出现奠定了条件基础。1950年,图灵发出疑问“机器会思考吗?”,并且提出著名的图灵测试,该测试至今仍被视为人工智能水平测试标准之一,而图灵也被誉为人工智能之父。1956年,科学家们在达特茅斯会议中正式提出人工智能一词,并且将人工智能作为一个新概念划分为一个独立学科,故1956年被视为人工智能元年。由于当时计算机计算能力的局限性,人工智能黄金时期持续不久便遭遇寒冬,直到1980年卡耐基梅隆大学(CMU)研发的专家系统XCON正式投入使用,人工智能再一次复苏,随着机器学习的出现,人工智能进入繁盛时期[6,7]。工业1.0是蒸汽机时代,工业2.0是电气化时代,工业3.0是信息化时代,而人工智能的出现标志着第四次工业革命的开始,我们迎来了工业4.0,即利用信息化技术促进产业变革的智能化时代。2016年,由谷歌(Google)旗下DeepMind公司开发的人工智能软件AlphaGo与国际围棋冠军李世石五番棋大战,李世石以1:4的比分惨败,向人们昭告人工智能技术已然成熟,人工智能已经走下神坛进入我们的生活。
1.3智能化的理论基础1.3.1机器学习机器学习是人工智能的核心研究领域,是实现人工智能的一种手段,其目的在于使计算机具有智能化学习能力。机器学习的定义为利用经验来改善计算机系统自身的性能,简而言之就是计算机利用已有的数据进行学习得出规律以便对未知的新数据进行预测[8]。机器学习又分为监督学习和无监督学习,监督学习中所有数据都有对应的人为给定的特征标签,然后在这些特征中寻找数据之间的规律。而无监督学习则是要求计算机通过寻找数据间的规律主动确定数据特征。监督学习主要面向分类及回归问题,而无监督学习主要面向聚类分析以及数据降维等问题,机器学习概念如图1所示。
图1(Fig.1)图1机器学习概念图Fig.1Machinelearningconceptdiagram1.3.2深度学习深度学习是机器学习的一个分支,深度学习用无监督式或半监督式的特征学习和分层特征提取高效算法来替代传统特征提取算法[9]。深度学习引入了感知器这一概念并且将神经元视作一个功能逻辑器,同时将神经元活动简化为了3个过程:输入信号线性加权,求和,非线性激活。神经元构成的神经网络由3部分组成:输入层,隐藏层,输出层,3者均由权值连接,输入层接收外界信息,隐藏层和输出层的神经元对信息进行函数处理,最后神经网络模拟人类大脑做出决策[10]。深度学习依赖数据来提升算法准确率,数据集质量越高,深度学习对特征的学习效果就越好,深度学习概念如图2所示。
图2(Fig.2)图2深度学习概念图Fig.2Deeplearningconceptdiagram1.3.3强化学习强化学习也是机器学习的一个分支,强化学习有两个关键概念:策略和奖励。强化学习就是智能系统通过反复的执行某些策略并且得到反馈,然后朝奖励信号最大的方向学习,强化学习的自我学习通过实践来实现并且通过实践找到最好的结果。深度学习和强化学习首先都是自主学习系统。深度学习从训练集数据中学习是一种静态学习,但强化学习是通过不断犯错再得到反馈来调整自身的策略以获得最优结果,是一种动态学习[11-12]。事实上,深度学习与强化学习并不是相互排斥的概念,深度学习作为运作机制,强化学习进行算法优化,两者结合形成了一个更接近人类级别的通用智能。
1.3.4迁移学习深度学习和强化学习任务均从零知识开始,这意味着模型的结构和参数开始是随机猜测的。除此之外,实现机器学习需要大量标注好的高质量数据以及强大的计算资源和算力基础。因此学者们考虑对已有大数据集进行最大程度的开发,于是迁移学习诞生了。迁移学习也是实现机器学习的一种手段,迁移学习可以理解为将计算机在一个任务上学习到的知识迁移到另一个新任务上,作为其起点继续对新任务进行学习。迁移学习包括基于实例的迁移学习,其特点为源域实例类似目标域实例;基于特征的迁移学习,其特点为源域特征与目标域特征有重叠;以及在训练阶段共享一部分参数或者先验分布的基于共享参数的迁移学习[13],迁移学习概念如图3所示。
图3(Fig.3)图3迁移学习概念图Fig.3Transferlearningconceptdiagram1.4智能化的实践基础1.4.1大数据人工智能有3大要素:算法、数据、算力,数据是人工智能的基础之一。人工智能的发展需要通过对特定数据进行反复的学习,总结经验与知识。数据的质量往往对人工智能算法的好坏有决定性作用,统一标准的数据集是对人工智能算法优劣进行准确评价的保证,大数据技术的发展迎来了人工智能发展的春天[14]。“大数据”这个概念正式被提出是在2011年,并且在人工智能的催生下产生了大量优秀的带标注或反馈信息的数据集,如ImageNet,COCO,人脸数据库(AFLW)等。ImageNet是世界上最大的图像识别数据库,模拟人类的识别系统建立,目前ImageNet中共有14,197,122幅图像,涵盖了21,841个类别,每个类别中又有上百张图片。利用ImageNet训练的不同模型常在迁移学习中用做预训练,预训练在缩短计算机训练时间的同时还可以提升模型训练效果。AFLW人脸数据库是一个多姿态、多视角的大规模人脸数据库,该数据库大概包括25,000万张人脸图像,59%为女性,41%为男性,且每个人脸都被标注了21个特征点,这个数据集在人脸识别领域有极高的研究价值[15]。
1.4.2算力基础1956年,人工智能诞生却被当时时代的局限性限制,计算机计算能力无法达到人工智能的要求,人工智能一度面临寒冬。近年来与人工智能算法数据处理相关的芯片蓬勃发展,大致可以分为四种:CPU、GPU、NPU、TPU[16]。CPU擅长高效率处理指令,适合处理逻辑控制密集的计算任务。GPU擅长图形类或非图形类无逻辑数据高度并行计算,更适合处理数据密集的计算任务,所以GPU比CPU更适合深度学习的大量矩阵、卷积运算[17-18]。TPU是为机器学习量身定做的一款计算芯片,以张量为处理单位可以加速人工智能算法框架TensorFlow的运行,相比CPU和GPU,为机器学习量身定做的TPU执行每个操作所需的晶体管数量更少,效率更高[19]。NPU是嵌入式神经网络处理器,专门为物联网人工智能而设计,面向神经网络算法进行加速,典型代表为中科院研制的寒武号系列[20-21]。
1.4.3软件平台机器学习软件平台包括Caffe,TensorFlow,Keras,PyTorch等机器学习算法框架,这些框架的出现将机器学习常用的算法和模型封装成固定的组件,降低了机器学习的门槛。机器学习算法工作随着各类框架的出现变得通俗易懂,算法框架的出现不仅保证了运用的灵活也保证了运算的效率,目前机器学习领域各类优秀算法的百花齐放离不开软件平台的技术支持[22-23]。
2人工智能催化医学检验革命2.1检验标本处理2.1.1标本采集机器人当前最典型,最成熟的标本采集机器人当属全自动采血机器人,全自动采血机器人通过红外线照射配合超声波可以得到与血管位置、直径相关的数据。机器视觉可将血管位置、直径等相关数据作为输入,选择合适的算法对数据进行计算然后预测出血管位置、直径以及针头采血的最佳位置及角度[24]。王涛等人提出了一种新的基于计算机图像从血管造影图像中自动提取冠状动脉的图像分割方法。该方法基于多尺度自适应Hessian的增强方法对血管造影图像进行增强后,与统计区域合并技术结合从图像中分割出血管轮廓,提取中心线并且计算出血管直径[25-26]。自动采血机器人利用了智能识别技术,用智能机器取代了人工,减少了人类的主观性失误,将工作员从繁重且危险的工作中解脱出来。
2.1.2样本稀释机器人实验室及检验科所采集的样本一般浓度较高,需要稀释到不超出检测方法学的线性范围。尿液,粪便及阴道分泌物有形成分显微镜检测时,样本均需要稀释到合适浓度。检测时,医务人员通常是直接将未进行稀释的样品进行检测,发现检测效果不佳后再做稀释。如阴道分泌物虽然呈液体状可以直接上镜检测,但是太浓稠的样本会导致镜检时有形成分黏连重叠,不利于医务人员观察。样本稀释机器人分为两类,一类利用光学原理,带有一个光电检测器,将透过样本检测到的透射光的大小作为输入,输出则为该样本是否需要稀释。另一类则需要具体的样本中某类成分的浓度数据。有学者利用基于多层感知器的人工神经网络对心肌肌钙蛋白I检测结果数据集进行建模得到可以用于判断心脏病患者体液样品是否需要稀释的算法模型,对不需要和需要进行稀释样品的正确推断率分别为100%和86.2%[27]。样本稀释机器人的出现不仅解决了样品处理过程中耗时过长的问题,也减少了样品浪费和多余的繁琐操作。
2.1.3样本传送机器人随着人工智能在商品物流上的应用趋向于成熟,人们开始把眼光转向人工智能在医学检测样品传送上的应用。样本的传送在检验科样品前处理过程中有重要地位,将直接影响检验的准确性。样本传送机器人可以通过机器视觉或者结合化学手段智能识别不同的样本和试剂,并且按照计算机的指令在固定区域装货卸货。样本传送机器人的出现让工作人员能够从医院各个病区、门诊、急诊中及时地获取标本并且送到指定的检验科室。如图4是ROBO公司的物流机器人RoboGo医用无人车,分别为密封型和开放型,样本传送机器人的无菌环境及其智能系统保证了运输的安全、准确、灵活、高效。样本传送机器人的出现减少了人工送检的误差,保证了样本的安全,避免了样本污染。
图4(Fig.4)图4RoboGo医用无人车Fig.4RoboGomedicaldrone2.2检验项目挖掘2.2.1肿瘤标志物肿瘤标志物又被称为肿瘤标记物,是指只存在于恶性肿瘤中,由恶性肿瘤细胞产生,或是宿主对肿瘤的刺激反应而产生并能反映肿瘤发生、发展情况,监测肿瘤对治疗反应的一类物质。检验人员一般是采集肿瘤患者的血清,组织,排泄物或体液,再通过一些生化分析方法如色谱-质谱结合方法、毛细管电泳-质谱结合法和核磁共振波谱等方法[28]进行检测得到一些特异性物质的数据。特异性物质相关数据一般比较巨大,且不是所有数据都与肿瘤相关,这一问题的存在长期影响着检验医生对病情的分析,而数据挖掘技术的出现解决了这一问题,最常用的数据分析方法包括主成分分析和人工神经网络[29]。有学者在研究肝癌标志物时以肝癌患者的外周血清为样本,采用基于NMR的代谢组学分析技术,结合模式识别技术:主成分分析法(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘分析(OPLS-DA)、代谢物生物功能富集等方法,找出了肝癌的肿瘤标志物并进行分析,发现包括α-葡萄糖、β-葡萄糖苯、丙氨酸、琥珀酸、赖氨酸、酪氨酸、谷氨酰胺、肌酸、柠檬酸盐在内的九种标志物水平升高,包括低密度脂蛋白(LDL)、极低密度脂蛋白(VLDL)、N-酰基糖蛋白(NAG)、异亮氨酸、缬氨酸、胆碱酸盐和丙酮物质在内的7种标志物水平降低,并绘出了肝癌标志物通路图如图5[30-31]。
图5(Fig.5)图5肝癌标志物通路图[30]Fig.5Livercancermarkerpathwaymap[30]2.2.2核酸分子核酸分子相关的数据挖掘常用方法有两类,一类是针对核酸序列进行预测分析,另一类是利用核酸与蛋白质相互比较进行预测分析。前者是通过分析核酸序列找出某种特定基因或者功能位点的位置,后者是通过比较核酸序列和蛋白质序列之间的相似性区域和保守性位点推测两者的进化关系[32-33]。针对核酸序列进行预测分析的核心是核酸序列相似性研究,研究思路是给定一段核酸序列,在某个核酸序列库中查找与该段核酸序列相似性大于某个阈值的序列,典型的基于遗传算法的核酸相似性对比算法有SAGA(sequencealignmentbygeneticalgonthm)算法和MUSLE(multiplesequencealignmem)算法。Rybicki等人利用SAGA算法基于肺和器官受累表型的协变量进行了多点连锁分析,证明了影响非裔美国人结节病临床表现的基因可能与疾病易感性的基因不同[32]。郑霙等人以程序性细胞死亡相关基因PDCD5为靶分子,基于数据挖掘对其核酸与蛋白质序列关系进行分析,采用微阵列方法进行表达谱分析,得出PDCD5不仅仅参与细胞凋亡过程,还通过与核糖体的某些潜在作用影响特定蛋白质的翻译表达[34]。
2.2.3药物基因组学药物基因组学结合了基因组学和分子药理学,通过计算机科学以及数学理论研究基因序列变异及其对应药物反应,高效地为特定人群寻找合适药物。检验人员一般通过服药后患者的体液或者排泄物获取药物敏感性数据。Dong等[35]使用癌细胞系百科全书(CCLE)中的基因表达特征和药物敏感性数据,基于支持向量机(SupportVectorMachine,SVM)和递归特征选择工具来构建预测因子。通过在独立的数据集癌症基因组计划(CancerGenomeProject,CGP)进行交叉验证,验证了他们的模型在对GDSC(GenomicsofDrugSensitibityinCancer,抗癌药物敏感性基因组学)数据集常用的几种药物与其对应基因表达关系的预测具有较好的稳健性。Daemen等[36]基于小二乘支持向量机和随机森林算法对70种乳腺癌细胞系和90种对应抗癌症药物反应的相关分子特征进行分析,最终发现治疗反应是在基因组的多个水平上进行的,将患者与基于转录亚型的治疗相匹配将提高药物应答率。
2.3形态学检验目前检验科进行细胞形态学分析时均是以人工镜检为金标准,但是人工镜检主观因素影响大,需要专业的检验科人员进行操作,操作繁琐、耗费时间长,不适用于大规模筛查。人工智能的出现为形态学检验的困境带来了转机,人工智能辅助形态学检验的思路一般可以分为检测任务,分割任务和分类任务。检测任务一般是定位目标细胞并进行计数,分割任务一般是分割目标然后进行面积或体积的量化分析,分类任务一般是面对种类较多较复杂的形态学分析时在检测或分割的基础上对目标细胞进行进一步的形态学分析,图6中列举了几种典型的细胞形态学分析的应用。
图6(Fig.6)图6人工智能辅助形态学检验Fig.6Artificialintelligenceassistedmorphologytest2.3.1血细胞形态学分析血常规检查是诊断血液系统相关疾病的最基本检验项目,检验内容包括血细胞计数和血细胞形态学检查两个方面。由于血细胞形态学分析对检验人员水平要求较高且工作量大,故血细胞形态学分析是目前各级医院检验科的薄弱环节之一。血细胞形态学检查自20世纪50年代~60年代以来主要以显微镜为检测工具进行人工镜检[37],人工智能的出现推动了自动化血细胞分析仪的发展,将检验医生们从繁重的血细胞形态学镜检工作中解放出来[38]。陈畅等[39]利用显微镜从外周血图片中采集分辨率为360像素×363像素的五类白细胞单个图像作为训练数据,在深度学习框架Caffe上搭建由LetNet网络模型删减优化而得来的轻量高效新网络CCNet,该网络模型对979张5类细胞图像的最佳分类准确率达到99.69%。市面上常见的智能血细胞分析仪有希森美康XS-500i全自动血细胞分析仪和CellaVision的DM96全自动血细胞形态学分析仪等。
2.3.2染色体核型分析染色体核型分析是根据人类染色体数目和结构异常的类型,以推断染色体异常与疾病关系的一种诊断技术。检验医生在进行核型分析前一般将细胞培养至有丝分裂中期并固定,再选取染色体分裂相完整独立,相对疏散,染色体形态适中无交联缠绕的部分进行分析。Abid等[40]对近年来自动染色体分类系统领域的突破性研究进行了全面回顾,首先回顾了特征提取的方法,然后再进行基于神经网络的染色体分类器调查。特征提取主要是基于染色体形态,条带,着丝粒位置等特征进行分析,Poletti等[41]使用从50个狭窄的骨中期细胞中提取的2287个染色体,开发了一款可以通过定位染色体着丝粒位置锁定染色体的算法。Oskouei等[42]采用了具有两层概率的神经网络用于染色体的分类,将分类过程分为两个步骤,在第一步骤中,将染色体分为6组,在第二步中,将6组的染色体分为24个类。市面上常见的染色体核型分析系统有VideoTes公司的T-Karyo染色体核型分析系统,德适生物的AutoVision染色体智能分析工作站等。
2.3.3精子质量分析精子质量分析主要包括精子数量、精子体积、精子活跃程度,精子活跃程度又可以分为运动活跃型、非运动活跃型、完全不动型[43]。精子形态学检验时,检验医生一般将精液稀释后制成样本在显微镜下肉眼观察精子形态、密度、活动率,并且进行计数。Ghasemian等[44]开发了一套精子形态分析算法,检测和分析人体精子的不同部位,该算法在消除图像噪声的同时增强了图像的对比度,算法模型能够识别出精子的不同部分,分析每个部分的大小和形态,最后将精子分类为正常精子或者异常精子。Bijar等[45]提出了一种分割精子顶体,核和中段的算法,该算法利用自适应混合方法(AMM)和马尔可夫随机场(MRF)模型来获取和升级分类条件概率密度函数(CCPDF)以及每个像素类别的先验概率,最后达到精子分割目的。
2.3.4阴道分泌物有形成分分析阴道分泌物有形成分分析一般是检验医生将稀释后的阴道分泌物制成样本在显微镜下用肉眼观察上皮、线索、球菌、念珠菌、杆菌、滴虫、白细胞等有形成分的形态和数量,并且根据这些指标为阴道环境清洁度分级,是诊断细菌性阴道炎(BV)、滴虫性阴道炎、混合感染型阴道炎等多种妇科疾病的重要依据[46]。胡静蓉等[47]利用人工神经网络改进的模糊识别算法对白细胞进行识别,并且基于纹理特征和几何特征利用传统算法识别上皮细胞、杆菌和球菌。目前市面上已有的阴道分泌物形态学分析仪有丽拓生物的阴道分泌物分析仪LTS—V800等。
2.3.5液基薄层细胞有形成分分析液基薄层细胞有形成分分析主要是通过人工镜检检测宫颈是否存在细胞增生,从而判断宫颈是否病变,液基细胞检测对宫颈癌细胞的检出率为100%。郑欣等[48]提出了一种基于YOLO(YouOnlyLookOnce)模型的算法对液基薄层细胞进行识别,该算法利用700张来自不同视野下的液基薄层细胞进行训练。考虑到液基薄层细胞黏连严重,提取图像特征的基础网络过深会导致过拟合,故使用Resnet50作为基础网络,该算法模型对液基薄层细胞识别率为87%,对液基细胞团簇的识别准确率为75.9%。
2.3.6尿液有形成分分析尿液有形成分分析一般是医生将尿液制成样本直接在显微镜下用肉眼观察红细胞、白细胞、上皮细胞、各种复杂管型以及各种结晶。尿液显微镜检查是诊断泌尿系统疾病的重要手段[49-50]。蔡立章等[51]基于BP(backpropagation)神经网络改进算法对白细胞进行识别,选用LeNet-5网络模型基于matlab平台实现网络对白细胞、红细胞、结晶的识别,然后将深度学习图像识别结果与传统算法进行比较,证明了深度学习算法的优越性。市面上常见的尿液有形成分分析仪有迈瑞的EH-2080全自动尿液有形成分分析系统等。
2.3.7粪便有形成分分析粪便有形成分分析一般是检验医生将稀释后的粪便制成样本在显微镜下用肉眼观察红细胞、白细胞、巨噬细胞、上皮细胞、酵母菌、脂肪滴、虫卵等有形成分,粪便有形成分分析对多种肠胃病诊断有重要参考意义,如果粪便中存在虫卵基本上可以断定患者感染寄生虫。Yang等[52]提出了一种通过数字图像处理和人工神经网络从显微图像中提取粪便标本中人寄生虫卵的形态特征的算法,该算法利用了包含七个普通人类蠕虫卵的82个显微图像作为数据库。基于形状,外壳光滑度和大小的3个形态特征利用人工神经网络进行训练,算法模型正确分类率为90.3%。
2.3.8骨髓细胞形态学分析骨髓细胞形态学分析时,检验医生一般直接在显微镜下观察骨髓刺穿术所制得的骨髓图片,低倍镜下观察骨髓增生程度,有无异常细胞,并且对巨核细胞进行计数,油镜下对有核细胞分类计数并且观察细胞形态。骨髓形态学分析可以用于多种疾病的诊断,如急性白血病、自身免疫性疾病、感染性疾病、恶性肿瘤等。骨髓细胞形态学分析与血细胞形态学分析原理一致,只是检测细胞类别和样本获取位置有所不同。
2.4检验数据处理2.4.1辅助诊断模型医学专家系统是医学检验领域最常见的人工智能辅助诊断模型。医学专家系统集成了大量医疗检验数据以及对应疾病症状和治疗预后,通过互联网与各个医院的不同科室紧密联系以保证医学信息的实时更新。人工智能利用这些医学信息学习各种检测数据与相关疾病的内在联系,最后得到一个可以诊断患者疾病或者给予可靠建议的算法模型,这样一个算法模型相当于一个人类医学专家。最早的医学专家系统是斯坦福大学的MYCIN系统,MYCIN可以辅助医生对血液感染病患者进行筛查并且提出可靠性治疗建议[53]。John等[54]基于贝叶斯网络,使用多层感知的人工神经网络,使用径向基函数的人工神经网络,支持向量机和专家系统分别利用入院时患者各项医学检测数据开发可以预测是否需要重新住院的智能系统,并且通过临床试验证明除向量机外,所有模型均能提供良好的重新住院预测结果。医学专家系统概念如图7所示。
图7(Fig.7)图7医学专家系统Fig.7Medicalexpertsystem2.4.2报告自动审核检测报告审核是检验工作中必不可少的流程,报告审核的精准和快速保证了检测工作的高效。但是人工审核检验报告不仅耗时耗力,当检验科工作人员在高强度工作后还容易出现审核失误。为解决这些问题,自动化报告审核系统的搭建刻不容缓,而人工智能的出现为自动化报告审核系统带来了新的契机。自动化报告审核系统主要依靠HIS系统(医院信息系统)和LIS系统(实验室信息系统)实现。Shih等[55]收集了569001例患者检测信息作为数据库,通过LIS建立信息传递系统并且开发了一套自动验证算法,可输出极限检查,增量检查和一致性规则检查的范围。该算法消除了测试结果验证中的个体差异,缩短了周转时间(TAT),并减少了全职等效时间(FTE),从而使医疗技术人员能够投入更多的时间和精力来处理算法锁定的测试报告。
2.4.3隐私数据保护随着互联网医疗的兴起,医疗隐私数据的保护开始被各界关注。在医院普遍使用电子病历的当代,医学专家和计算机学者们联合起来对电子病历中的医嘱数据、诊断数据进行最大程度的开发,以补充医学知识的不足和医疗系统的缺陷。但是研究人员享受数据盛宴的同时,我们同样需要对隐私问题高度关注。胡荣磊等[56]结合数据挖掘和数据储存技术提出了一种在大数据环境下对医学隐私数据进行脱敏的隐私保护方案,该方案先设定敏感级别再利用ETL(数据仓库技术)对数据进行抽取,设计算法判别数据敏感级别,并且根据数据敏感级别的不同对数据进行不同程度的加密。
2.5云计算大数据、云计算、人工智能、物联网等一大批新兴信息技术的出现,在医疗检验领域产生了革命性的影响,推动了医疗检验事业的创新发展。云计算平台能对分布于不同地方,不同时间以及不同检验项目的数据进行收集、存储、分析、运算和质控。云平台的大部分数据处理都在云端完成,在保证数据安全、降低数据存储成本的同时为医疗诊断提供了可靠而快捷的诊断辅助,大大降低了基层医疗机构对操作人员的要求[57]。
2.5.1诊断字典诊断字典是一个尚不成熟但是成长前景无限的概念,柯莉等[58]以国际疾病分类(ICD)为基础,利用广州医科大学附属第三医院医学数据库建立了临床疾病诊断字典。该诊断字典收集了广州医科大学附属第三医院各个临床科室疾病和诊断策略,统一规范疾病名称,将临床诊断疾病与ICD相对应。由于人力和医学资源的限制,柯莉等人所建立的诊断字典内容是远远不够完整的,但是为我们医学检验人员更好地利用人工智能、大数据、云计算改革传统检验手段提供了一个好的思路,要想建立一个完善可靠的医学检验云计算中心,我们需要一个权威的医学标准。
2.5.2互联网医学检验互联网医学检验常见的技术手段为第三方医学检验与即时检测(POCT),互联网医学检验以互联网为载体整合了云计算,大数据和线下医学检验数据,满足了医学检验系统对信息传送高效、诊断决策精准的要求。第三方检验实验室可以是实验室或者公司,服务对象为二级医院或者社区医院这些医学检验体系不够完善或者医学专家资源不足的级别较低医院,第三方实验室可以作为一个中转站,将低级别医院检验数据智能处理后个性化传送到特定的较高级别医院进行更专业的诊断。也可以是一个更高级的拥有丰富医学知识和医学诊断经验的医学专家系统,直接将诊断结果打印成报告传回较低级别医院[59]。即时检测是医学检验领域的一个新概念,通俗的理解是一种试剂与仪器为便携式,在不固定场所均可进行的,检测报告结果即时化的检测手段。Sarwar等[60]利用软电子技术开发了一款可以使用少量液体在柔性基板上执行电子或光学监控,并将监控数据结合蛋白质组学进行数据挖掘分析的设备。该设备基于汗液的诊断程序可以为患者提供无痛的监测,患者在自己的家中舒适地跟踪各种医疗状况。
2.5.35G技术2019年6月6日,工信部发放了5G商用牌照,标志着中国正式进入了5G商用元年,5G具备高速率、低时延和更大用户连接能力等特点,目前我国已经建成了全世界规模最大的5G网络[61]。我国对于5G技术的应用并不仅限于通信,5G技术推动了智慧医疗的发展,让第三方实验室,即时检测等互联网检测手段变得更高效,便捷,也为医学数据庞大数据的传送和医学数据复杂计算提供了实现的可能性。通过5G技术医护人员甚至患者能够在任意地点快速与医学云计算中心通讯,而专业检验医师也能第一时间获取患者信息并完成检测报告单。
图8(Fig.8)图85G技术在智能检测中应用Fig.8Applicationof5Gtechnologyinintelligentdetection3智能化医学检验时代展望我国人口的显著特征是人口基数大,人口老龄化严重,然而与我国对医疗服务需求大相对应的现状却是我国的医疗卫生资源分配极度不平均,经济落后地区和贫困山区的患者体验现代医学福音的机会少之又少。人工智能所携带的一系列先进检验技术如即时检测,第三方实验室,诊断字典等的出现在为医护人员带来便利,减少检测诊断误差的同时,也打破了我国医学资源分配不平均的僵局,让偏远地区的患者也能有机会享受最先进、专业的医学检测服务。
人工智能助力检验医学发展
1.3.2深度学习
深度学习是机器学习的一个分支,深度学习用无监督式或半监督式的特征学习和分层特征提取高效算法来替代传统特征提取算法[9]。深度学习引入了感知器这一概念并且将神经元视作一个功能逻辑器,同时将神经元活动简化为了3个过程:输入信号线性加权,求和,非线性激活。神经元构成的神经网络由3部分组成:输入层,隐藏层,输出层,3者均由权值连接,输入层接收外界信息,隐藏层和输出层的神经元对信息进行函数处理,最后神经网络模拟人类大脑做出决策[10]。深度学习依赖数据来提升算法准确率,数据集质量越高,深度学习对特征的学习效果就越好,深度学习概念如图2所示。
图2深度学习概念图
Fig.2Deeplearningconceptdiagram
1.3.3强化学习
强化学习也是机器学习的一个分支,强化学习有两个关键概念:策略和奖励。强化学习就是智能系统通过反复的执行某些策略并且得到反馈,然后朝奖励信号最大的方向学习,强化学习的自我学习通过实践来实现并且通过实践找到最好的结果。深度学习和强化学习首先都是自主学习系统。深度学习从训练集数据中学习是一种静态学习,但强化学习是通过不断犯错再得到反馈来调整自身的策略以获得最优结果,是一种动态学习[11-12]。事实上,深度学习与强化学习并不是相互排斥的概念,深度学习作为运作机制,强化学习进行算法优化,两者结合形成了一个更接近人类级别的通用智能。
1.3.4迁移学习
深度学习和强化学习任务均从零知识开始,这意味着模型的结构和参数开始是随机猜测的。除此之外,实现机器学习需要大量标注好的高质量数据以及强大的计算资源和算力基础。因此学者们考虑对已有大数据集进行最大程度的开发,于是迁移学习诞生了。迁移学习也是实现机器学习的一种手段,迁移学习可以理解为将计算机在一个任务上学习到的知识迁移到另一个新任务上,作为其起点继续对新任务进行学习。迁移学习包括基于实例的迁移学习,其特点为源域实例类似目标域实例;基于特征的迁移学习,其特点为源域特征与目标域特征有重叠;以及在训练阶段共享一部分参数或者先验分布的基于共享参数的迁移学习[13],迁移学习概念如图3所示。
图3迁移学习概念图
Fig.3Transferlearningconceptdiagram
1.4智能化的实践基础
1.4.1大数据
人工智能有3大要素:算法、数据、算力,数据是人工智能的基础之一。人工智能的发展需要通过对特定数据进行反复的学习,总结经验与知识。数据的质量往往对人工智能算法的好坏有决定性作用,统一标准的数据集是对人工智能算法优劣进行准确评价的保证,大数据技术的发展迎来了人工智能发展的春天[14]。“大数据”这个概念正式被提出是在2011年,并且在人工智能的催生下产生了大量优秀的带标注或反馈信息的数据集,如ImageNet,COCO,人脸数据库(AFLW)等。ImageNet是世界上最大的图像识别数据库,模拟人类的识别系统建立,目前ImageNet中共有14,197,122幅图像,涵盖了21,841个类别,每个类别中又有上百张图片。利用ImageNet训练的不同模型常在迁移学习中用做预训练,预训练在缩短计算机训练时间的同时还可以提升模型训练效果。AFLW人脸数据库是一个多姿态、多视角的大规模人脸数据库,该数据库大概包括25,000万张人脸图像,59%为女性,41%为男性,且每个人脸都被标注了21个特征点,这个数据集在人脸识别领域有极高的研究价值[15]。
1.4.2算力基础
1956年,人工智能诞生却被当时时代的局限性限制,计算机计算能力无法达到人工智能的要求,人工智能一度面临寒冬。近年来与人工智能算法数据处理相关的芯片蓬勃发展,大致可以分为四种:CPU、GPU、NPU、TPU[16]。CPU擅长高效率处理指令,适合处理逻辑控制密集的计算任务。GPU擅长图形类或非图形类无逻辑数据高度并行计算,更适合处理数据密集的计算任务,所以GPU比CPU更适合深度学习的大量矩阵、卷积运算[17-18]。TPU是为机器学习量身定做的一款计算芯片,以张量为处理单位可以加速人工智能算法框架TensorFlow的运行,相比CPU和GPU,为机器学习量身定做的TPU执行每个操作所需的晶体管数量更少,效率更高[19]。NPU是嵌入式神经网络处理器,专门为物联网人工智能而设计,面向神经网络算法进行加速,典型代表为中科院研制的寒武号系列[20-21]。
1.4.3软件平台
机器学习软件平台包括Caffe,TensorFlow,Keras,PyTorch等机器学习算法框架,这些框架的出现将机器学习常用的算法和模型封装成固定的组件,降低了机器学习的门槛。机器学习算法工作随着各类框架的出现变得通俗易懂,算法框架的出现不仅保证了运用的灵活也保证了运算的效率,目前机器学习领域各类优秀算法的百花齐放离不开软件平台的技术支持[22-23]。
2人工智能催化医学检验革命
2.1检验标本处理
2.1.1标本采集机器人
当前最典型,最成熟的标本采集机器人当属全自动采血机器人,全自动采血机器人通过红外线照射配合超声波可以得到与血管位置、直径相关的数据。机器视觉可将血管位置、直径等相关数据作为输入,选择合适的算法对数据进行计算然后预测出血管位置、直径以及针头采血的最佳位置及角度[24]。王涛等人提出了一种新的基于计算机图像从血管造影图像中自动提取冠状动脉的图像分割方法。该方法基于多尺度自适应Hessian的增强方法对血管造影图像进行增强后,与统计区域合并技术结合从图像中分割出血管轮廓,提取中心线并且计算出血管直径[25-26]。自动采血机器人利用了智能识别技术,用智能机器取代了人工,减少了人类的主观性失误,将工作员从繁重且危险的工作中解脱出来。
2.1.2样本稀释机器人
实验室及检验科所采集的样本一般浓度较高,需要稀释到不超出检测方法学的线性范围。尿液,粪便及阴道分泌物有形成分显微镜检测时,样本均需要稀释到合适浓度。检测时,医务人员通常是直接将未进行稀释的样品进行检测,发现检测效果不佳后再做稀释。如阴道分泌物虽然呈液体状可以直接上镜检测,但是太浓稠的样本会导致镜检时有形成分黏连重叠,不利于医务人员观察。样本稀释机器人分为两类,一类利用光学原理,带有一个光电检测器,将透过样本检测到的透射光的大小作为输入,输出则为该样本是否需要稀释。另一类则需要具体的样本中某类成分的浓度数据。有学者利用基于多层感知器的人工神经网络对心肌肌钙蛋白I检测结果数据集进行建模得到可以用于判断心脏病患者体液样品是否需要稀释的算法模型,对不需要和需要进行稀释样品的正确推断率分别为100%和86.2%[27]。样本稀释机器人的出现不仅解决了样品处理过程中耗时过长的问题,也减少了样品浪费和多余的繁琐操作。
2.1.3样本传送机器人
随着人工智能在商品物流上的应用趋向于成熟,人们开始把眼光转向人工智能在医学检测样品传送上的应用。样本的传送在检验科样品前处理过程中有重要地位,将直接影响检验的准确性。样本传送机器人可以通过机器视觉或者结合化学手段智能识别不同的样本和试剂,并且按照计算机的指令在固定区域装货卸货。样本传送机器人的出现让工作人员能够从医院各个病区、门诊、急诊中及时地获取标本并且送到指定的检验科室。如图4是ROBO公司的物流机器人RoboGo医用无人车,分别为密封型和开放型,样本传送机器人的无菌环境及其智能系统保证了运输的安全、准确、灵活、高效。样本传送机器人的出现减少了人工送检的误差,保证了样本的安全,避免了样本污染。
图4RoboGo医用无人车
Fig.4RoboGomedicaldrone
2.2检验项目挖掘
2.2.1肿瘤标志物
肿瘤标志物又被称为肿瘤标记物,是指只存在于恶性肿瘤中,由恶性肿瘤细胞产生,或是宿主对肿瘤的刺激反应而产生并能反映肿瘤发生、发展情况,监测肿瘤对治疗反应的一类物质。检验人员一般是采集肿瘤患者的血清,组织,排泄物或体液,再通过一些生化分析方法如色谱-质谱结合方法、毛细管电泳-质谱结合法和核磁共振波谱等方法[28]进行检测得到一些特异性物质的数据。特异性物质相关数据一般比较巨大,且不是所有数据都与肿瘤相关,这一问题的存在长期影响着检验医生对病情的分析,而数据挖掘技术的出现解决了这一问题,最常用的数据分析方法包括主成分分析和人工神经网络[29]。有学者在研究肝癌标志物时以肝癌患者的外周血清为样本,采用基于NMR的代谢组学分析技术,结合模式识别技术:主成分分析法(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘分析(OPLS-DA)、代谢物生物功能富集等方法,找出了肝癌的肿瘤标志物并进行分析,发现包括α-葡萄糖、β-葡萄糖苯、丙氨酸、琥珀酸、赖氨酸、酪氨酸、谷氨酰胺、肌酸、柠檬酸盐在内的九种标志物水平升高,包括低密度脂蛋白(LDL)、极低密度脂蛋白(VLDL)、N-酰基糖蛋白(NAG)、异亮氨酸、缬氨酸、胆碱酸盐和丙酮物质在内的7种标志物水平降低,并绘出了肝癌标志物通路图如图5[30-31]。
图5肝癌标志物通路图[30]
Fig.5Livercancermarkerpathwaymap[30]
2.2.2核酸分子
核酸分子相关的数据挖掘常用方法有两类,一类是针对核酸序列进行预测分析,另一类是利用核酸与蛋白质相互比较进行预测分析。前者是通过分析核酸序列找出某种特定基因或者功能位点的位置,后者是通过比较核酸序列和蛋白质序列之间的相似性区域和保守性位点推测两者的进化关系[32-33]。针对核酸序列进行预测分析的核心是核酸序列相似性研究,研究思路是给定一段核酸序列,在某个核酸序列库中查找与该段核酸序列相似性大于某个阈值的序列,典型的基于遗传算法的核酸相似性对比算法有SAGA(sequencealignmentbygeneticalgonthm)算法和MUSLE(multiplesequencealignmem)算法。Rybicki等人利用SAGA算法基于肺和器官受累表型的协变量进行了多点连锁分析,证明了影响非裔美国人结节病临床表现的基因可能与疾病易感性的基因不同[32]。郑霙等人以程序性细胞死亡相关基因PDCD5为靶分子,基于数据挖掘对其核酸与蛋白质序列关系进行分析,采用微阵列方法进行表达谱分析,得出PDCD5不仅仅参与细胞凋亡过程,还通过与核糖体的某些潜在作用影响特定蛋白质的翻译表达[34]。
2.2.3药物基因组学
药物基因组学结合了基因组学和分子药理学,通过计算机科学以及数学理论研究基因序列变异及其对应药物反应,高效地为特定人群寻找合适药物。检验人员一般通过服药后患者的体液或者排泄物获取药物敏感性数据。Dong等[35]使用癌细胞系百科全书(CCLE)中的基因表达特征和药物敏感性数据,基于支持向量机(SupportVectorMachine,SVM)和递归特征选择工具来构建预测因子。通过在独立的数据集癌症基因组计划(CancerGenomeProject,CGP)进行交叉验证,验证了他们的模型在对GDSC(GenomicsofDrugSensitibityinCancer,抗癌药物敏感性基因组学)数据集常用的几种药物与其对应基因表达关系的预测具有较好的稳健性。Daemen等[36]基于小二乘支持向量机和随机森林算法对70种乳腺癌细胞系和90种对应抗癌症药物反应的相关分子特征进行分析,最终发现治疗反应是在基因组的多个水平上进行的,将患者与基于转录亚型的治疗相匹配将提高药物应答率。
2.3形态学检验
目前检验科进行细胞形态学分析时均是以人工镜检为金标准,但是人工镜检主观因素影响大,需要专业的检验科人员进行操作,操作繁琐、耗费时间长,不适用于大规模筛查。人工智能的出现为形态学检验的困境带来了转机,人工智能辅助形态学检验的思路一般可以分为检测任务,分割任务和分类任务。检测任务一般是定位目标细胞并进行计数,分割任务一般是分割目标然后进行面积或体积的量化分析,分类任务一般是面对种类较多较复杂的形态学分析时在检测或分割的基础上对目标细胞进行进一步的形态学分析,图6中列举了几种典型的细胞形态学分析的应用。
图6人工智能辅助形态学检验
Fig.6Artificialintelligenceassistedmorphologytest
2.3.1血细胞形态学分析
血常规检查是诊断血液系统相关疾病的最基本检验项目,检验内容包括血细胞计数和血细胞形态学检查两个方面。由于血细胞形态学分析对检验人员水平要求较高且工作量大,故血细胞形态学分析是目前各级医院检验科的薄弱环节之一。血细胞形态学检查自20世纪50年代~60年代以来主要以显微镜为检测工具进行人工镜检[37],人工智能的出现推动了自动化血细胞分析仪的发展,将检验医生们从繁重的血细胞形态学镜检工作中解放出来[38]。陈畅等[39]利用显微镜从外周血图片中采集分辨率为360像素×363像素的五类白细胞单个图像作为训练数据,在深度学习框架Caffe上搭建由LetNet网络模型删减优化而得来的轻量高效新网络CCNet,该网络模型对979张5类细胞图像的最佳分类准确率达到99.69%。市面上常见的智能血细胞分析仪有希森美康XS-500i全自动血细胞分析仪和CellaVision的DM96全自动血细胞形态学分析仪等。
2.3.2染色体核型分析
染色体核型分析是根据人类染色体数目和结构异常的类型,以推断染色体异常与疾病关系的一种诊断技术。检验医生在进行核型分析前一般将细胞培养至有丝分裂中期并固定,再选取染色体分裂相完整独立,相对疏散,染色体形态适中无交联缠绕的部分进行分析。Abid等[40]对近年来自动染色体分类系统领域的突破性研究进行了全面回顾,首先回顾了特征提取的方法,然后再进行基于神经网络的染色体分类器调查。特征提取主要是基于染色体形态,条带,着丝粒位置等特征进行分析,Poletti等[41]使用从50个狭窄的骨中期细胞中提取的2287个染色体,开发了一款可以通过定位染色体着丝粒位置锁定染色体的算法。Oskouei等[42]采用了具有两层概率的神经网络用于染色体的分类,将分类过程分为两个步骤,在第一步骤中,将染色体分为6组,在第二步中,将6组的染色体分为24个类。市面上常见的染色体核型分析系统有VideoTes公司的T-Karyo染色体核型分析系统,德适生物的AutoVision染色体智能分析工作站等。
2.3.3精子质量分析
精子质量分析主要包括精子数量、精子体积、精子活跃程度,精子活跃程度又可以分为运动活跃型、非运动活跃型、完全不动型[43]。精子形态学检验时,检验医生一般将精液稀释后制成样本在显微镜下肉眼观察精子形态、密度、活动率,并且进行计数。Ghasemian等[44]开发了一套精子形态分析算法,检测和分析人体精子的不同部位,该算法在消除图像噪声的同时增强了图像的对比度,算法模型能够识别出精子的不同部分,分析每个部分的大小和形态,最后将精子分类为正常精子或者异常精子。Bijar等[45]提出了一种分割精子顶体,核和中段的算法,该算法利用自适应混合方法(AMM)和马尔可夫随机场(MRF)模型来获取和升级分类条件概率密度函数(CCPDF)以及每个像素类别的先验概率,最后达到精子分割目的。
2.3.4阴道分泌物有形成分分析
阴道分泌物有形成分分析一般是检验医生将稀释后的阴道分泌物制成样本在显微镜下用肉眼观察上皮、线索、球菌、念珠菌、杆菌、滴虫、白细胞等有形成分的形态和数量,并且根据这些指标为阴道环境清洁度分级,是诊断细菌性阴道炎(BV)、滴虫性阴道炎、混合感染型阴道炎等多种妇科疾病的重要依据[46]。胡静蓉等[47]利用人工神经网络改进的模糊识别算法对白细胞进行识别,并且基于纹理特征和几何特征利用传统算法识别上皮细胞、杆菌和球菌。目前市面上已有的阴道分泌物形态学分析仪有丽拓生物的阴道分泌物分析仪LTS—V800等。
2.3.5液基薄层细胞有形成分分析
液基薄层细胞有形成分分析主要是通过人工镜检检测宫颈是否存在细胞增生,从而判断宫颈是否病变,液基细胞检测对宫颈癌细胞的检出率为100%。郑欣等[48]提出了一种基于YOLO(YouOnlyLookOnce)模型的算法对液基薄层细胞进行识别,该算法利用700张来自不同视野下的液基薄层细胞进行训练。考虑到液基薄层细胞黏连严重,提取图像特征的基础网络过深会导致过拟合,故使用Resnet50作为基础网络,该算法模型对液基薄层细胞识别率为87%,对液基细胞团簇的识别准确率为75.9%。
2.3.6尿液有形成分分析
尿液有形成分分析一般是医生将尿液制成样本直接在显微镜下用肉眼观察红细胞、白细胞、上皮细胞、各种复杂管型以及各种结晶。尿液显微镜检查是诊断泌尿系统疾病的重要手段[49-50]。蔡立章等[51]基于BP(backpropagation)神经网络改进算法对白细胞进行识别,选用LeNet-5网络模型基于matlab平台实现网络对白细胞、红细胞、结晶的识别,然后将深度学习图像识别结果与传统算法进行比较,证明了深度学习算法的优越性。市面上常见的尿液有形成分分析仪有迈瑞的EH-2080全自动尿液有形成分分析系统等。
2.3.7粪便有形成分分析
粪便有形成分分析一般是检验医生将稀释后的粪便制成样本在显微镜下用肉眼观察红细胞、白细胞、巨噬细胞、上皮细胞、酵母菌、脂肪滴、虫卵等有形成分,粪便有形成分分析对多种肠胃病诊断有重要参考意义,如果粪便中存在虫卵基本上可以断定患者感染寄生虫。Yang等[52]提出了一种通过数字图像处理和人工神经网络从显微图像中提取粪便标本中人寄生虫卵的形态特征的算法,该算法利用了包含七个普通人类蠕虫卵的82个显微图像作为数据库。基于形状,外壳光滑度和大小的3个形态特征利用人工神经网络进行训练,算法模型正确分类率为90.3%。
2.3.8骨髓细胞形态学分析
骨髓细胞形态学分析时,检验医生一般直接在显微镜下观察骨髓刺穿术所制得的骨髓图片,低倍镜下观察骨髓增生程度,有无异常细胞,并且对巨核细胞进行计数,油镜下对有核细胞分类计数并且观察细胞形态。骨髓形态学分析可以用于多种疾病的诊断,如急性白血病、自身免疫性疾病、感染性疾病、恶性肿瘤等。骨髓细胞形态学分析与血细胞形态学分析原理一致,只是检测细胞类别和样本获取位置有所不同。
2.4检验数据处理
2.4.1辅助诊断模型
医学专家系统是医学检验领域最常见的人工智能辅助诊断模型。医学专家系统集成了大量医疗检验数据以及对应疾病症状和治疗预后,通过互联网与各个医院的不同科室紧密联系以保证医学信息的实时更新。人工智能利用这些医学信息学习各种检测数据与相关疾病的内在联系,最后得到一个可以诊断患者疾病或者给予可靠建议的算法模型,这样一个算法模型相当于一个人类医学专家。最早的医学专家系统是斯坦福大学的MYCIN系统,MYCIN可以辅助医生对血液感染病患者进行筛查并且提出可靠性治疗建议[53]。John等[54]基于贝叶斯网络,使用多层感知的人工神经网络,使用径向基函数的人工神经网络,支持向量机和专家系统分别利用入院时患者各项医学检测数据开发可以预测是否需要重新住院的智能系统,并且通过临床试验证明除向量机外,所有模型均能提供良好的重新住院预测结果。医学专家系统概念如图7所示。
图7医学专家系统
Fig.7Medicalexpertsystem
2.4.2报告自动审核
检测报告审核是检验工作中必不可少的流程,报告审核的精准和快速保证了检测工作的高效。但是人工审核检验报告不仅耗时耗力,当检验科工作人员在高强度工作后还容易出现审核失误。为解决这些问题,自动化报告审核系统的搭建刻不容缓,而人工智能的出现为自动化报告审核系统带来了新的契机。自动化报告审核系统主要依靠HIS系统(医院信息系统)和LIS系统(实验室信息系统)实现。Shih等[55]收集了569001例患者检测信息作为数据库,通过LIS建立信息传递系统并且开发了一套自动验证算法,可输出极限检查,增量检查和一致性规则检查的范围。该算法消除了测试结果验证中的个体差异,缩短了周转时间(TAT),并减少了全职等效时间(FTE),从而使医疗技术人员能够投入更多的时间和精力来处理算法锁定的测试报告。
2.4.3隐私数据保护
随着互联网医疗的兴起,医疗隐私数据的保护开始被各界关注。在医院普遍使用电子病历的当代,医学专家和计算机学者们联合起来对电子病历中的医嘱数据、诊断数据进行最大程度的开发,以补充医学知识的不足和医疗系统的缺陷。但是研究人员享受数据盛宴的同时,我们同样需要对隐私问题高度关注。胡荣磊等[56]结合数据挖掘和数据储存技术提出了一种在大数据环境下对医学隐私数据进行脱敏的隐私保护方案,该方案先设定敏感级别再利用ETL(数据仓库技术)对数据进行抽取,设计算法判别数据敏感级别,并且根据数据敏感级别的不同对数据进行不同程度的加密。
2.5云计算
大数据、云计算、人工智能、物联网等一大批新兴信息技术的出现,在医疗检验领域产生了革命性的影响,推动了医疗检验事业的创新发展。云计算平台能对分布于不同地方,不同时间以及不同检验项目的数据进行收集、存储、分析、运算和质控。云平台的大部分数据处理都在云端完成,在保证数据安全、降低数据存储成本的同时为医疗诊断提供了可靠而快捷的诊断辅助,大大降低了基层医疗机构对操作人员的要求[57]。
2.5.1诊断字典
诊断字典是一个尚不成熟但是成长前景无限的概念,柯莉等[58]以国际疾病分类(ICD)为基础,利用广州医科大学附属第三医院医学数据库建立了临床疾病诊断字典。该诊断字典收集了广州医科大学附属第三医院各个临床科室疾病和诊断策略,统一规范疾病名称,将临床诊断疾病与ICD相对应。由于人力和医学资源的限制,柯莉等人所建立的诊断字典内容是远远不够完整的,但是为我们医学检验人员更好地利用人工智能、大数据、云计算改革传统检验手段提供了一个好的思路,要想建立一个完善可靠的医学检验云计算中心,我们需要一个权威的医学标准。
2.5.2互联网医学检验
互联网医学检验常见的技术手段为第三方医学检验与即时检测(POCT),互联网医学检验以互联网为载体整合了云计算,大数据和线下医学检验数据,满足了医学检验系统对信息传送高效、诊断决策精准的要求。第三方检验实验室可以是实验室或者公司,服务对象为二级医院或者社区医院这些医学检验体系不够完善或者医学专家资源不足的级别较低医院,第三方实验室可以作为一个中转站,将低级别医院检验数据智能处理后个性化传送到特定的较高级别医院进行更专业的诊断。也可以是一个更高级的拥有丰富医学知识和医学诊断经验的医学专家系统,直接将诊断结果打印成报告传回较低级别医院[59]。即时检测是医学检验领域的一个新概念,通俗的理解是一种试剂与仪器为便携式,在不固定场所均可进行的,检测报告结果即时化的检测手段。Sarwar等[60]利用软电子技术开发了一款可以使用少量液体在柔性基板上执行电子或光学监控,并将监控数据结合蛋白质组学进行数据挖掘分析的设备。该设备基于汗液的诊断程序可以为患者提供无痛的监测,患者在自己的家中舒适地跟踪各种医疗状况。
2.5.35G技术
2019年6月6日,工信部发放了5G商用牌照,标志着中国正式进入了5G商用元年,5G具备高速率、低时延和更大用户连接能力等特点,目前我国已经建成了全世界规模最大的5G网络[61]。我国对于5G技术的应用并不仅限于通信,5G技术推动了智慧医疗的发展,让第三方实验室,即时检测等互联网检测手段变得更高效,便捷,也为医学数据庞大数据的传送和医学数据复杂计算提供了实现的可能性。通过5G技术医护人员甚至患者能够在任意地点快速与医学云计算中心通讯,而专业检验医师也能第一时间获取患者信息并完成检测报告单。
图85G技术在智能检测中应用
Fig.8Applicationof5Gtechnologyinintelligentdetection
3智能化医学检验时代展望
我国人口的显著特征是人口基数大,人口老龄化严重,然而与我国对医疗服务需求大相对应的现状却是我国的医疗卫生资源分配极度不平均,经济落后地区和贫困山区的患者体验现代医学福音的机会少之又少。人工智能所携带的一系列先进检验技术如即时检测,第三方实验室,诊断字典等的出现在为医护人员带来便利,减少检测诊断误差的同时,也打破了我国医学资源分配不平均的僵局,让偏远地区的患者也能有机会享受最先进、专业的医学检测服务。
参考文献
返回搜狐,查看更多
人工智能+医学检验=
张时民
中国医学科学院/北京协和医学院临床检验诊断学系/北京协和医院检验科
我国检验医学发展已经有近百年的历史,我们经历过手工检验的最初时代,也经历甚至见证了从半自动化分析到全自动化分析的飞速发展阶段,参与或实践了全实验室自动化和实验室信息化的新时代,下一个检验医学发展的热点和飞跃或许在人工智能(ArtificialIntelligence,AI)技术的应用,我们是否会赶上这一进程,投入到这一进程中呢?
国际临床化学委员会(IFCC)主席MaurizioFerrari先生在一篇《Howtoimaginethefutureoflaboratorymedicine》的报告中指出,未来检验医学发展会依赖电子计算机和信息技术,从电子高速路的创建和创新,到人工智能检验结果的判读,特别是自动细胞识别等新技术的应用,可在未来的检验医学发展和构建中发挥重要作用。中华医学会检验分会主任委员潘柏申教授也在第13届全国检验医学学术会议上指出,检验医学的未来发展契机包括标准化、自动化和智能化,大数据与互联网的密切结合。智能化及以人工智能作为平台,建立临床化学与免疫学、血液学及体液学检验领域的自动判断和审核,还可在细胞形态学的自动化识别,实验室物流系统,远程控制与增强现实,自动采血机器人研发与应用等方面,将有更深入的研究与发展,具有广阔的发展空间。
1 体液细胞智能化检验设备形态学识别与智能化检验设备最为广泛应用的领域,它涵盖了血液和体液的诸多样本的形态学检验内容。
在尿液有形成分分析中的应用:数字图像(digitalimaging)分析原理研发的尿液有形成分分析仪,通过数字图像成像技术提取颗粒的多种形态特征参数,建立识别模型和算法。在检测未知颗粒时,首先提取颗粒特征参数,通过神经网络与数据库已知数据进行计算和比对,判断结果,识别、显示和报告结果。此类仪器也是应用较为广泛的一种尿液形态学分析设备,国内已制定了YY/T0996-2015《尿液有形成分分析仪(数字成像自动识别)》国家医药卫生行业标准,为规范设备研发、产品质量和性能评价提供了参考方法。而许多尿液有形成分分析仪已经与尿干化学分析仪进行连接,形成尿液分析的流水线系统。
图1 尿液分析流水线系统计算机辅助精液分析系统的应用:可跟踪单个精子细胞的活动,分析精子大小和形态,可对精液中的精子密度进行定量测定,还可以对精子活力、活力分级、活动率等参数进行分析,系统检查项目至少满足WHO有关人类精子检测的基本要求,而独特的精子运动参数也是该类设备的分析亮点。
图2 精液分析系统
在粪便自动化分析中的应用: 通过对标本进行取样、制片和拍摄数字图像,最终采用图像法对粪便中的细胞、结晶、虫卵等成分进行数字化识别判断,还能对粪便的一般性状及常用的化学检查项目如潜血、转铁蛋白、钙卫蛋白进行测定,如果添加轮状病毒、腺病毒和诺如病毒抗体进行测定,则可用于腹泻疾病的筛查。粪便显微镜形态学检验已经初步开启了自动化时代和人工智能应用时代,走在世界相同检验领域的前列。
图3 粪便自动化分析仪
在阴道分泌物和宫颈细胞学检验中的应用:仪器将标本处理后注入特定的分析检测板内,通过数字图像系统对标本中出现的有形成分进行数字拍摄和智能识别,从而达到对细胞、霉菌、滴虫等常见成分进行筛查检测。在宫颈细胞学涂片检验的人工智能辅助筛查方面也有一定进展,例如可分析细胞涂片中是否存在病变细胞,可以筛除阴性细胞涂片样本,再将疑似阳性的涂片提交医生再次审核判断,可帮助医生节省大约90%以上的阅片时间,提高诊断效率。
图4 阴道分泌物自动分析设备
2 血细胞分析的智能化目前我们所熟识的某品牌数字血细胞分析设备已经在血涂片和体液涂片细胞识别方面已经取得了一定的成功,国内也有类似的产品在研发和应用。设备的分析程序为在已染色的血涂片上,先用10倍物镜头扫描血片的单细胞层并定位白细胞,再转换为50倍特殊油镜头扫描确定单层红细胞层,进行红细胞形态分析和血小板数量评估,继续转换为100倍油镜头后扫描分析定位的白细胞,对白细胞进行分类及异常有核细胞识别与初筛。设备可对红细胞形态进行分类处理,将红细胞划分为血红蛋白含量(颜色)异常、内含物异常、大小不同异常和形态不同异常等数十种形态;白细胞可给出正常白细胞分类,还可进行外周血的异常细胞初筛、原始幼稚细胞初筛、血小板聚集、有核红细胞识别等。仪器还可以完成对脑脊液,浆膜腔积液、肺泡灌洗液等样本的分析,目前已经可以连接到血细胞分析仪的流水线系统中,使血常规计数结果与形态学检测或复检成为一体,甚至可以实施通过网络进行形态学图像远程会诊。
图5 血涂片形态学自动阅片系统与血细胞分析仪流水线的密切配合另一款新型血细胞分析系统是以数字化、形态学和人工智能原理进行细胞分析的检测系统,它需要30 μL全血通过喷涂制备血涂片,后进行染色,再行拍摄及数字化细胞,最后进行数字化细胞分类、计数、计算与鉴别等步骤,即可完成血常规中CBC+Diff+Ret的所有检测数据。这种仪器不再采用传统的物理、化学、荧光等染色技术、也不需要鞘流技术,甚至不需要复杂的液体试剂。他它既可给出细胞数量,也能给出细胞的形态学报告和分析结果,其血涂片标本可以保留更长的时间以便回顾性分析和研究,具有独特的优势。
图6数字图像分析原理的血细胞分析系统
图7根据数字图像进行形态学报告审核
3 人工智能在微生物检验领域的应用目前已经有了用于分枝杆菌检验的显微扫描拍摄系统,该系统采用人工智能的检测算法来扫描荧光涂片的高分辨率数字影像,自动对其中的怀疑荧光体进行评分,从而根据国际防痨与肺疾病联合会标准,判断每个视野和涂片的阳阴性,和总体抗酸杆菌密度状态等,智能化的筛检出分枝杆菌,最结果应由有经验的检验者审核确认。仪器可对大量阴性标本和视野筛检过滤,加快了检测速度,降低了劳动强度。
图8 分枝杆菌显微镜扫描分析系统
据了解,全球首个微生物质谱云中心已在中国建立。该项目经过3万株菌的蛋白质组生物信息分析,开创了非线性相似性度量的人工智能算法,建立了超过370属2200种7900株的微生物蛋白指纹图谱数据库及全球首个微生物质谱云中心,实现了2200种微生物在培养后5 min内快速鉴定的飞行时间质谱系统。目前该数据库已经拓展至8100株,临床验证数量超过15万株。该成果已在包括北京协和医院在内的40余家医院及科研单位开展应用并获得一致好评。这也是在微生物检验领域应用互联网、大数据、云计算及人工智能技术所获得的一项重要成果。
4 人工智能在染色体分析中的应用对制备好的染色体涂片进行扫描拍摄,再通过图像采集模块采集一定数量的染色体核型图,进行数字处理和优化后,通过染色体核型分析系统进行分析。智能化的软件可对人体46条染色体图像进行自动分割,包括将交叉、粘连、重叠的染色体进行自动或手工辅助分割,将相同标号的染色体汇集配对。系统可识别染色体数量、畸变、染色体数目增多/减少和三倍体等突变,对染色体结构畸变,染色体缺失、易位、倒位、插入、重复等常见异常也可初步识别判断。
图9 染色体分析设备 5 检验结果自动审核与智能化自动审核是人工智能与检验医学的完美结合,是分析后检验程序标准化、自动化、智能化的飞跃,如今已受到越来越多临床实验室的关注,已经有了一些在临床生化和免疫学检验,血液学检验等领域的应用实践。在强大的LIS和HIS系统支持下,经过精心设定的自动审核系统,集中了检验工作者和临床医师的智慧,将绝大部分能够通过审核的样本进行自动审核,触犯规则的则不通过审核,改由人工审核。随着医疗水平与检验自动化程度的不断提升,医学检验已进入前所未有的大数据应用时代。临床检验报告自动审核专家系统可有效提高检验报告的准确性,大大提升检验报告审核的速度。由北京协和医院检验科牵头的《临床实验室定量检验结果的自动审核程序建立与验证》国家行业标准正在审核中。
图10北京协和医院LIS系统中审核报告界面上通过审核与不通过审核的屏幕界面
6 自动采血机器人一种称为Veebot的自动采血机器人已经在美国出现,国内也有厂家处于研发之中。患者将手臂伸进拱体中,充气的袖套会收缩,将手臂固定住,压缩血流,让血管更容易显现,机器人用红外线相机探测照射手肘内侧,配合超声波与机器视觉技术定位静脉位置,自动分析所拍摄的影像,检查血管构造与内部血液流量,找出最适合采血的血管和位置后,机器人会校准针头,选择最佳角度,迅速将针头穿刺进入血管,通过真空采血管的负压抽取足够量的血液标本,整个流程约1 min。采血机器人主要应用了智能交互技术、智能生物识别技术,以及智能导航控制技术,变人工凭经验盲目穿刺为精准可视化穿刺,实现了自动化、标准化、精准化,把医护人员从高频、高难、高危的工作中解脱出来。
图11 自动采血机器人
7 人工智能在标本自动传输物流系统中的应用标本的自动传输在许多医院已经成为现实,检验科实验室可以通过轨道或气动管道传输系统、智能化的物流管理系统,从医院各个病区、门诊或急诊、采血窗口迅速、及时获取标本。最快的气动管道传输系统,传输速度可达600m/min。临床医师也可以通过HIS及时了解采血时间、送检时间、检验科接收时间、检测时间、签发时间等信息。在一些医院还有了实验室自动送检运输机器人,它会按预定的路线将窗口接收的标本运送到不同的工作区或不同的操作工位,未来将会有无人机将标本跨建筑、跨楼层送检。智能化的标本自动传输物流系统也是现代化医院所必不可少的配置。
图12 高速气动管道物流系统
8 人工智能技术在检验医学中的应用设想与展望在2017年全国“两会”上,国务院总理李克强发表了政府工作报告,指出要加快培育壮大包括人工智能在内的新兴产业,“人工智能”也首次被写入了政府工作报告。在这个“互联网+”的时代,人工智能、大数据、云计算、物联网技术不断渗入医疗领域和大健康领域,笔者认为,一个医院的现代化不仅仅体现在医疗技术能力强、设备先进、管理有效这个层面上,还应体现在信息化和智能化应用方面。笔者从用户的角度对人工智能在医院检验科中的应用做了以下设想。
1. 自动化质量控制运行程序及智能化判断:这些辅助设备和程序应该配合自动化分析设备联合使用,实现自动化运行、判断、存储数据、靶值累积、提示报警等功能。
2. 人工智能辅助诊断:自动报告审核系统能够将患者治疗方案(特别是化疗和放射治疗)、药物影响因素、标本采集条件、检验项目的不确定度等结果的发展变化与患者具体诊断治疗情况结合进行大数据的综合分析,并给出其发展变化趋势及预后等信息。还可提供该项目在疾病诊断中的敏感性和特异性,及相关检验检查的追加选择建议等。
3. 个体化检验诊断提示:对个体化的检验结果进行分析,对相关的各种影响因素进行判断与鉴别,结合大数据对个体检验数据的变化提供干预预警和报警等。建立个体化检验指标的参考区间,随时观察个体检验指标的变化趋势。
4.大数据与临床研究: 与临床结合,与多种检验、检查数据结合,进行大数据研究与分析,可以发现某些检验数据与疾病的发生、发展、诊断和变化之间的联系。通过大数据分析可以深度挖掘研究数据,可能获得意想不到的结果。
5.继续提高形态学人工智能设备识别能力,不断提高智能化设备对各种标本的形态学识别能力和正确鉴别能力,继续扩大数字图像数据库,改进算法,增加特征参数,深入学习训练,添加特殊染色,添加其他辅助专业技术等,进行不断改进与提升。而骨髓检查也许是形态学检验中最难以完成的任务,是否可以配合流式细胞术、特殊染色分析、组化分析、基因分析、遗传学检查等多种技术的综合智能分析,给出更科学的诊断报告。
9 结束语医学检验在计算机技术和“互联网+”时代,在人工智能、大数据、云计算、云存储、物联网等技术不断与医疗、大健康行业互相渗透的环境下,以大数据为基础的人工智能模型的建立,将对疾病防控、癌症筛查、病种分布、遗传图谱、基因检测、人体数据分析等带来有价值的发现和应用。在精准医疗愈发受到重视的今天,这些都成为了其中不可缺少的要素,这是实现人工智能应用的重要体现和方向,或许也是未来人工智能+检验医学要走的方向。
张时民
(中国医学科学院/北京协和医学院临床检验诊断学系/北京协和医院检验科)
北京协和医学院临床检验诊断学系血液体液教研室组长,北京协和医院检验科副主任技师;中国医学装备协会检验医学分会细胞形态学自动化分析学组副组长。主要从事临床基础检验工作、教学与科研,同时对检验仪器分析自动化、智能化等有一定研究。发表文章60余篇,主编专著12部。