人工智能在卒中方面的应用
背景
脑卒中的诊断及治疗高度依赖于来源于影像学研究方面的信息。CT(non-contrastcomputedtomography,CT)和MRI(magneticresonanceimaging,MRI)均可用于区分缺血性卒中和出血性卒中,不过仅基于临床特征这二者很难区分。CT低密度扫描和MRI的DWI高强度扫描可以识别不可逆的损伤组织,但在急性情况下MRI的敏感性更高。血管造影和灌注成像序列可以识别大血管闭塞,并可以选择给予患者进行血管内治疗。FLAIR-DWI不匹配提供了未知起病时间患者的信息(包括觉醒型卒中)。目前的方法旨在了解成功的再灌注或持续的大血管闭塞的短期后果。关于卒中成像的一个重要警告是,必须迅速完成,因为更及时的治疗会给患者带来更好的预后。卒中影像分诊途径中的大多数步骤都需要放射科和神经科医生的协助,而这一步通常是时间紧迫的。而且这些步骤所需的专门知识可能并非在所有地点或时间都可用。因此人们开始感兴趣如何在卒中成像评估中应用自动化方法。
人工智能(AI)是一个宽泛的术语,它反映了使用计算机通过精确定位来执行人类可能感到困难的任务。例如,人类虽然觉得高级计算很困难,但计算器技术并不被认为是人工智能,因为我们理解并知道如何将其分解为离散的步骤。然而,人脸识别是人类擅长的一项任务,但识别人脸的算法通常被视为人工智能,因为我们无法准确地表达这是如何完成的。机器学习(ML)是人工智能的一个子集,算法无需显式编程就可以从数据本身学习。ML方法反映了广泛的统计技术,从线性回归到更复杂的方法,如支持向量机和决策树。ML方法可以进一步分为监督学习和非监督学习,两者的不同之处在于前者需要获得黄金标准标签,而后者试图从数据本身寻找隐含的答案。虽然机器学习方法近年来变得越来越流行,但在过去的十年里,一种基于类似于人类神经网络架构的特定监督机器学习方法的出现,导致了性能的巨大飞跃,这种方法被称为深度学习(DL),因为它有多个内层,可以被认为是一种革命性的技术。与以往需要人类识别图像特征的方法相比,在已知输出数据集上训练的深度神经网络可以学习到组织数据的最佳特征。在这篇综述中,我们将讨论用于脑卒中成像的ML方法,重点是DL的应用。
关键词:人工智能 深度学习出血缺血机器学习
一、从线性阈值到深度学习
早期的图像分析方法依赖于将固定的阈值应用于定量图来预测感兴趣的信息,如随访时的梗死组织数量或出血性转化的位置。虽然实施简单,但应用阈值可能会由于患者队列、扫描异质性以及后处理差异而失败。更重要的是,就组织结果而言,潜在的假设通常在生理学上过于简单。这取决于许多因素,可能反映在其他成像序列或模式上。由于这种复杂性,为最好地代表整体治疗潜力和指导管理,需要灵活地结合不同种类的影像学和临床特征。
基于图像的算法性能的差异是由于图像特征的选择和如何结合它们的空间关系信息的方法。最近,其他的ML方法已经被提出,它们超越了回归的限制,是将它们组合起来,这种技术称为线性或逻辑回归。预测一个连续的变量,如梗死面积,可使用线性回归。如果目的是将患者分为二进制结果,如良好的临床结局(即改良Rankin量表评分≤2分),则可以采用逻辑回归。DL方法的真正变革之处在于,它们不需要先验假设什么图像特征是重要的,相反,网络学会了隐性地识别它们。使用DL,特征被自动识别并编码到隐藏层的网络中,从而大大减少了实现时间。关于DL方法的一个重要一点是,它们在访问大量数据时不断改进,而传统的ML方法尽管访问相同的数据,但往往趋于稳定在较低的性能水平上。ML方法的具体选择仍然是一门艺术,而不是一门科学,虽然通常的DL可以很好地处理大量数据,而经典的ML方法对于较小的数据集有优势。认识到DL仍处于早期阶段是很重要的,而且它的性能并不总是超过涉及手工选择特性的经典方法。
二、AI提高图像质量和速度
脑卒中成像对病人分诊至关重要,但人们担心脑扫描有关的时间延误。因此,有人反对使用先进的成像技术,如CT灌注成像或MRI,它们比非对比CT和CT血管造影术需要更长的获取和处理时间。大多数MRI卒中方案需要不到10分钟的扫描时间,不过MRI确实比CT需要更详细的筛查和病人转移时间。因此考虑到DWI的高组织对比度及其对组织极有可能不可逆损伤的特异性,减少MRI扫描时间仍然是非常重要而且是可取的。
人工智能启发的方法可以提高医学图像的质量,能更快或更小剂量获取图像。特别是基于深度卷积神经网络(CNNs)的重构算法非常适合这一任务。一个与急性卒中成像相关的例子是使用CNN去噪的能力,使用动脉自旋标记MR脑灌注图像,用更短的扫描创建诊断图像。这种方法也被应用于其他的MR序列,包括定量易感图谱,可以检测脑出血和钙化。考虑到MR造影剂给药后钆沉积的问题,一种能够显著减少诊断成像所需钆量的人工智能方法可以应用于大剂量灌注加权成像。鉴于现代多探测器CT扫描仪的速度,很难显著缩短采集时间,CNN减少辐射剂量就可能有助于减轻与CT灌注成像相关的辐射问题,这是一个相对高剂量的程序。
人们还可以绕过传统的标准生物标志物的计算,例如从源CT或MR灌注图像计算脑血流和容积。这是一个容易出错的过程,有许多步骤,包括识别动脉输入函数和噪声敏感的计算步骤,其中示踪动力学标记提取基于动态组织增强和动脉供应。其生成的灌注图用于预测梗塞(核心)和高危组织。然而,有了人工智能,这种预测也可以直接从灌注源图像本身进行。在一项对44例患者的研究中,CNN比包括脑血流量、血容量和Tmax在内的灌注标志物的线性组合表现更好。
三、预测当前信息
(一)、发病时间
DWI和FLAIR病变之间的不匹配被认为是判断卒中是否超过3到4小时的放射学指标。如果病变在DWI上可见而FLAIR上不可见,则认为卒中发生的时间较近。在实践中,在视觉上检测DWI-FLAIR的不匹配是具有挑战性的。首先,使用一种基于神经网络的自动编码器技术来识别MR源灌注图像的特征。在第二步中,使用不同的监督学习算法(支持向量机和逐步回归)将这些特征与DWI和FLAIR图像相结合。在105例中风患者中,报告了一个高达0.68的曲线下面积(AUC)来将患者分为症状出现前/后4.5小时。另一组使用类似的方法,包括多模态MRI对患者进行6小时前/6小时后的分类,使用逻辑回归显示出相同的效果。
(二)、自动化方面得分
阿尔伯塔卒中项目早期CT评分是一种总分10分的大脑中动脉卒中分级,用于对患者进行治疗和纳入临床试验。一个名为aspects的软件包已被证明不逊于人类专家,其非劣效要求设置为10%。一项患者(具有已存在病理包括脑白质病变、梗死和非典型实质缺陷)随访研究中,自动化方法与人工评估(0.77–0.80)相比表现出较低的性能,准确性为0.67。
(三)、识别LVOs
利用手工制作的特征,一些使用自动管道的研究已经成功地从CTA图像中识别前循环的LVOs;例如,有患者显示出95%的敏感性和79%的特异性。据CNN报道这可能是用于检测颅内大血管闭塞。结果表明,在650人的研究中,敏感性为82%,特异性为94%。在实践中,这已被证明可以为高级医生提供早期警报,有助于其确定任务的优先级。
(四)、短期组织细分:核心/危险组织的识别
关于急性缺血性病变的自动识别和病变演变已经有大量的工作报道。在急性卒中研究中,两种值得确认的重要组织类型是不可逆损伤组织(核心病变)和缺血半暗带(危险组织)。由于这些病变有一个生理上的而不是成像的定义,所以建立一个参考来训练和验证自动化方法是具有挑战性的。
人工识别CT灌注下的核心病变难度较大,MR手工勾画核心及高危组织可作为AI算法的目标。训练这种网络的一种方法是在时间接近的情况下获得成对的CT和MRI。这是2018年缺血性卒中病变分割(ISLES)挑战的任务,其中表现最好的算法使用了3D神经网络架构,获得0.56的Dice分。训练(63例)和验证(40例)的数据来自症状发作后8小时内就诊且在CT灌注后3小时内获得MRDWI的患者。
四、预测短期成像生物标志物
灌注-扩散失配可以被认为是一个非常简单的二分式预测模型。该模型假设,如果再通,预期结果与急性核心病变一致。若不能再通,预期的梗死也将包括以前的危险组织。从生理和ML的角度来看,基于急性成像直接预测短期组织结果可能是更好的方法。短期成像结果通常由亚急性DWI或T2-FLAIR所识别的病变来确定。
MR和CT均已被报道使用逻辑回归简单组合急性成像方法。一项对14名患者在发病12小时内进行扫描的MR研究中,显示发病后至少5天观察到的最终梗死灶可预测为84%的特异性和66%的敏感性。CT显示在一项基于发病后
6大人工智能应用关键技术,终于有人讲明白了
导读:我国《人工智能标准化白皮书(2018年)》中也给出了人工智能的定义:“人工智能是利用数字计算机或者由数字计算机控制的机器,模拟、延伸和扩展人类的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。”
人工智能的核心思想在于构造智能的人工系统。人工智能是一项知识工程,利用机器模仿人类完成一系列的动作。根据是否能够实现理解、思考、推理、解决问题等高级行为。
在未来,人工智能应用主要会体现如下几大核心技术特点。
作者:达观数据
来源:大数据DT(ID:hzdashuju)
01机器人流程自动化(RoboticProcessAutomation,RPA)
RPA(RoboticProcessAutomation,机器人流程自动化)的定义:通过特定的、可模拟人类在计算机界面上进行操作的技术,按规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作。
与大家通常所认为的具备机械实体的“机器人”不同,RPA本质上是一种能按特定指令完成工作的软件,这种软件安装在个人计算机或大型服务器上,通过模拟键盘、鼠标等人工操作来实现办公操作的自动化。
▲图1-1RPA是未来办公创新和发展的趋势
RPA也被形象地称为数字化劳动力(DigitalLabor),是因为其综合运用了大数据、人工智能、云计算等技术,通过操纵用户图形界面(GUI)中的元素,模拟并增强人与计算机的交互过程,从而能够辅助执行以往只有人类才能完成的工作,或者作为人类高强度工作的劳动力补充。
自2015年以来,人工智能技术和RPA在同一时间大幅度发展和进步,恰好相辅相成,汇合在了一起。自然而然地,RPA和AI两者的结合运用,带来了一股非常独特的智能化应用的发展潮流,我们称之为智能RPA技术,或者IPA技术(IntelligentProcessingAutomation),即智能流程自动化技术(如图1-2所示)。
▲图1-2智能RPA的构成:RPA+AI=IPA
换句话说就是,RPA是基础,需要与其他技术手段整合在一起,方能实现IPA及其优势。
商业社会对流程自动化的功能的期望将与日俱增,将机器学习等AI技术运用到RPA中,将人工智能功能集成到产品套件中,以提供更多类型的自动化功能,已经成为未来RPA发展的主流趋势。
02光学字符识别(OpticalCharacterRecognition,OCR)
OCR技术是指利用电子设备(例如扫描仪或数码相机)将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。通俗地说就是,对文本资料进行扫描,然后对图像文件进行分析处理,以获取文字及版面信息的技术。
OCR技术一般可分为如图3-1所示的5个阶段。
▲图3-1OCR技术的5个阶段
下面具体说明OCR的识别流程。
1.图像处理
针对图像的成像问题进行修正。常见的图像预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。
2.文字检测
检测文本所在位置、范围及其布局,通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字,文字的范围有多大。
文字检测采用的处理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。
3.文字识别
在文本检测的基础上,对文本内容进行识别,将图像中的文本信息转化为计算机可识别和处理的文本信息。文字识别主要解决的问题是每个文字是什么。
文字识别常采用的处理算法包括:CRNN、AttentionOCR、RNNLM、BERT。
4.文本抽取
从文字识别结果中抽取出需要的字段或要素。
文本抽取常采用的处理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。
5.输出
输出最终的文字识别结果或者文本抽取结果。
03机器学习/大数据分析
机器学习/大数据分析是一种用于设计复杂模型和算法并以此实现预测功能的方法,即计算机有能力去学习,而不是依靠预先编写的代码。它能够基于对现有结构化数据的观察,自行识别结构化数据中的模型,并以此来输出对未来结果的预测。
机器学习是一种通过“监督”和“无监督”学习来识别结构化数据中的模式(例如日常性能数据)的算法。监督算法是指在根据自己的输入做出预测之前,会从输入和输出的结构化数据集来进行学习。无监督算法是指观察结构化数据,并对已识别的模式提供相关见解。
机器学习和高级分析可能会改变保险公司的游戏规则,例如,在提高合规性、降低成本结构,以及从新的见解中获得竞争优势。高级分析已经在领先的人力资源部门中得到了广泛应用,主要用于确定和评估领导者和管理者的核心品质,以便更好地预测行为、规划职业发展道路和下一任领导岗位归属。
04自然语言生成(NaturalLanguageGeneration,NLG)
计算机具有与人一样的表达能力和写作能力,它遵循某种规则,将从数据中观察到的信息转换成高质量的自然语言文本。例如,自动识别会议邮件中的主题、数字地名、人名地址并生成行程表备忘录,或者识别出合同条款的关键内容并将摘要的重点生成列表。
关于自然语言生成及自然语言处理的详细介绍,请阅读《详解自然语言处理5大语义分析技术及14类应用(建议收藏)》
05智能工作流(SmartWorkflow)
智能工作流是一种用于流程管理的软件工具,其中集成了由人和机器共同执行的工作,允许用户实时启动和跟踪端到端流程的状态,以便于管理不同组之间的切换,包括机器人与人类用户之间的切换,同时还能提供瓶颈阶段的统计数据。
随着社会和科技的不断进步,各个领域都开始逐步朝着自动化、智能化的方向快速发展。工作流相关技术的研究也越来越受重视,并广泛地应用于制造业、软件开发、银行金融、生物医学等不同领域。
工作流不但能够自动化地处理相关的活动和任务,减少人机交互处理过程中带来的潜在错误,而且能够精确化每一个处理步骤,最大化地提高生成效率,并且将工作流应用到动态、可变且灵活的应用场景当中。
近年来,在大数据、人工智能的背景下,工作流中的业务流程日趋复杂,所面临的环境和数据也日趋复杂,由需求分析引起的业务过程重新建模或由维护升级引起的过程模式变更和改进也变得越来越频繁。
在这种动态多变的复杂环境下,如何快速识别出任务,然后快速高效并有针对性地处理工作流问题,已成为目前工作流任务研究的关键问题。
RPA软件机器人在工作过程中,也会遇到很多类似的情况。工作流的复杂多变,会导致RPA作业流程的复杂多变,使其无法做到自适应,这将会大大影响RPA软件机器人的作业效率。
因此,需要通过智能工作流的技术,实现动态地调整RPA里的任务设定,以及RPA业务流程的自动变更和自动升级,在智能工作流的指导下实现自适应作业模式。
实现智能工作流的方法有很多,比如,美国J.H.Holland教授提出的基于遗传算法的工作流调度,PandeyS等提出的基于粒子群优化算法的启发式算法(PSO)可用于不同资源的智能调度。除此之外,还有很多基于自然界和仿生学的智能算法,比如,混合蛙跳算法、布谷鸟搜索算法、蝙蝠算法、人工蜂群算法等。
目前比较常见的方法是实现一种基于智能规划的工作流处理模式,该模式不再是单纯地将不同的活动当作对彼此没有影响的单独事件,而是有针对性地考虑多个事件的共同影响。
该模式充分考虑了工作流和智能规划之间的相似之处,通过智能规划推导出不同工作流任务之间的内在逻辑关系,并从其他的渠道和外部信息中充分挖掘潜在的关系。
逐步改进传统工作流中的问题,使用全新的智能规划的手段,从表面动作中挖掘出潜在的信息,过滤噪声数据,进而实现流程的自动修正,最后,通过前面得出的结论,有针对性地修改之前的RPA作业流程,实现自适应性的作业模式和作业过程。
06认知智能体(CognitiveAgent)
认知智能体是一种结合了机器学习和自然语言生成的技术,并在此基础上加入情感检测功能以做出判断和分析,使其能够执行任务,交流沟通,从数据集中学习,甚至根据情感检测结果作出决策。换句话说,机器会像人一样产生“情感共鸣、精神共振”,真正成为一个完全虚拟的劳动力(或者智能体)。
在客服领域,英国某汽车保险公司通过使用认知智能体技术,将客户转化率提高了22%,验证错误率降低了40%,整体投资回报率达到了330%。
当然,德勤、安永等咨询公司也坦然表示,就现阶段许多企业的流程管理与系统的基础能力来看,仍存在着大量的基础建设工作有待开展。而打造智能流程自动化所需的部分核心技术(例如认知智能体等)也还停留在雏形阶段。
智能包含三个方面,分别是计算智能、感知智能和认知智能。
在计算智能方面,计算机的速度早已远远超过人工的效率。
在感知智能方面,随着OCR、NLP等技术的发展,目前也已经能够实现很多的效果。
但是在认知智能方面,即使在某些特定领域,自然语言的处理也已经可以得到比人工更好的成绩,但是在某些领域,特别是知识理解、知识推理、知识判断等方面,还有很多需要逐步积累、逐步完善的地方。
按照机器能否产生自我认知和机器人的适用范围,人工智能分为弱人工智能和强人工智能,其中弱人工智能里的机器没有自我意识,不具备真正的推理和独立解决问题的能力,通常只适用于解决特定条件下的某种问题。当前人工智能的研究主要在弱人工智能领域。
而在强人工智能方面,机器具有一定的自我意识,能够通过学习拓展功能。对于当前不具备的功能或者当前不了解的知识,能通过自行学习获得。
当前条件下,全面的强人工智能还面临技术能力、社会伦理等多方面的挑战,但是在某些领域的特定场景下,具备认知智能能力和学习能力的人工智能软件,不仅能够优化作业流程、快速响应、覆盖更多不同的情况,同时还能够最大限度地避免技术风险和应用风险,是一个非常有价值的研究方向。
认知智能有很多种定义,其中,复旦大学肖仰华教授曾经提到过,所谓让机器具备认知智能是指让机器能够像人一样思考,而这种思考能力具体体现在如下几个方面。
第一,机器具备能够理解数据、理解语言进而理解现实世界的能力。
第二,机器具备能够解释数据、解释过程进而解释现象的能力。
第三,机器具备推理、规划等一系列人类所独有的认知能力,也就是说认知智能需要解决推理、规划、联想、创作等一系列复杂任务。
智能体是指驻留在某一环境下,能够持续自主地发挥作用,具备驻留性、反应性、社会性、主动性特征的计算实体。根据著名人工智能学者,美国斯坦福大学Hayes-Roth教授的理论“智能体能够持续执行三项功能:感知环境中的动态条件、执行动作影响环境、进行推理以解释感知信息、求解问题和决定动作”。
从前面的定义我们可以看出,认知智能体能够感知到环境中的动态条件,然后根据这些条件执行相应的动作来影响现有的环境,同时其还能够用推理来解释感知信息,求解相关问题,决定后续动作。
将认知智能体与RPA相结合,我们能够得到一个具备认知智能的机器人,它可以根据所涉及的应用系统和其他环境的变化动态感知下一步需要做的事情,同时执行相应的动作来影响对应的环境信息,实现智能录入、智能监控、智能文档处理和辅助判定。
与此同时,认知智能体通过RPA技术在处理业务的同时,还能够学习到相关的经验和知识,逐步掌握识别重点的能力。
认知智能体的研究包含了多种不同的方法,近年来,随着分布式人工智能、信息科学和网络科学的不断发展,面向动态环境下的分布式协同决策已经成为认知智能体的一个重要的研究方式。这种方式在以多无人机系统、多机器人系统为代表的典型无中心式多智能体系统中得到了广泛的应用。
与此同时,受限于自身设计,智能体对所在环境和系统常呈现出信息的部分可观测特征,而有限的智能体之间的交互和外部的约束也使得获得全局信息需要付出极高的代价。
同时,无中心式的多智能体系统在应用中呈现出了与社会网络相类似的自组结构和相应的复杂网络特征,即网络中单个智能体通常仅能连接/交互所在局部网络中的小部分智能体,传统的集中式协同模型则不再适用。
此外,类似于社会网络中人与人之间的有限信息交换便可大大提升个体的决策效率,同样的方法能否应用到相应的研究当中,也处于不断的尝试过程中。
关于作者:达观数据,中国智能RPA领域的龙头企业,独立开发了全套“RPA+AI”系统,拥有核心知识产权。达观智能RPA产品是业界不依赖微软底层开发框架、未使用第三方开源框架的RPA产品。
本文摘编自《智能RPA实战》,经出版方授权发布。
延伸阅读《智能RPA实战》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:这是一部从实战角度讲解“AI+RPA”如何为企业数字化转型赋能的著作,从基础知识、平台构成、相关技术、建设指南、项目实施、落地方法论、案例分析、发展趋势8个维度对智能RPA做了系统解读,为企业认知和实践智能RPA提供全面指导。
划重点????
干货直达????
西安交大送大一新生这本书,你读过吗?12本有趣有料的科普书盘点
终于有人把AI、BI、大数据、数据科学讲明白了
监督学习、非监督学习、强化学习都是什么?终于有人讲明白了
一条SQL引发的“血案”:与SQL优化相关的4个案例
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作
大数据 | 云计算 | 数据库 | Python | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都完成了这个神操作
????