人工智能医学影像诊断的原理和应用
卷积层
卷积是两个数组(可由矩阵转换为数组)的运算,一个数组由图像中某个位置的输入值(如像素值)组成,另一个是滤波器(或核)。计算输入与滤波器的点积得到一个输出。按一定的步长将滤波器移到图像中的下一个位置,重复上面计算过程,直到覆盖整个图像,生成特征(或激活)映射。
线性整流单元层
线性整流单元(RELU,RectifiedLinearUnit)层是一个将负输入值设置为零的激活函数,即当输入值x小于0时,输出f(x)为0;当输入值x大于等于0时,f(x)=x。RELU简化、加速了计算与训练,并且有助于避免消失梯度问题。其它一些激活函数还有sigmoid、tanh、leakyRELU,等等。
池化层
池化层的作用是减少参数数量以及图像的大小(宽度和高度,但不是深度)。最大池化是常用的方法,“最大”是指获取最大的输入值而丢弃其它值。其它池化还有平均池化等。
全连接层
“全连接”是将前一层中的每个神经元都连接到全连接层中的每个神经元。可以有一个或多个完全连接的层。这一层的任务是计算出分类中各种可能类别的概率,最终实现分类。
基于深度学习的影像分析示意图如图2所示,其基本结构是将多个卷积层、激活层和池化层堆叠起来。在空间维进行压缩,并根据学习到的特征映射数量进行扩展之后,所有特征被映射到全连接层上,由最后一个全连接层的激活函数给出分类概率,最后输出分类结果。
图2基于深度学习的医学图像分析示意图
3训练与学习要让机器能根据医学影像/图像自动给出疾病的判断结果,首先必须要对机器进行训练与学习。
训练
训练是建立一个输入—输出关系的过程。用已知的数据(样本)及其结论(标签)作为输入,让机器在知道输入数据及其应该获得的正确结论的前提下,调整内部参数,从而通过这些参数“记住”输入数据与正确结论之间的关系。可见,“训练”其实就是“教导”机器的过程。经过训练后,机器便建立起了反映输入与输出关系的一种“模型”。这种“模型”类似于函数关系,以后输入新的数据,通过模型的计算,就可以获得结论(输出结果)。
学习
学习是遵循某种规则(学习算法)调整神经网络内部参数的过程。机器学习可分为三类:监督学习、无监督学习和强化学习。在当前的研究中,大部分医学影像诊断是采用监督学习。它的基本原理是:计算输出结果,并与应有的正确结论(标签)进行比较,计算出误差,依据此误差去调整神经网络中各神经元之间的连接系数(即权值Wij),然后又根据新的输出计算误差,再调整Wij。重复上述过程,直到完成全部训练数据。如图3所示。
图3图监督学习示意图
4典型例子近几年,深度学习在医学影像分析中的研究获得了显著进展,限于篇幅,下面给出三个研究例子。
皮肤癌诊断
2017年,斯坦福大学A.Esteva等人在《Nature》发表了利用深度神经网络实现皮肤癌诊断的论文(“Dermatologist-LevelClassificationofSkinCancerWithDeepNeuralNetworks,”Nature,vol.542,no.7639,p.115,2017)。皮肤癌的诊断一般是先临床筛查,然后有可能再做皮肤镜分析、活检和组织病理学检查。该文阐述了使用深度卷积神经网络进行的皮肤病变分类。该系统使用的是预先在ImageNet数据集上训练的GoogleInceptionv3CNN架构,并在自己的数据集(包含2,032种不同疾病的129,450张临床病变图像)上使用像素和标签输入进行训练微调,如图4所示。757个训练分类,其由皮肤病新分类法和将疾病映射到训练分类的划分算法来定义。最后的推理分类要笼统一些,由一个或多个训练分类组成(例如,恶性黑色素细胞病变——黑色素瘤类)。推理分类的概率是根据分类结构对训练分类的概率进行求和。系统性能的测试使用经活检证实的临床图像,其测试性能与21位经过认证的皮肤科医生进行对比。使用两个关键的二元分类:角质形成细胞癌与良性脂溢性角化病、恶性黑色素瘤与普通的痣。第一个二元分类代表对最常见癌症的识别,第二个则代表对最致命皮肤癌的识别。结果表明,CNN在这两项任务中都取得了与所有专家同等的性能,其能力水平堪比皮肤科医生,从而展示了人工智能在皮肤癌诊断中的前景。
图4深度卷积神经网络架构(采用GoogleInceptionv3)
间质性肺病诊断
瑞士伯尔尼大学MariosAnthimopoulos等人于2016年发表了利用深度CNN实现间质性肺疾病诊断的论文(LungPatternClassificationforInterstitialLungDiseasesUsingaDeepConvolutionalNeuralNetwork,IEEETransactionsonMedicalImaging,Vol.35,No.5,May2016)。间质性肺病(ILD)是以弥漫性肺实质、肺泡炎症和间质纤维化为病理基本病变。伯尔尼大学的论文提出并评价了一种用于ILD模式分类的卷积神经网络(CNN),如图5所示。该网络由5个卷积层,核为2×2,激活函数是LeakyReLU,采用平均池化,全连接层最后一层的激活函数是softmax,给出7个分类的概率分布。7个输出对应的分类是:健康、毛玻璃不透明度(GGO)、微结节、实变、网状、蜂窝和GGO/网状的组合。训练和评估的数据集包含14696个图像。这是一个针对特定问题设计的深度CNN。在一个具有挑战性的数据集中,对比分析证明了有效性。该系统旨在为ILDs提供鉴别诊断,作为放射科医生的辅助工具。
图5肺模式分类的CNN结构
乳腺癌诊断
美国德克萨斯大学埃尔帕索分校WenqingSun等人关于深度CNN用于乳腺外诊断的论文(Enhancingdeepconvolutionalneuralnetworkschemeforbreastcancerdiagnosiswithunlabeleddata,ComputMedImagingGraph,2016),给出了一个基于图的半监督学习(SSL)方案,使用深度CNN诊断乳腺癌。CNN通常需要大量的标记数据进行训练和参数微调,而该方案只需要训练集中的一小部分标签数据,其余大量数据为无标签数据。诊断系统包括四个模块:数据加权、特征选择、分割协同训练数据标注和CNN,如图6所示。该研究使用3158个感兴趣区域(ROIs),每个感兴趣区域包含从1874对乳房X线照片中提取的肿块,其中的100个ROIs作为标签数据,其余的作为无标签数据,实验结果表明该方案的准确度为0.8243。对于混合数据与采用同样数量的有标签数据相比,后者方案的精度较前者高3.75%。不过,混合数据方案(SSL)的优点是可以利用无标签数据提高准确度,这在缺乏大量标签数据时是很有意义的。
图6乳腺癌诊断用的CNN结构
5结束语用人工智能实现医学影像智能分析,关键还是神经网络的训练和学习。训练的效果与数据密切相关。一是需要用大量的数据“教导”机器,对于医学影像诊断而言,即需要大量的病例影像。尤其是监督学习,需要很大的有标签数据。二是数据的正确性,即原始数据与结论(标签)的正确关系,显然,如果使用错误的数据,训练后得出的模型就可能导致错误。
许多用于医学影像分析的公共数据集已经开始出现,而且还会有更多的公共数据集出现,这将为人工智能机器学习提供极大的数据支持。然而,数据是过去的,对于一些突发的新型疾病,比如新病毒传染病,由于初期缺乏足够的有标签数据,对于机器学习是一个很大的挑战,而学习算法的进步则是应对这一挑战的关键。
------
本文原载"临菲信息技术港"公众号,可在临菲信息技术港免费下载PDF文档。返回搜狐,查看更多
智能音箱及其工作原理介绍
智能音箱是一种内置智能语音助手和互联网连接的音箱,它可以接受语音命令并执行相应的任务,例如播放音乐、回答问题、控制家庭设备等。智能音箱技术的发展已经使得人们可以通过语音指令来轻松地实现各种操作,大大提高了人们的生活质量。
一、智能音箱的工作原理
智能音箱的工作原理主要包括三个步骤:收集声音、解析命令、执行任务。
收集声音
智能音箱通常都配备了内置麦克风,这些麦克风可以收集声音并将其发送到智能音箱的处理器中进行处理。处理过程包括对声音进行降噪、增强和识别等处理,以便更好地理解用户的语音命令。
解析命令
智能音箱的处理器可以通过内置的语音识别算法识别用户的语音命令,并将其转化为文本格式。然后,处理器会将识别出的文本命令与内置的数据库中的命令进行匹配,以确定用户想要执行的任务。这个过程通常涉及到自然语言处理技术,以便更好地理解用户的意图。
执行任务
一旦处理器确定了用户想要执行的任务,它会通过内置的语音输出设备(例如内置扬声器或蓝牙音箱)输出声音,以响应用户的需求。同时,智能音箱还可以通过连接互联网来实现更多的功能,例如播放互联网广播、查询天气、播放音乐等。
二、智能音箱的技术实现
智能音箱的技术实现主要包括以下几个方面:语音识别技术、自然语言处理技术、互联网连接技术等。
语音识别技术
语音识别技术是智能音箱技术实现的核心。它是指将语音信号转换为文本格式,以便更好地理解用户的意图。语音识别技术包括预处理、特征提取、文本转换等步骤。预处理包括对声音进行降噪、增强等处理,以减少噪音对语音识别的影响。特征提取是指从预处理后的声音中提取特征,以区分不同的语音命令。文本转换是指将特征转换为文本格式,以便更好地理解用户的意图。
自然语言处理技术
自然语言处理技术是智能音箱技术实现的另一个关键方面。它是指将文本格式的命令转化为计算机可以理解的形式,以便更好地执行任务。自然语言处理技术包括分词、词性标注、句法分析等步骤。分词是指将文本命令分成单词或词语,以便更好地理解用户的意图。词性标注是指对每个单词进行词性标注,以便更好地理解用户的意图。句法分析是指对文本命令进行语法分析,以便更好地执行任务。
互联网连接技术
智能音箱还需要连接到互联网来获取信息、播放音乐等。互联网连接技术包括Wi-Fi、蓝牙、LTE等。其中Wi-Fi是最常用的互联网连接方式,它可以提供较快的网络速度和较远的覆盖范围。蓝牙是一种用于连接设备之间的无线通信技术,它可以用于传输音频信号和与其他设备进行交互。LTE是一种用于移动通信的技术,它可以用于提供高速数据传输和语音通信。
三、智能音箱的应用场景
智能音箱的应用场景非常广泛,包括家庭、办公室、汽车等。在家庭中,智能音箱可以用来播放音乐、控制家庭设备、回答问题等。在办公室中,智能音箱可以用来播放会议内容、控制会议室设备等。在汽车中,智能音箱可以用来播放音乐、提供导航信息等。
四、智能音箱的优缺点
智能音箱的优点包括:使用方便、可以语音控制、可以实现多种功能、可以连接其他设备等。缺点包括:可能被窃听、可能被黑客攻击、可能泄露个人信息等。因此,在使用智能音箱时需要注意安全问题,采取相应的安全措施。
总之,智能音箱是一种非常实用的设备,它可以为人们的生活带来很多便利和乐趣。随着技术的不断进步和应用场景的不断扩展,智能音箱的发展前景非常广阔。