人工智能在医疗领域有哪些重要意义
当你在社区医院注射疫苗时,顺便用几秒钟的时间拍了张眼底照片,几秒钟以内人工智能便可以告诉你是否有患上了白内障或者其他慢性病,甚至可以准确预测儿童何时会近视。这样如同科幻电影中的设备,如今却发生在现实当中。
在2018年CMEF中国国际医疗器械(春季)博览会上,小编采访到了医疗领域人工智能领军企业Airdoc公司市场部副总裁张京雷先生。共同探讨人工智能对于目前医疗行业的影响,以及对我们普通人生活带来哪些意义。
医疗科技逐渐走向成熟
目前,一个好的医疗服务价格非常昂贵。而据张京雷介绍,Airdoc的愿景便是希望能用人工智能优化医疗服务,以一种相对低廉的价格让广大患者更快速地享受到更优质的医疗服务,使更多人从中受益。
目前医疗科技行业在蓬勃发展,许多企业也都涉足到这个领域之中。就在上周,美国FDA给做眼底视网膜病变观察的公司IDx颁发了许可证,这从侧面证明了当前世界上的医疗科技技术已经相对成熟。
当今国内的医疗科技水平在很多方面都领先于国外,而这次美国FDA批准认证的技术只不过是国内医疗科技领域前两年的技术水平,当然这并不是说国外没有更新的技术,而是说明我国的医疗科技已经在很多方面已经达到了世界领先水准。
张京雷表示,这其中有深层次的原因,首先是中国具有人口优势,因此在数据收集上可以十分丰富和全面,而这一点在其他国家难以达到;其次,我们对于人工智能有着强烈的需求,比如在三线及三线以下城市医生与一线城市医生有着极大的差距,而人工智能在这方面能够极大的弥补这些差距,因此AI有着非常大的应用前景;最后,我们不光要有好的医院以及医疗团队,还有非常良好的投融资环境,才能给相关企业的发展创造更好的土壤。
人工智能将对医疗带来极大帮助
当谈到目前医疗科技领域有哪些具体进展时,张京雷表示,第一是技术的进步,比如在眼科、皮肤科、癌症早期病症的发现等已经有临床验证;第二则是政府部门的监管,预计在今年将会有几家医疗科技企业能够拿到CFDA 药监局的认证,这代表着国家对于国内医疗科技行业的认可。
张京雷认为,“人工智能技术将来的一个突破口是在院外,并且功能一定是筛查,通过人工智能技术把慢性病或者无症状的疾病及时找出,当然院外的模式还有很多需要继续探索的地方,包括技术本身、市场及商业模式等。”
目前Airdoc主要的产品是在通过眼底拍照的慢性病筛查,而这种方式也是当前最成熟并且可以很快应用到临床的技术。通过观察眼底上面血管及神经的变化,可以从中分析得出高血压、糖尿病及动脉硬化等慢性病的情况,也可以把这些数据收集起来在后台进行分析对比,能够更准确的进行慢性病的判断、辅助诊断和长期管理。
眼底数据为何成为研究的重点
至于为何选择以眼底作为技术的主要研究方向,张京雷表示,首先慢性病完全可以通过眼底进行直接的观察,这就可以通过筛查进行早期诊断,第二是慢性病的发病率高居不下,严重影像患者生活质量也给医保造成巨大财政负担。
还有就是技术上说眼底数据相对来说比较容易取得——眼底照相机可以在院外使用,大规模眼底筛查的成本可以控制在几元钱以内,并且在伦理上没有任何问题,只要是三周岁以上的儿童到老年人,所有人都可以接受眼底拍照。
最后在许多慢性病的筛查和早期诊断方面,通过眼底能够快速的察觉,比如许多致盲性眼底疾病,可能在很长时间没有任何明显症状。但是当症状出现的时候,基本上已经错过了最佳的治疗时机。通过拍摄眼底,可以根据血管的变化能够在早期就察觉出相关疾病,比如糖尿病在没有任何症状表露之前,通过观察到眼底血管的膨胀变形,较早的确诊,可以进行及时的治疗。
多模数据分析帮助准确判断病症
如何能够准确判断这些病症,这需要运用到多模数据分析(MRT),张京雷接着介绍道。举个例子,在心血管科,每个病人的病例中都有许多数据,这些数据数量甚至多达上百组,对于一般医生而言,只能通过个别组的数据来判断病人的病情,如心脑血管、心脏病等疾病,这些病症通过化验的指标只是简单的几组数据,但是通过人工智能算法,可以同时对几十组甚至上百组数据进行详细的分析揭示疾病的内在规律,找到更好的诊疗方法,这是人类自身的能力所达不到的。
并且当数据足够多时,也可以通过查找这些数据之间的关联,找到一些疾病与关键因素之间的关系。比如可以通过多模态分析可以判断病人的发病与饮食、生活习惯、基因等直接关联性有多少,这对于疾病的攻克与治疗有非常积极的意义。
并且多模数据分析可以把医院中繁多的纸质病历全部数字化、结构化,极大的节省了医生的时间及精力,可以让他们更专注于本职工作。
未来医疗人工智能的潜力应用
张京雷还表示,医疗人工智能目前在两个领域中的潜力比较大,并且他也相信未来会证明这一点。第一便是医疗影像分析,由于影像本身就是结构化的,比如眼底照片;再一个如CT或磁共振等,也是同样的道理,没有人为因素干扰,可以通过人工智能进行快速、准确的分析;其次是医疗大数据,可以把非结构化变成结构化的数据,通过分析大量的病历资料找出更好的治疗方案,更好地管理疾病,目前也有许多公司在进行相关的研究。
未来,Airdoc的技术开发会从眼底扩展到全眼科。张京雷表示,AI可以用于儿童近视的预防,通过人工智能可以帮助父母监测和预测小朋友近视的发展变化,将来这种预测可以精确到近视最可能在哪个星期发生。全眼科之后则是全身的人工智能,这也是未来医疗人工智能的方向。
目前对于数据的安全性也是一个讨论的重点,对于医疗科技行业来说就更是重中之重,因为获取的数据都是非常敏感的病患数据。对于数据的防护,张京雷表示,Airdoc所有上传的数据都是通过加密保护的,其次在上传与保存的过程中,这些数据都要严格脱敏,也就是数据与病人的个人信息完全分离,这也是整个医疗行业的惯例。
并且为了这些医疗数据的存储和使用,Airdoc参与了国家科技部监管之下的STI医疗眼科大数据平台。在政府的严格监管下,上面所有脱敏数据都是可以共享进行科研,对于今后的人工智能技术发展还有临床实践都有相当的积极意义。
人工智能将更好的辅助医疗诊断
最后说到人工智能将来的服务对象时,张京雷解释道,Airdoc主要面向的服务对象其实还是医生——人工智能主要的功能是辅助医生对于病症进行诊断,但无法代替医生做出诊断。举个例子,目前已知的皮肤病超过2,000种,这就需要大量相对独立的算法合作来分析相关病症;而且许多皮肤病外观基本一致,因此医生需要额外询问患者其他情况才能够确诊,这对目前的人工智能技术还是个挑战。
当然未来的人工智能技术可能通过深度学习实现更多的功能,但是目前而言还有许多制约因素,包括法律上的制约——比如当人工智能诊断失误的时候,谁来承担法律责任等。因此很长的一段时间来看,人工智能都将是医生的一个辅助工具,无法取代医生。
未来人工智能最大的作用是解决医生大量简单重复性的工作,提高医生的工作效率,让医生真正发挥他们的智慧和能力。人工智能与医疗这对搭档,将会颠覆今后的医疗环境,这值得我们所有人期待。
基于人工智能的生物信息学研究:机遇和挑战
2021年12月26日,中国计算机学会青年计算机科技论坛(CCFYOCSEF)武汉分论坛举办线下技术论坛(论坛编号:CCF-YO-21-WH-5FT)。本次论坛以“基于人工智能的生物信息学研究:机遇和挑战”为主题,邀请了陕西师范大学、西北工业大学、邵阳学院、华中农业大学、中国地质大学(武汉)、的专家和学者作为论坛嘉宾进行发言和思辨点讨论。本次论坛由YOCSEF武汉AC、华中农业大学教授章文,YOCSEF武汉AC、华中农业大学讲师刘世超共同担任执行主席;YOCSEF武汉AC、湖北大学副教授肖奎,YOCSEF武汉通讯AC、江汉大学讲师刘哲共同担任线上执行主席;华中农业大学为本次论坛提供了支持。本期技术论坛,邀约生物信息学领域相关的专家学者,针对“基于人工智能的生物信息学研究:机遇和挑战”进行主题讨论,分析生物信息学领域面临的主要挑战,探讨人工智能技术应用在生物信息学领域中存在的若干重要问题,探索生物信息学人才培养的痛点与解决之道,把握生物信息学领域未来发展的潜在机遇。
“基于人工智能的生物信息学研究:机遇和挑战”技术论坛
论坛的引导发言环节邀请了3位嘉宾,分别是:陕西师范大学教授雷秀娟、西北工业大学教授施建宇以及邵阳学院教授黄国华。作为中国人工智能学会生物信息与人工生命专委会常务委员,雷秀娟教授带来了题为“基于人工智能的多组学数据与疾病的关联关系预测”的引导发言。雷秀娟教授首先介绍了生物信息学在多组学和疾病方面的研究应用,主要是通过多组学模型来预测疾病,所有的组学信息之间都是有相互联系的。雷教授团队整理制作了多组学与疾病的关联数据库CircR2Disease数据库V2。目前生物信息学研究的热门包括挖掘出生物学实体之间的关系之后,找出疾病靶标。网络特征学习可以采用一些通用的深度学习方法。相似性网络的构建方面,包括相似性计算差用的方法有疾病语义相似性、序列相似性、基因关联相似性等。网络特征提取方法常用的包括表示学习、图神经网络等。评价方法可采用常用的机器学习评价方法,包括混淆矩阵、ROC曲线等。损失函数方面常用Sigmoid、ReLU、LeakyReLU等。CircRNA与RBP结合位点的研究,是利用生物信息学的方法准确解析分子之间的调控机制对探索人类疾病的机理。雷教授团队在生物信息学方面取得了诸多研究成果:提出了CSCRsites方法、circRB方法、CRPBsites方法。CircRNA与疾病的关联关系预测的研究方面,提出了RWRKNN方法、CDWBMS方法、PDC-PGWNNM方法、EDNMF方法、AANE&SAE方法、PCD_MVMF方法、GATCDA方法。代谢物与疾病的关联关系预测的研究方面,提出了SSABCMDA方法、LGBMMDA方法、MDAGCN方法、DWRF方法。微生物与疾病的关联关系预测的研究方面,提出了LGRSH方法、HNGFL方法、MDHN方法。
基于人工智能的多组学数据与疾病的关联关系预测
随后,施建宇教授作为中国计算机学会生物信息学专业委员会等3个国家一级学会的专业委员会委员,结合生物信息学研究的经验与心得,进行了题为“Compound-ProteinInteractionPredictionbyDeepLearning:Databases,DescriptorsandModels”(通过深度学习预测复合蛋白质相互作用:数据库、描述符和模型)的引导发言。施建宇教授分析了当前药物开发的大体趋势,即药物开发是个大工程,大致需要三个“十”:十年成本、十亿美元、十亿销售额。对于如此复杂庞大的工程和研发,需要跨专业科研人员的合作。靶点识别主要由生物学家来完成,而计算机科学家主要专注于化合物分析、化学结构分析、物理特性分析等。目前,AI可以帮助和加速药物研究,传统药物研究中小分子筛选需要11个月的流程,利用AI辅助可以减少至23天。药物化合物的研究中,预测某个化合物会不会和蛋白质进行相互作用。深度学习方法可以很好地帮助CPI(Compound-proteinInteraction)的研究,其本质不在于分类能力,而在于深度学习的神经网络对化合物的结构化序列的刻画能力。化合物描述子的构建需要很强的领域知识,包括1D序列分析、3D结构分析等,而卷积神经网络所具备的强力的数据特征刻画能力,可以很好地帮助化合物描述子的构建。可采用的深度学习模型包括诸多经典的卷积神经网络结构、Attention-based模型、Bindingcomplex-based模型等。对于未来的研究趋势,施建宇教授认为下列问题都非常值得深入研究:(1)如何利用生物信息学领域中大量的未标定数据;(2)如何利用大量现有的序列数据,将其迁移到3D结构的研究中;(3)如何利用深度学习模型进行单细胞测序,等等。
Compound-ProteinInteractionPredictionbyDeepLearning:Databases,DescriptorsandModels
作为最后一位引导发言嘉宾,黄国华教授进行了题为“RNA序列的语义性及其在修饰中的应用”的引导发言。黄教授首先介绍了生物信息学研究的起源,生物信息学的研究可以追溯到1953年在Nature上发表的DNA双螺旋结构论文。DNA测序是DNA研究中的重要主题之一。全球目前大约有1700个DNA序列数据库,其中代表性的数据库包括INSD、库、EMBL库、BioSino库等等。DNA序列分析主要关注DNA序列比对,分析DNA的同源性。计算生物学的一个重要主题就是比较序列并尝试找出两个序列的公共部分。序列比对包括全局比对、局部比对、双重序列比对、多重序列比对等。其优点是通过计算找到同源分子片段,确定其功能;缺点包括计算开销大、对于没有同源性的序列不可使用、完全是形式决定内容而没有解决一词多义的问题、忽略了个体之间的联系。自然语言处理技术所解决的问题与DNA序列对比问题的本质非常相近,因此采用NLP技术解决DNA序列对比问题具有如下优点:(1)捕捉句子的抽象语义关系;(2)能够全面解释句子含义;(3)内容决定形式。在生物信息学领域中常用的人工智能技术和神经网络结构包括word2vec、CNN、LSTM、Attention、Transformer。语义性在RNA序列中的重要应用包括蛋白质翻译修饰PTM(Post-translationalmodifications),即通过调控修饰位点来改善或治疗疾病。对于PTM问题,黄教授团队提出了LSTMCNNsucc模型结构。对于RNA修饰问题,黄教授团队利用CNNLSTM结构实现了RNA序列的特征提取。
RNA序列的语义性及其在修饰中的应用
在思辨环节,参与论坛的所有专家和老师就以下三个议题进行了激烈的探讨:(1)从支持向量机到深度学习,人工智能的发展是否加速了生物信息学问题的解决?(2)聚焦“四个面向”战略部署,人工智能是否带来了生物信息学研究的新范式?(3)人工智能时代,生物信息学研究需要什么样的人才?这三个问题也是目前生物信息学领域需要面对和解决的问题。
对于“从支持向量机到深度学习,人工智能的发展是否加速了生物信息学问题的解决?”这个问题的思辨,专家和老师们讨论了下列子问题:1.1深度学习是否已经取代了传统的人工智能技术?1.2人工智能的哪些关键技术是未来研究的明日之星?
华中农业大学冯在文副教授认为,深度学习技术确实已经在很大成程度上取代了传统的机器学习技术,但传统的机器学习技术也不能被完全抛弃。目前深度学习技术提出了大量的新模型,但是目前还存在一些问题,例如可解释性、数据样本量的限制、技术落地应用遇到的困难。其中,具有代表性的问题如下:(1)传统的机器学习技术可能精度不如深度学习,但是可解释性优于深度学习模型。(2)深度学习需要大量的样本数据,但是在很多应用领域,例如生物信息学领域,样本量(3)特别是标注后的样本量还非常受限。因此,对于生物信息学领域中的很多实际应用问题,例如生物大数据问题,还是依赖于传统的优化方法和搜索算法。
中国地质大学(武汉)唐厂教授认为,对于深度学习是否取代传统的机器学习方法的问题,要考虑具体的研究和应用领域。深度学习效果好的前提是要有充足的算力和充足的训练样本。但是实际工程应用中,很多终端的计算能力非常有限,因而实际应用场景中仍旧采用传统的机器学习方法,依旧可以取得不错的应用效果。生物信息学中的关联关系研究,最终需要靠临床医生去验证,因此深度学习不可完全取代传统的机器学习和数据分析方法。深度学习在某些领域和场景可以获得比机器学习方法更好的效果,但是不能一概而论地说深度学习完全取代了机器学习。
华中农业大学章文教授认为,目前生物医学领域的很多研究者仍旧倾向于传统的机器学习模型,因为深度学习的模型得到的结果难以设计医学实验进行验证。
武汉理工大学李琳教授表示,人工智能NLP领域中目前常采用基于大规模数据样本预训练得到的模型。那么对于生物信息学领域的问题,是否也可以采用预训练模型来获得更好的效果?对于多种类型的数据组合问题,已有的联合表示学习等技术是否可以应用在多组学的研究上?此外,在NLP领域,目前的研究发展趋势是依赖预训练模型抽取的大规模样本的先验知识,然后让下游任务贴合上游得到的特征抽取结果。那么生物信息学是否也可以采用类似的机制?
思辨问题1:从支持向量机到深度学习,人工智能的发展是否加速了生物信息学问题的解决?
在“聚焦’四个面向’战略部署,人工智能是否带来了生物信息学研究的新范式?”的问题上,来自不同领域和方向的专家、老师们也各抒己见,讨论了下列子问题:2.1在哪些重大问题上已经取得了突破?2.2在哪些重大问题上还有待破冰?
施建宇教授认为AI技术在生物信息学领域的应用尚存在如下问题:(1)医疗影像方面,积累了大量的图像数据,可以直接应用人工智能技术辅助诊断工作。但是目前的问题是缺乏统一、权威的评价标准。(2)对于蛋白质的结构预测有个很大的突破。很多蛋白质测定不了结构,因为很多蛋白是膜蛋白,而球蛋白容易测定结构。因此,对于膜蛋白的测定是个非常有前景的研究方向。(3)药物研究的样本数量很有限,例如6000左右的样本数据,如何更好地将深度学习技术应用到小数据样本问题上是个值得研究的问题。(4)深度学习的相关技术,例如Python语言、Pytorch框架等都是国外开发研究的,国内的相关基础技术的研究较为缺乏,需要进一步研究和发展。
黄国华教授则表示,人工智能技术可以用在新型的功能分子的研究上,例如是否可以设计一些类似的功能分子,以促进合成生物的研究和发展。
思辨问题2:聚焦”四个面向”战略部署,人工智能是否带来了生物信息学研究的新范式?
在“人工智能时代,生物信息学研究需要什么样的人才?”的问题上,专家和老师们分析和讨论了如下子问题:3.1从事基于人工智能的生物信息学研究,应该具备哪些基本的知识?3.2生物背景的人才和计算机背景人才,未来谁更有优势?
雷秀娟教授认为,计算机和生物人才的优势不能一概而论,还是需要看具体的领域和问题。目前的研究需要的是高度复合型的人才,需要生物、化学、计算机、信息学等多领域多学科交叉的专业知识。雷教授目前团队中的学生以计算机专业背景为主。
施建宇教授表示,一般来说生物学背景的学生完全不懂数学和计算机,而计算机背景的学生则表示看不太明白生物方面的问题。本身生物信息学就是生物加上信息学,因此需要学生掌握生物学和信息学的基础知识,同时也要掌握最新的人工智能模型和技术。生物学背景的学生只能使用已有的方法来跑数据,对算法和模型本身难以进行研究;而计算机和信息学背景的学生对于实验结果的分析相对欠缺,对数据结果的敏感性不够。因此,学生都应该具备挖掘深层机制的驱动意识。生物和计算机人才都是有优势的,只是侧重点不同。
黄国华教授课题组里面主要是计算机背景的学生,没有生物学背景的学生。计算机学生倾向于写代码写程序,但是对于实验结果的生物学意义缺乏认识和理解,因而计算机学生对于较为复杂的建模感到吃力。因此,计算机学生和生物学学生一起合作、相互互补,才能得到更好的研究成效。
冯在文副教授提到,在2021年国家基金委的研究指南中,生物信息学的大方向是生物大数据的标准化、可视化是一个重要的研究方向,特别是生物大数据的标准化方面。因此,需要形成一个更好的协作机制,方便计算机学生和生物学学生进行讨论、分析、合作。
唐厂教授认为,计算机专业背景强调的是技术和方法,生物学专业背景强调的是机制和原理。只有计算机专业学生更好地理解了生物学的原理和机制之后,才能把技术和方法更好地应用到具体的生物信息学领域的研究中。
李琳教授表示,生物信息学的学生培养方案中加入更多的计算机相关课程,或许能得到更好的人才培养成效,生物信息学的发展主要还是依赖于生物学人才。
武汉科技大学胡威教授表示,生物信息学的培养体系中是否进行了学科交叉的课程设置?如果生物信息学的人才培养体系本身就缺乏计算机的相关课程和知识,是否应该加入相关交叉性的课程?章文教授则回答道,目前华中农业大学生物信息学专业的学生培养体系的课程中,一部分课程跟生命科学专业交叉,而另一部分则涵盖了一些编程相关的课程。即使是在生命科学专业,也是非常欢迎生物信息学学生这样的复合型人才的。
思辨问题3:人工智能时代,生物信息学研究需要什么样的人才?
与会人员合影
本次论坛历时三个小时,通过引导发言、论坛思辨,辨明了生物信息学领域在人工智能时代遇到的新问题和困惑,分析生物信息学领域面临的主要挑战,探讨人工智能技术应用在生物信息学领域中存在的若干重要问题,探索生物信息学人才培养的痛点与解决之道,将更好地推动人工智能深度学习技术在生物信息学领域中的深入应用。
人工智能的十大应用(无人驾驶丨人脸识别丨医学图像处理)
导读:人工智能已经逐渐走进我们的生活,并应用于各个领域,它不仅给许多行业带来了巨大的经济效益,也为我们的生活带来了许多改变和便利。下面,我们将分别介绍人工智能的一些主要应用场景。这篇文章,希望对你职业生涯选择会有帮助。
如果你想学习入门人工智能AI,可以来我建的人工智能学习群:[672948930],群里有我整理的一份关于pytorch、python基础,图像处理opencv自然语言处理、机器学习、数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生都非常实用,无任何套路免费提供!还可以扫码加VX领取人工智能200G学习资料大礼包哦!
01无人驾驶汽车
无人驾驶汽车是智能汽车的一种,也称为轮式移动机器人,主要依靠车内以计算机系统为主的智能驾驶控制器来实现无人驾驶。无人驾驶中涉及的技术包含多个方面,例如计算机视觉、自动控制技术等。
美国、英国、德国等发达国家从20世纪70年代开始就投入到无人驾驶汽车的研究中,中国从20世纪80年代起也开始了无人驾驶汽车的研究。
2005年,一辆名为Stanley的无人驾驶汽车以平均40km/h的速度跑完了美国莫哈维沙漠中的野外地形赛道,用时6小时53分58秒,完成了约282千米的驾驶里程。
Stanley是由一辆大众途锐汽车经过改装而来的,由大众汽车技术研究部、大众汽车集团下属的电子研究工作实验室及斯坦福大学一起合作完成,其外部装有摄像头、雷达、激光测距仪等装置来感应周边环境,内部装有自动驾驶控制系统来完成指挥、导航、制动和加速等操作。
2006年,卡内基梅隆大学又研发了无人驾驶汽车Boss,Boss能够按照交通规则安全地驾驶通过附近有空军基地的街道,并且会避让其他车辆和行人。
近年来,伴随着人工智能浪潮的兴起,无人驾驶成为人们热议的话题,国内外许多公司都纷纷投入到自动驾驶和无人驾驶的研究中。例如,Google的GoogleX实验室正在积极研发无人驾驶汽车GoogleDriverlessCar,百度也已启动了“百度无人驾驶汽车”研发计划,其自主研发的无人驾驶汽车Apollo还曾亮相2018年央视春晚。
但是最近两年,发现无人驾驶的复杂程度远超几年前所预期的,要真正实现商业化还有很长的路要走。
02人脸识别人脸识别也称人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别涉及的技术主要包括计算机视觉、图像处理等。
人脸识别系统的研究始于20世纪60年代,之后,随着计算机技术和光学成像技术的发展,人脸识别技术水平在20世纪80年代得到不断提高。在20世纪90年代后期,人脸识别技术进入初级应用阶段。目前,人脸识别技术已广泛应用于多个领域,如金融、司法、公安、边检、航天、电力、教育、医疗等。
有一个关于人脸识别技术应用的有趣案例:张学友获封“逃犯克星”,因为警方利用人脸识别技术在其演唱会上多次抓到了在逃人员。
2018年4月7日,张学友南昌演唱会开始后,看台上一名粉丝便被警方带离现场。实际上,他是一名逃犯,安保人员通过人像识别系统锁定了在看台上的他;
2018年5月20日,张学友嘉兴演唱会上,犯罪嫌疑人于某在通过安检门时被人脸识别系统识别出是逃犯,随后被警方抓获。随着人脸识别技术的进一步成熟和社会认同度的提高,其将应用在更多领域,给人们的生活带来更多改变。
03机器翻译机器翻译是计算语言学的一个分支,是利用计算机将一种自然语言转换为另一种自然语言的过程。机器翻译用到的技术主要是神经机器翻译技术(NeuralMachineTranslation,NMT),该技术当前在很多语言上的表现已经超过人类。
随着经济全球化进程的加快及互联网的迅速发展,机器翻译技术在促进政治、经济、文化交流等方面的价值凸显,也给人们的生活带来了许多便利。例如我们在阅读英文文献时,可以方便地通过有道翻译、Google翻译等网站将英文转换为中文,免去了查字典的麻烦,提高了学习和工作的效率。
04声纹识别生物特征识别技术包括很多种,除了人脸识别,目前用得比较多的有声纹识别。声纹识别是一种生物鉴权技术,也称为说话人识别,包括说话人辨认和说话人确认。
声纹识别的工作过程为,系统采集说话人的声纹信息并将其录入数据库,当说话人再次说话时,系统会采集这段声纹信息并自动与数据库中已有的声纹信息做对比,从而识别出说话人的身份。
相比于传统的身份识别方法(如钥匙、证件),声纹识别具有抗遗忘、可远程的鉴权特点,在现有算法优化和随机密码的技术手段下,声纹也能有效防录音、防合成,因此安全性高、响应迅速且识别精准。
同时,相较于人脸识别、虹膜识别等生物特征识别技术,声纹识别技术具有可通过电话信道、网络信道等方式采集用户的声纹特征的特点,因此其在远程身份确认上极具优势。
目前,声纹识别技术有声纹核身、声纹锁和黑名单声纹库等多项应用案例,可广泛应用于金融、安防、智能家居等领域,落地场景丰富。
05智能客服机器人智能客服机器人是一种利用机器模拟人类行为的人工智能实体形态,它能够实现语音识别和自然语义理解,具有业务推理、话术应答等能力。
当用户访问网站并发出会话时,智能客服机器人会根据系统获取的访客地址、IP和访问路径等,快速分析用户意图,回复用户的真实需求。同时,智能客服机器人拥有海量的行业背景知识库,能对用户咨询的常规问题进行标准回复,提高应答准确率。
智能客服机器人广泛应用于商业服务与营销场景,为客户解决问题、提供决策依据。同时,智能客服机器人在应答过程中,可以结合丰富的对话语料进行自适应训练,因此,其在应答话术上将变得越来越精确。
随着智能客服机器人的垂直发展,它已经可以深入解决很多企业的细分场景下的问题。比如电商企业面临的售前咨询问题,对大多数电商企业来说,用户所咨询的售前问题普遍围绕价格、优惠、货品来源渠道等主题,传统的人工客服每天都会对这几类重复性的问题进行回答,导致无法及时为存在更多复杂问题的客户群体提供服务。
而智能客服机器人可以针对用户的各类简单、重复性高的问题进行解答,还能为用户提供全天候的咨询应答、解决问题的服务,它的广泛应用也大大降低了企业的人工客服成本。
06智能外呼机器人智能外呼机器人是人工智能在语音识别方面的典型应用,它能够自动发起电话外呼,以语音合成的自然人声形式,主动向用户群体介绍产品。
在外呼期间,它可以利用语音识别和自然语言处理技术获取客户意图,而后采用针对性话术与用户进行多轮交互会话,最后对用户进行目标分类,并自动记录每通电话的关键点,以成功完成外呼工作。
从2018年年初开始,智能外呼机器人呈现出喷井式兴起状态,它能够在互动过程中不带有情绪波动,并且自动完成应答、分类、记录和追踪,助力企业完成一些烦琐、重复和耗时的操作,从而解放人工,减少大量的人力成本和重复劳动力,让员工着力于目标客群,进而创造更高的商业价值。当然智能外呼机器人也带来了另一面,即会对用户造成频繁的打扰。
基于维护用户的合法权益,促进语音呼叫服务端健康发展,2020年8月31日国家工信部下发了《通信短信息和语音呼叫服务管理规定(征求意见稿)》,意味着未来的外呼服务,无论人工还是人工智能,都需要持证上岗,而且还要在监管的监视下进行,这也对智能外呼机器人的用户体验和服务质量提出了更高的要求。
07智能音箱智能音箱是语音识别、自然语言处理等人工智能技术的电子产品类应用与载体,随着智能音箱的迅猛发展,其也被视为智能家居的未来入口。究其本质,智能音箱就是能完成对话环节的拥有语音交互能力的机器。通过与它直接对话,家庭消费者能够完成自助点歌、控制家居设备和唤起生活服务等操作。
支撑智能音箱交互功能的前置基础主要包括将人声转换成文本的自动语音识别(AutomaticSpeechRecognition,ASR)技术,对文字进行词性、句法、语义等分析的自然语言处理(NaturalLanguageProcessing,NLP)技术,以及将文字转换成自然语音流的语音合成技术(TextToSpeech,TTS)技术。
在人工智能技术的加持下,智能音箱也逐渐以更自然的语音交互方式创造出更多家庭场景下的应用。
08个性化推荐个性化推荐是一种基于聚类与协同过滤技术的人工智能应用,它建立在海量数据挖掘的基础上,通过分析用户的历史行为建立推荐模型,主动给用户提供匹配他们的需求与兴趣的信息,如商品推荐、新闻推荐等。
个性化推荐既可以为用户快速定位需求产品,弱化用户被动消费意识,提升用户兴致和留存黏性,又可以帮助商家快速引流,找准用户群体与定位,做好产品营销。
个性化推荐系统广泛存在于各类网站和App中,本质上,它会根据用户的浏览信息、用户基本信息和对物品或内容的偏好程度等多因素进行考量,依托推荐引擎算法进行指标分类,将与用户目标因素一致的信息内容进行聚类,经过协同过滤算法,实现精确的个性化推荐。
09医学图像处理医学图像处理是目前人工智能在医疗领域的典型应用,它的处理对象是由各种不同成像机理,如在临床医学中广泛使用的核磁共振成像、超声成像等生成的医学影像。
传统的医学影像诊断,主要通过观察二维切片图去发现病变体,这往往需要依靠医生的经验来判断。而利用计算机图像处理技术,可以对医学影像进行图像分割、特征提取、定量分析和对比分析等工作,进而完成病灶识别与标注,针对肿瘤放疗环节的影像的靶区自动勾画,以及手术环节的三维影像重建。
该应用可以辅助医生对病变体及其他目标区域进行定性甚至定量分析,从而大大提高医疗诊断的准确性和可靠性。另外,医学图像处理在医疗教学、手术规划、手术仿真、各类医学研究、医学二维影像重建中也起到重要的辅助作用。
10图像搜索图像搜索是近几年用户需求日益旺盛的信息检索类应用,分为基于文本的和基于内容的两类搜索方式。传统的图像搜索只识别图像本身的颜色、纹理等要素,基于深度学习的图像搜索还会计入人脸、姿态、地理位置和字符等语义特征,针对海量数据进行多维度的分析与匹配。
该技术的应用与发展,不仅是为了满足当下用户利用图像匹配搜索以顺利查找到相同或相似目标物的需求,更是为了通过分析用户的需求与行为,如搜索同款、相似物比对等,确保企业的产品迭代和服务升级在后续工作中更加聚焦。
如果你想学习入门人工智能AI,可以来我建的人工智能学习群:[672948930],群里有我整理的一份关于pytorch、python基础,图像处理opencv自然语言处理、机器学习、数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生都非常实用,无任何套路免费提供!还可以扫码加VX领取人工智能200G学习资料大礼包哦!
人工智能医学影像诊断的原理和应用
卷积层
卷积是两个数组(可由矩阵转换为数组)的运算,一个数组由图像中某个位置的输入值(如像素值)组成,另一个是滤波器(或核)。计算输入与滤波器的点积得到一个输出。按一定的步长将滤波器移到图像中的下一个位置,重复上面计算过程,直到覆盖整个图像,生成特征(或激活)映射。
线性整流单元层
线性整流单元(RELU,RectifiedLinearUnit)层是一个将负输入值设置为零的激活函数,即当输入值x小于0时,输出f(x)为0;当输入值x大于等于0时,f(x)=x。RELU简化、加速了计算与训练,并且有助于避免消失梯度问题。其它一些激活函数还有sigmoid、tanh、leakyRELU,等等。
池化层
池化层的作用是减少参数数量以及图像的大小(宽度和高度,但不是深度)。最大池化是常用的方法,“最大”是指获取最大的输入值而丢弃其它值。其它池化还有平均池化等。
全连接层
“全连接”是将前一层中的每个神经元都连接到全连接层中的每个神经元。可以有一个或多个完全连接的层。这一层的任务是计算出分类中各种可能类别的概率,最终实现分类。
基于深度学习的影像分析示意图如图2所示,其基本结构是将多个卷积层、激活层和池化层堆叠起来。在空间维进行压缩,并根据学习到的特征映射数量进行扩展之后,所有特征被映射到全连接层上,由最后一个全连接层的激活函数给出分类概率,最后输出分类结果。
图2基于深度学习的医学图像分析示意图
3训练与学习要让机器能根据医学影像/图像自动给出疾病的判断结果,首先必须要对机器进行训练与学习。
训练
训练是建立一个输入—输出关系的过程。用已知的数据(样本)及其结论(标签)作为输入,让机器在知道输入数据及其应该获得的正确结论的前提下,调整内部参数,从而通过这些参数“记住”输入数据与正确结论之间的关系。可见,“训练”其实就是“教导”机器的过程。经过训练后,机器便建立起了反映输入与输出关系的一种“模型”。这种“模型”类似于函数关系,以后输入新的数据,通过模型的计算,就可以获得结论(输出结果)。
学习
学习是遵循某种规则(学习算法)调整神经网络内部参数的过程。机器学习可分为三类:监督学习、无监督学习和强化学习。在当前的研究中,大部分医学影像诊断是采用监督学习。它的基本原理是:计算输出结果,并与应有的正确结论(标签)进行比较,计算出误差,依据此误差去调整神经网络中各神经元之间的连接系数(即权值Wij),然后又根据新的输出计算误差,再调整Wij。重复上述过程,直到完成全部训练数据。如图3所示。
图3图监督学习示意图
4典型例子近几年,深度学习在医学影像分析中的研究获得了显著进展,限于篇幅,下面给出三个研究例子。
皮肤癌诊断
2017年,斯坦福大学A.Esteva等人在《Nature》发表了利用深度神经网络实现皮肤癌诊断的论文(“Dermatologist-LevelClassificationofSkinCancerWithDeepNeuralNetworks,”Nature,vol.542,no.7639,p.115,2017)。皮肤癌的诊断一般是先临床筛查,然后有可能再做皮肤镜分析、活检和组织病理学检查。该文阐述了使用深度卷积神经网络进行的皮肤病变分类。该系统使用的是预先在ImageNet数据集上训练的GoogleInceptionv3CNN架构,并在自己的数据集(包含2,032种不同疾病的129,450张临床病变图像)上使用像素和标签输入进行训练微调,如图4所示。757个训练分类,其由皮肤病新分类法和将疾病映射到训练分类的划分算法来定义。最后的推理分类要笼统一些,由一个或多个训练分类组成(例如,恶性黑色素细胞病变——黑色素瘤类)。推理分类的概率是根据分类结构对训练分类的概率进行求和。系统性能的测试使用经活检证实的临床图像,其测试性能与21位经过认证的皮肤科医生进行对比。使用两个关键的二元分类:角质形成细胞癌与良性脂溢性角化病、恶性黑色素瘤与普通的痣。第一个二元分类代表对最常见癌症的识别,第二个则代表对最致命皮肤癌的识别。结果表明,CNN在这两项任务中都取得了与所有专家同等的性能,其能力水平堪比皮肤科医生,从而展示了人工智能在皮肤癌诊断中的前景。
图4深度卷积神经网络架构(采用GoogleInceptionv3)
间质性肺病诊断
瑞士伯尔尼大学MariosAnthimopoulos等人于2016年发表了利用深度CNN实现间质性肺疾病诊断的论文(LungPatternClassificationforInterstitialLungDiseasesUsingaDeepConvolutionalNeuralNetwork,IEEETransactionsonMedicalImaging,Vol.35,No.5,May2016)。间质性肺病(ILD)是以弥漫性肺实质、肺泡炎症和间质纤维化为病理基本病变。伯尔尼大学的论文提出并评价了一种用于ILD模式分类的卷积神经网络(CNN),如图5所示。该网络由5个卷积层,核为2×2,激活函数是LeakyReLU,采用平均池化,全连接层最后一层的激活函数是softmax,给出7个分类的概率分布。7个输出对应的分类是:健康、毛玻璃不透明度(GGO)、微结节、实变、网状、蜂窝和GGO/网状的组合。训练和评估的数据集包含14696个图像。这是一个针对特定问题设计的深度CNN。在一个具有挑战性的数据集中,对比分析证明了有效性。该系统旨在为ILDs提供鉴别诊断,作为放射科医生的辅助工具。
图5肺模式分类的CNN结构
乳腺癌诊断
美国德克萨斯大学埃尔帕索分校WenqingSun等人关于深度CNN用于乳腺外诊断的论文(Enhancingdeepconvolutionalneuralnetworkschemeforbreastcancerdiagnosiswithunlabeleddata,ComputMedImagingGraph,2016),给出了一个基于图的半监督学习(SSL)方案,使用深度CNN诊断乳腺癌。CNN通常需要大量的标记数据进行训练和参数微调,而该方案只需要训练集中的一小部分标签数据,其余大量数据为无标签数据。诊断系统包括四个模块:数据加权、特征选择、分割协同训练数据标注和CNN,如图6所示。该研究使用3158个感兴趣区域(ROIs),每个感兴趣区域包含从1874对乳房X线照片中提取的肿块,其中的100个ROIs作为标签数据,其余的作为无标签数据,实验结果表明该方案的准确度为0.8243。对于混合数据与采用同样数量的有标签数据相比,后者方案的精度较前者高3.75%。不过,混合数据方案(SSL)的优点是可以利用无标签数据提高准确度,这在缺乏大量标签数据时是很有意义的。
图6乳腺癌诊断用的CNN结构
5结束语用人工智能实现医学影像智能分析,关键还是神经网络的训练和学习。训练的效果与数据密切相关。一是需要用大量的数据“教导”机器,对于医学影像诊断而言,即需要大量的病例影像。尤其是监督学习,需要很大的有标签数据。二是数据的正确性,即原始数据与结论(标签)的正确关系,显然,如果使用错误的数据,训练后得出的模型就可能导致错误。
许多用于医学影像分析的公共数据集已经开始出现,而且还会有更多的公共数据集出现,这将为人工智能机器学习提供极大的数据支持。然而,数据是过去的,对于一些突发的新型疾病,比如新病毒传染病,由于初期缺乏足够的有标签数据,对于机器学习是一个很大的挑战,而学习算法的进步则是应对这一挑战的关键。
------
本文原载"临菲信息技术港"公众号,可在临菲信息技术港免费下载PDF文档。返回搜狐,查看更多