人工智能如何助力跨媒体融合
2022年10月16日,中国计算机学会青年计算机科技论坛(CCFYOCSEF)武汉分论坛举办了线下技术论坛(论坛编号:CCF-YO-22-WH-3FT)。本次论坛以“人工智能如何助力跨媒体融合?”为主题,邀请了华中科技大学、武汉大学、合肥工业大学、华为武汉研究院、武汉理工大学的专家和学者作为论坛嘉宾进行发言和思辨点讨论。本次论坛由YOCSEF武汉学术秘书、武汉大学副教授肖晶,YOCSEF武汉通讯AC、江汉大学教授李登实共同担任执行主席;YOCSEF武汉AC、北京联合伟世科技股份有限公司华中区域销售总监吴佳,YOCSEF武汉通讯AC、江汉大学讲师刘哲共同担任线上执行主席;武汉大学,江汉大学,以及江汉大学人工智能第二党支部为本次论坛提供了支持。本期技术论坛邀约人工智能领域相关的专家学者,针对“人工智能如何助力跨媒体融合?”进行主题讨论,分析人工智能在跨媒体融合领域面临的主要挑战,探讨跨媒体融合技术在应用领域中面临的需求和问题,探索跨媒体融合技术发展面临的瓶颈问题,把握协同跨媒体融合未来发展的方向和机遇。
图1“人工智能如何助力跨媒体融合”技术论坛
论坛的引导发言环节邀请了3位嘉宾,分别是:华中科技大学教授刘琼、武汉大学教授王正以及合肥工业大学教授王扬。刘琼教授带来了题为”交互式媒体方法与应用“的引导发言。刘琼教授首先提出多媒体数据维度的提高改变了人机交互的形式,目前的难题在于如何让机器能像人一样,可以对周围的环境,以及对人的意图进行理解。进而从研究角度上,刘教授团队把现有的主要工作提炼为高位图像的采集与感知表达、视觉计算与空间认知、意图理解与交互重构等三个方面。接着,刘教授从三维空间信号的描述角度,提出常用方法包括计算法和感知法。从感知法出发,具体的方法可以通过多角度的相机阵列、深度传感器阵列,多角度光源发生器等进行三维空间信号的采集。然而,采用这些数据采集方法,最重要的是需要尽可能地对物理客观世界进行刻画。因此,刘琼教授所在实验室采用的球形自研数据采集装置,可以模拟各种光照条件,并进行毫秒级控制。并且,在多视角视频采集通过环形相机阵列实现,创新性地提出了金字塔形采集阵列。随后,刘教授在深度感知的视频编码方面,提出从静态向动态发展的方法;在多试点融合计算方面,提出采用数据与模型联合驱动的方法,通过空间立体几何和人工智能数据驱动的共同实现多视点融合。然后,刘教授介绍了焦栈图像具有立体完整呈现场景信息、给用户自用控制观看场景深度的优势,是未来多媒体技术一个发展方向,但是高度数据冗余会造成存储、数据表示方面的问题。因此,刘教授团队针对焦栈图像,提出了的基于表示模型的编码和基于表示魔方的渲染方法。最后刘琼教授从人眼视觉特性的角度出发,尝试将人类视觉认知机理引入到视觉编码表示领域,提出了基于RGB-D视频的视觉显著度方法。该项研究为多维度视觉信息处理领域相关研究提出了新的思路。
图2基于RGB-D视频的视觉显著度方法
随后,来自武汉大学计算机学院的王正教授,进行了题为“恶劣环境下多媒体内容理解、检测、检索”的引导发言。首先介绍了图像语义分割和内容理解的相关背景,并分析了其研究价值和应用领域,包括自动驾驶系统、无人机应用以及穿戴式设备应用。图像语义分割和内容理解在良好图像环境下可以取得不错的效果,但实际应用中拍摄到的图像往往难以保证图像环境场景的质量。针对恶劣环境下的语义分割任务,王教授提出以下几种方法提高该任务的性能:(1)在数据集方面,首先获取大量标注图像,分析了恶劣环境下降低内容理解性能的因素,并进行了针对性的方法改进,通过增加一个中间层提高了图像内容理解的性能;(2)在域适应方面,可利用数据特性从简单到复杂环境的适应,通过空间域和时间域的diffusion来提高性能;(3)提出分布的跨时间一致性和背景跨帧一致性,利用良好环境和恶劣环境间的一致性来提供算法性能,通过融合区域分布和背景的先验知识提供内容理解性能。(4)通过分析恶劣环境中的光照变化来改进方法,提升算法性能。(5)针对地面与卫星遥感场景,提出在地面照片和卫星遥感照片之间,添加无人机拍摄照片,通过无人机域把地面图像域和卫星图像域串联起来,以获得更好的理解结果。
图3恶劣环境下多媒体内容理解、检测、检索
作为最后一位引导发言嘉宾,来自合肥工业大学多媒体实验室的王杨教授进行了题为“全局纹理结构角度下的图像修复”的引导发言。王教授首先介绍了图像补全的相关背景和研究现状,并介绍了图像补全的应用领域,包括图片编辑、照片修复、目标移除等。深度学习的图像补全方法,比如基于CNN只考虑局部图像信息,而基于注意力机制的方法又考虑图像的所有区块信息,独立计算不同区域信息可能会误导补全的结果。针对基于深度学习的图像补全所存在的问题,王杨教授指出可以从纹理和结构的角度来进一步提升图像内容的理解和补全。为此,王教授提出了基于结构和纹理的模型,根据结构约束生成更好的纹理语义,贡献有以下两点:(一)利用transformer编码模型根据纹理参考信息来获取整幅图像的语义相关性并探索图像的全局结构,(二)再用transformer模型重构图像的每一块区域,从而实现全局的低频和高频信息的补全。最后王教授用一句话总结了他今天分享的图像补全工作的核心思想,即“通过人工智能技术帮助不同媒体进行信息补全和协同。”
图4全局纹理结构角度下的图像修复
在思辨环节,参与论坛的所有专家和老师就以下三个议题进行了激烈的探讨:(1)媒体信息处理技术的必经之路是什么?(2)单一媒体信息处理技术的叠加是否等同于媒体信息融合?(3)基于人工智能的跨媒体融合技术路在何方?这三个问题也是目前人工智能助力跨媒体融合需要面对和解决的问题。
对于“媒体信息处理技术的必经之路是什么?”这个问题的思辨,专家和老师们讨论了下列子问题:1.1在媒体信息技术中常提及:“多媒体”、“跨媒体”、“融媒体”,“全媒体”等名词,这些名词是概念炒作吗?1.2目前媒体信息技术最需要在“多媒体”、“跨媒体”、“融媒体”,还是“全媒体”上开展研究?
武汉大学王正教授认为,从历史和发展的角度来说,多媒体从一开始做的编解码,到内容理解,以及到现在的跨媒体、全媒体内容分析,这些是与社会发展、经济发展息息相关的。这些概念所涉及到的技术的发展需要和社会需求相结合。
华为武汉研究所高丽主任工程师认为,不同媒体之间的信息具有一定的相关性,可以通过这些相关性将不同形态的媒体数据串联起来。就融媒体而言,目前业界主流的技术采用的是音视频融合。全媒体则是一种基础建设方面的概念,目前还处于发展中。
合肥工业大学王杨教授认为,跨媒体的目的是为了融合。目前适合从跨媒体、融媒体的角度开展研究,需要解决何时、何地、采用什么方法进行融合的问题,如何在最恰当的时间和地点消除多种媒体信息中的不确定性。
武汉理工大学钟忺副教授认为,全媒体是目标,融媒体是研究发展的必经阶段。在低光照场景下,视觉摄像头能获取的信息非常少,此时适合采用深度信息或者红外信息来做媒体数据的融合和补全。
图5思辨问题1:媒体信息处理技术的必经之路是什么?
在“单一媒体信息处理技术的叠加是否等同于媒体信息融合?”的问题上,来自不同领域和方向的专家、老师们也各抒己见,讨论了以下子问题:2.1使用单一媒体信息处理技术的叠加方式是否能有效实现媒体融合?2.2媒体融合主流技术有哪些,其中的关键技术包含哪些?
武汉大学的王正教授认为,不同媒体的信息有效性是不同的,具有不同的侧重性和倾向性,因而简单的叠加效果不明显。
华为武汉研究院的高丽主任工程师认为,在音频领域中,能够称为多媒体融合的就是音视频结合。音频受环境的影响非常大,单纯靠音频实现场景理解非常困难。视频信息可以给音频信息参考,音频信息可以和视频信息进行融合。目前在音频领域主流的工业界方法还是单一的音视频叠加。之所以目前还没有往融合的方向做训练,原因在于音频和视频信号的数据维度是割裂的,联合做训练的难点不一定是技术性的,而在于如何做选择、剔除干扰信息。
合肥工业大学王杨教授认为,融合方式分为三种。一是早期融合,即先把数据做叠加,然后再放入到模型中进行训练;二是晚期融合,即先单独把数据做特征提取,然后在特征层面上再做融合;三是在数据处理过程中进行融合,但是技术难点在于计算复杂度,数据维度较高时,计算效率难以接受。由于不同模态的媒体数据在数据处理的目标也是不一样,使得衡量各个模态的不同目标,并能进行统一融合是一个需要考虑的重要问题。
武汉理工大学钟忺副教授认为,早期的媒体数据融合方式是在相对粗粒度层面上的数据融合,具体的融合方式可以相对简单,例如加法、乘法、加权拼接等。但随着融合技术的发展,可以将更多人工智能技术,例如VisionTransformer等用于媒体数据融合。他同样赞同王杨教授的观点,不同数据的处理目标不同,融合的难点仍然是如何针对不同数据特性设计统一融合的方法。
图6思辨问题2:单一媒体信息处理技术的叠加是否等同于媒体信息融合?
在“基于人工智能的跨媒体融合技术路在何方?”的问题上,专家和老师们分析和讨论了以下两个子问题:3.1人工智能技术是否是跨媒体融合的催化剂?3.2.跨媒体融合技术的新需求是否能反哺人工智能技术的革新?
武汉大学王正教授认为,如自然语言处理、计算机视觉等相关领域的技术可以对多媒体融合起到更加重要的作用。由于目前不同媒体之间的研究差异很大,通过人工设计的融合方法很难取得理想的效果,因此需要借助人工智能技术。换句话说,人工智能技术推动了跨媒体融合技术的发展。
合肥工业大学王杨教授认为,人工智能技术不仅能在跨媒体融合中解决很多传统技术无法处理的问题,也能够帮助研究者更好地理解跨媒体融合中的问题。
武汉理工大学钟忺副教授认为,多媒体数据形态的增加与发展为人工智能模型和技术的发展提供了更多新的数据形态,多媒体和人工智能是相辅相成的。
华为武汉研究院的高丽主任工程师认为,多媒体领域的新需求可以在一定程度上推进人工智能技术的进步。音视频联合领域相对于视频和图像领域发展更慢。以往的音频处理技术通常更依赖传统方法。近年来音频降噪、语音识别等领域的突破加速了音视频融合的发展。
图7思辨问题3:基于人工智能的跨媒体融合技术路在何方?
图8参会人员合影
本次论坛历时三个小时,通过引导发言、论坛思辨,辨明了跨媒体融合领域在人工智能时代遇到的新问题和困惑,分析跨媒体融合在发展过程中面临的主要挑战,探讨跨媒体融合在应用中存在的若干重要问题,探索了跨媒体融合技术的未来发展方向,将人工智能技术赋能跨媒体融合,加快了跨媒体融合技术的发展。
人工智能在医疗领域的应用
泉州市鲤城区疾病预防控制中心福建泉州362000 摘要:随着社会进步和人们健康意识的觉醒,人口老龄化问题的不断加剧,人们对于提升医疗技术、延长人类寿命、增强健康的需求也更加急迫。而实践中却存在着医疗资源分配不均,药物研制周期长、费用高,以及医务人员培养成本过高等问题。与此同时,图像识别、深度学习、神经网络等关键技术的突破带来了人工智能(ArtificialIntelligence)技术新一轮的发展。对于医疗进步的现实需求极大地刺激并推动了以数据密集、知识密集、脑力劳动密集为特征的医疗产业与人工智能的深度融合。本文在智能医疗国内外的发展热度不断提升的背景下,主要介绍了智能医疗的应用场景及国内外研究人工智能在医疗领域的应用实例,以期提高人们对人工智能在医疗领域应用的重视和发展投入。 关键词:人工智能,医疗,机器学习(MachineLearning),深度神经网络(DeepNeuralNetworks) 1.介绍 人工智能(AI)诞生于20世纪50年代,图灵发表了一篇划时代的论文,并提出了著名的“图灵测试”,随后,人工智能经历了第一波早期的发展热潮,主要体现在符号主义,早期推理系统,早期神经网络预计专家系统当中,但由于当时逻辑理论占据话语权,并且限于当初的科学技术水平,AI系统被论证为难以工程化,不能带来实际价值。70年代,“AI之冬”之后,语音识别领域统计学派取代了专家系统。人们专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。同时人们开始利用神经网络完成模式识别等任务,AI迎来了近20年的第二次发展热潮。2006年之后,人们发现一种运行深度学习算法的硬件平台——GPU,它强大的并行运算能力缓解了深度学习算法的训练瓶颈,从而释放了人工智能的全新潜力,使之在互联网和移动互联网应用,自动驾驶、智慧交通、物流、共享出行,智能金融,家用机器人和服务机器人,智能制造业,人工智能辅助教育,智慧农业,智能新闻写作,机器翻译,机器防生,智能律师助理,人工智能驱动的娱乐业,人工智能艺术创作,智能客服与及智能医疗等领域得到全面而迅猛的发展。其中由于人们对智能医疗的迫切需求使得AI在医疗领域可能会率先落地。 文章第三节简要介绍了智能医疗的主要应用场景,随后在第四节给出了多个典型的应用实例。最后概述了国内智能医疗的现状,总结了我们进一步的工作。 2.AI技术在医疗领域的主要应用场景 目前,从全球创业公司实践的情况来看,智能医疗的具体应用包括洞察与风险管理、医学研究、医学影像与诊断、生活方式管理与监督、精神健康、护理、急救室与医院管理、药物挖掘、虚拟助理、可穿戴设备以及其他。总结来看,目前人工智能技术在医疗领域的应用主要集中于以下几个领域: 2.1.医疗机器人 机器人技术在医疗领域的应用并不少见,比如智能假肢、外骨骼和辅助设备等技术修复人类受损身体,医疗保健机器人辅助医护人员的工作等。 一是,能够读取人体神经信号的可穿戴型机器人,也成为“智能外骨骼”; 二是,能够承担手术或医疗保健功能的机器人,以IBM开发的达·芬奇手术系统为典型代表。 2.2.智能药物研发 智能药物研发是指将人工智能中的深度学习技术应用于药物研究,通过大数据分析等技术手段快速、准确地挖掘和筛选出合适的化合物或生物,达到缩短新药研发周期、降低新药研发成本、提高新药研发成功率的目的。 人工智能通过计算机模拟,可以对药物活性、安全性和副作用进行预测。借助深度学习,人工智能已在心血管药、抗肿瘤药和常见传染病治疗药等多领域取得了新突破。在抗击埃博拉病毒中智能药物研发也发挥了重要的作用。 2.3.智能诊疗 智能诊疗就是将人工智能技术用于辅助诊疗中,让计算机“学习”专家医生的医疗知识,模拟医生的思维和诊断推理,从而给出可靠诊断和治疗方案。智能诊疗场景是人工智能在医疗领域最重要、也最核心的应用场景。 2.4.智能影像识别 智能医学影像是将人工智能技术应用在医学影像的诊断上。人工智能在医学影像应用主要分为两部分:一是图像识别,应用于感知环节,其主要目的是将影像进行分析,获取一些有意义的信息;二是深度学习,应用于学习和分析环节,通过大量的影像数据和诊断数据,不断对神经元网络进行深度学习训练,促使其掌握诊断能力。 2.5.智能健康管理 智能健康管理是将人工智能技术应用到健康管理的具体场景中。目前主要集中在风险识别、虚拟护士、精神健康、在线问诊、健康干预以及基于精准医学的健康管理。 风险识别:通过获取信息并运用人工智能技术进行分析,识别疾病发生的风险及提供降低风险的措施。 虚拟护士:收集病人的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息,运用人工智能技术进行数据分析并评估病人整体状态,协助规划日常生活。 精神健康:运用人工智能技术从语言、表情、声音等数据进行情感识别。 移动医疗:结合人工智能技术提供远程医疗服务。 健康干预:运用AI对用户体征数据进行分析,定制健康管理计划。 3.AI技术在医疗领域的应用实例 3.1.医疗机器人 3.1.1智能外骨骼 俄罗斯ExoAtlet公司生产了两款“智能外骨骼”产品:ExoAtletⅠ和ExoAtletPro。前者适用于家庭,后者适用于医院。ExoAtletⅠ适用于下半身瘫痪的患者,只要上肢功能基本完整,它能帮助患者完成基本的行走、爬楼梯及一些特殊的训练动作。ExoAtletPro在ExoAtletⅠ的基础上包括了更多功能,如测量脉搏、电刺激、设定既定的行走模式等。 日本厚生劳动省已经正式将“机器人服”和“医疗用混合型辅助肢”列为医疗器械在日本国内销售,主要用于改善肌萎缩侧索硬化症、肌肉萎缩症等疾病患者的步行机能。 3.1.2手术机器人 世界上最有代表性的做手术的机器人就是达·芬奇手术系统。“达·芬奇手术系统分为两部分:手术室的手术台和医生可以在远程操控的终端。手术台是一个有三个机械手臂的机器人,它负责对病人进行手术,每一个机械手臂的灵活性都远远超过人,而且带有摄像机可以进入人体内的手术,因此不仅手术的创口非常小,而且能够实施一些人类一生很难完成的手术。在控制终端上,计算机可以通过几台摄像机拍摄的二维图像还原出人体内的高清晰度的三维图像,以便监控整个手术过程。目前全世界共装配了3000多台达·芬奇机器人,完成了300万例手术。” 3.2.智能药物研发 美国硅谷公司Atomwise通过IBM超级计算机,在分子结构数据库中筛选治疗方法,评估出820万种药物研发的候选化合物。2015年,Atomwise基于现有的候选药物,应用人工智能算法,在不到一天时间内就成功地寻找出能控制埃博拉病毒的两种候选药物。 除挖掘化合物研制新药外,美国Berg生物医药公司通过研究生物数据研发新型药物。“Berg通过其开发的InterrogativeBiology人工智能平台,研究人体健康组织,探究人体分子和细胞自身防御组织以及发病原理机制,利用人工智能和大数据来推算人体自身分子潜在的药物化合物。这种利用人体自身的分子来医治类似于糖尿病和癌症等疑难杂症,要比研究新药的时间成本与资金少一半。” 3.3.智能诊疗 国外最早将人工智能应用于医疗诊断的是MYCIN专家系统。我国研制基于人工智能的专家系统始于上世纪70年代末,但是发展很快。早期的有北京中医学院研制成‘关幼波肝炎医疗专家系统’,它是模拟著名老中医关幼波大夫对肝病诊治的程序。上世纪80年代初,福建中医学院与福建计算机中心研制的林如高骨伤计算机诊疗系统。其他如厦门大学、重庆大学、河南医科大学、长春大学等高等院校和其他研究机构开发了基于人工智能的医学计算机专家系统,并成功应用于临床。 在智能诊疗的应用中,IBMWatson是目前最成熟的案例。IBMWatson可以在17秒内阅读3469本医学专著、248000篇论文、69种治疗方案、61540次试验数据、106000份临床报告。2012年Watson通过了美国职业医师资格考试,并部署在美国多家医院提供辅助诊疗的服务。目前Watson提供诊治服务的病种包括乳腺癌、肺癌、结肠癌、前列腺癌、膀胱癌、卵巢癌、子宫癌等多种癌症。Watson实质是融合了自然语言处理、认知技术、自动推理、机器学习、信息检索等技术,并给予假设认知和大规模的证据搜集、分析、评价的人工智能系统。 3.4.智能影像识别 美国企业Enlitic将深度学习运用到了癌症等恶性肿瘤的检测中,该公司开发的系统的癌症检出率超越了4位顶级的放射科医生,诊断出了人类医生无法诊断出的7%的癌症。 3.4.1.赋能细胞3D建模 从英伟达NVIDIA企业解决方案中,我们了解到在西雅图艾伦细胞科学研究所(AllenInstituteforCellScience),研究人员创建了第一个针对人类活细胞的可预测3D模型。借助此模型,科学家可以在计算机屏幕上以数字化的方式呈现,甚至控制细胞行为。
Figure1AllenIntegratedCell 此模型名为“艾伦集成细胞”(AllenIntegratedCell),是利用数万张搞清细胞图像进行深度学习训练的结果。它能够识别亚细胞结构并投射细胞的3D多层图像,显示其所有组成部分是如何同时相互作用的,此种呈现方式前所未有。 相对于以往观察细胞内部结构的荧光显微镜,新模型克服了成本高昂,缓慢并具有破坏性的缺点,开启了观察人类活细胞内部结构的全新方法,将影响药物发现、疾病研究以及我们进行人体细胞基础研究的方式。 3.4.2.AI和深度学习助力超声成像癌症诊断 机械工程专业学生ViksitKumar在得知自己的母亲患上卵巢癌时,癌症已经发展到了第三期,这时候再采取化疗已经无力回天。“如果癌症早一点发现,她可能再多活几年”的想法促使他转而主攻医疗领域。现在他是明尼苏达州罗切斯特梅奥医院的高级研究员。 过去数年间,Kumar一直致力于基于GPU的深度学习研究,力图利用超声图像实现更准确的癌症诊断。乳腺癌比卵巢癌更为常见,且能吸引到更多的研发资金,因此他把工作重点首先放在了乳腺癌上,希望让早期诊断在乳房X光检查稀缺的发展中国家得以实现。
Figure2TumorBoundary,redcircleissplitmanually,whilethebluecircle,greencircleandcyancircleispredictedbyDeepLearning Kumar的团队使用深度学习工具,用为数众多的超声波成像作为训练输入,希冀可以做出癌症的早期判断。在本地,他使用由NVIDIAGPUCloud(NGC)提供的TensorFlow深度学习框架容器进行处理。对于最为繁重的任务,其工作被转移到了AmazonWebSevices上的NVIDIATeslaV100GPU,并使用同一个NGC容器。 3.5.智能健康管理 3.5.1.风险识别 风险预测分析公司Lumiata,通过其核心产品——风险矩阵(RiskMatrix),在获取大量的健康计划成员或患者电子病历和病理生理学等数据的基础上,为用户绘制患病风险随时间变化的轨迹。利用MedicalGraph图谱分析对病人做出迅速、有针对性的诊断,从而对病人分诊时间缩短30%-40%。 3.5.2.虚拟护士 NextIT开发的一款APP慢性病患者虚拟助理(AlmeHealthCoach),“AlmeHealthCoach是专为特定疾病、药物和治疗设计配置。它可以与用户的闹钟同步,来触发例如‘睡得怎么样’的问题,还可以提示用户按时服药。这种思路是收集医生可用的可行动化数据,来更好的与病人对接。”该款APP主要服务于患有慢性疾病的病人,其基于可穿戴设备、智能手机、电子病历等多渠道数据的整合,综合评估病人的病情,提供个性化健康管理方案。 美国国立卫生研究院(NIH)投资了一款名为AiCure的App。这款App通过将手机摄像头和人工智能相结合,自动监控病人服药情况。 3.5.3.精神健康 2011年,美国Ginger.IO公司开发了一个分析平台,通过挖掘用户智能手机数据来发现用户精神健康的微弱波动,推测用户生活习惯是否发生了变化,根据用户习惯来主动对用户提问。当情况变化时,会推送报告给身边的亲友甚至医生。 Affectiva公司开发的情绪识别技术,通过网络摄像头来捕捉记录人们的表情,并能分析判断出人的情绪是喜悦,厌恶还是困惑等。 3.5.4.移动医疗 Babylon开发的在线就诊系统,能够基于用户既往病史与用户和在线人工智能系统对话时所列举的症状,给出初步诊断结果和具体应对措施。 AiCure是一家提醒用户按时用药的智能健康服务公司,“其利用移动技术和面部识别技术来判断患者是否按时服药,再通过APP来获取患者数据,用自动算法来识别药物和药物摄取。” 3.5.5.健康干预 Welltok通过旗下的CaféWellHealth健康优化平台,运用人工智能技术分析来源于可穿戴设备的MapMyFitness和FitBit等合作方的用户体征数据,提供个性化的生活习惯干预和预防性健康管理计划。 4.结论 本文简要介绍了人工智能的发展情况,结合人们对于提升医疗技术、延长人类寿命、增强健康的需强烈需求,列举了两个国内外研究人工智能在医疗领域的应用实例,给出了一种将人工智能应用到医疗领域的有效的方法和步骤。从而使人们更加重视以深度学习为主的人工智能技术在医疗领域的应用,加大研发和投资力度,加速智能医疗的进展,造福人类。 5.国内现状 根据方正证券发布的互联网医疗深度报告,“中国互联网医疗发展经历了三个阶段:信息服务阶段,实现人和信息的连接;咨询服务阶段,实现人和医生连接;诊疗服务阶段,实现人和医疗机构的连接。”在实际的产业发展中,中国智能医疗仍处于起步阶段,但赖于资本的追捧,多家智能医疗创业公司已顺利获得融资。在未来的发展中,国内公司应当加强数据库、算法、通用技术等基础层面的研发与投资力度,在牢固基础的同时进一步拓展智能医疗的应用领域。索引
人工智能在游戏中的应用与未来展望
人工智能在游戏中的应用与未来展望摘要:人工智能是全球科技发展的一个热点,其在多个领域都有突出的应用。本文主要介绍了人工智能在游戏中的三大应用,并对其发展趋势和前景进行了相关讨论。
关键词:人工智能,游戏,发展应用,前景
一.人工智能概述人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,在游戏中的应用也极为广泛,对玩家而言,游戏在玩法和开发上的拓展,能带来众多更有趣更精良的游戏;也会让体验变得更特别、更个性化、更令人回味。于整个产业来说,更多的创新和技术进步将推动产业的蓬勃发展,更加良性。
二.人工智能在游戏中的三类应用1.AI智能游戏引擎游戏AI引擎可以绕过算法,提供“傻瓜式”的创作平台和工具:帮助开发者简化游戏制作流程,降低制作难度,塑造随机地图和创造NPC等等。目前主流的游戏AI引擎有三类:AI渲染引擎、NPC制作引擎和游戏创作引擎。
常见的有3D游戏需要提高游戏画面的表现力度,不断提升3D图形技术的功能,游戏画面在设计时除了重视美术设计质量外,在游戏表现的各个环节需要编辑较多的数据,这个程序员带来较大的挑战,这些问题的解决归根到底是完善游戏引擎。游戏画面设计在引擎中一般采用层次的设计方式,需要不断明确人工智能技术在各个环节的作用。游戏引擎的主要结构包括三个:高层接口、中层接口和低层接口,具体来说,高层接口的作用是能够让用户使用人功智能技术调控中层接口,通过改变算法控制游戏中游戏角色的战术动作、攻击活动等进行操作,中层接口可以通过与底层接口相结合,控制底层接口中的动画和运动等变换速度快的画面,保证游戏中的角色能够做一些高难度的动作,为用户提供高质量的服务,底层接口的作用在于控制角色的动画与基本动作,并提供物理计算与3D渲染等功能,但是底层接口的功能只能操作角色的朝向和位置,不能进行跳跃的动作,这些动作需要由中层接口完成。
2.神经网络算法要让NPC更聪明一点,目前这方面的AI解决方案主要有这四种:
有限状态机、蒙特卡洛决策树、神经网络、遗传算法。在传统游戏中,最为广泛使用是有限状态自动机(FSM),这是一种专家型的预编程算法。与FSM相比,蒙特卡洛决策树(MCST)会多步联想做决策,而非只就当前形势。这种多元化的行为能带来玩家更强大的个性化交互游戏体验,但其难度和成本也更大,且无学习能力。MCST模式下的NPC最大的缺陷在于学习能力。他们不能从玩家那里学习任何东西,不会根据玩家的习惯性操作做出相应的变化。
而人工神经网络(ANN)和遗传算法则可以解决机器学习的问题。**但是,神经网络下的NPC是“不可控的”(“非线性”和“非常定性”特征导致),这给游戏的运营与维护带来不少的风险,NPC的行为将在不断学习中变得难以预测,游戏后期的调试变得异常困难,有可能出现脱轨的问题。**另一种技术——遗传算法(GeneticAlgorithm)创造了一个不可击败的敌人。**遗传算法是基于达尔文进化论提出的一种决策计算模型,计算机在模拟自然进化过程中寻求最优解。**体现在游戏上,NPC会根据以往的经验去优化策略,新一轮的进攻的“敌人”会接收“牺牲者”的意志,并针对玩家的过往策略逐个击破。这意味着越强大的玩家将面临越强大的敌人,并且没有尽头。主机游戏SHMUP中,游戏开发者就为玩家置入了运用遗传算法的敌人。他们让玩家反抗经过多代进化敌人的AI,当这一代又被击败时,遗传算法对AI进行排名并使用它们创造新一代的敌人来对抗玩家。在著名进化策略类游戏孢子和怪物系列都在遗传算法上有所突破。
3.AI操作系统人工智能操作系统的理论前身为20世纪60年代末由斯坦福大学提出的机器人操作系统,应具有通用操作系统所具备的所有功能,并且包括语音识别、机器视觉、执行器系统、和认知行为系统。在游戏中,相对于游戏引擎和算法开发方向而言,它可以直接识别玩家操作,使游戏产业第一次从间接的数字控制转向更自然的模拟控制。人工智能在游戏中的运用甚至帮助现实世界的进步。因为游戏能够为现实世界提供准确数据和测试平台,例如赛车游戏为自动驾驶提供数据支持等等。
三.对人工智能游戏的未来展望在过去的20年里,AI在游戏中取得了显着的进步。对于今天的游戏开发者来说,创造一个高效的A.I.系统与创造优质游戏和美妙的图像同样重要。每个工作室都开始为A.I.分配一个专门的编程团队。在游戏开发的早期阶段设计游戏。他们花费更多的资源和时间来建立多样化,称职和表现良好的非玩家角色(NPC)。更多的开发人员使用高品质的A.I.设计使他们的游戏在竞争日益激烈的市场中脱颖而出。
理想的目标是让玩家始终沉浸在游戏中。NPC应该让人觉得是活生生会呼吸的人,而且这种错觉在游戏中不会以任何方式被打破。人类的行为很有趣,像对话这种微妙的互动行为,在未来AI可能会实现。如果能在诸如此类的互动上有所突破,那么游戏中更多的部分将有更强的互动性。说不定会产生全新类型的游戏。
四.总结通过游戏展我们可以看到游戏AI正在向更高的质量,更适应玩家的需求,给玩家带来非凡体验的方向迅猛发展。也许我们所期待的、理想中的、极大拟人化的游戏AI将会很快得以实现,并且给我们的生活增添更多的快乐与色彩。而游戏AI也将为人类在人工智能方面的研究上添上非常重要的一笔!