博舍

《中国煤炭杂志》官方网站 人工智能在机器人中的应用领域

《中国煤炭杂志》官方网站

★科技引领★

人工智能在煤矿机器人中的应用张辰1,范永2,李贻斌1,杨彤3

(1.山东大学控制科学与工程学院,山东省济南市,250061;2.山东交通学院轨道交通学院,山东省济南市,250357;3.山东中科先进技术研究院有限公司,山东省济南市,250000)

摘要随着人工智能技术的迅速发展,其在煤矿的应用也越来越广泛。在煤矿生产过程中,机器人换人需求的迫切性加快了煤矿机器人的产业化应用,也加速了人工智能技术在煤矿机器人中的应用。对人工智能技术在煤矿机器人中的应用进行了分析探究,介绍了人工智能技术的主要研究内容及其在工业中的应用,分析了人工智能在煤矿生产中的应用现状,阐述了将人工智能技术有效地应用于煤矿机器人的构想,并对人工智能在煤矿机器人中发展前景进行了展望。

关键词人工智能煤矿机器人智能感知智能决策智能监测

0引言

煤矿井下生产作业过程存在下井人员多、灾害风险高、事故率高、作业环境恶劣、环境污染严重等问题[1]。面对高危的井下作业,煤矿机器人成为实现煤矿井下安全、高效生产目标的重要途径之一。煤矿机器人可以协助或替代人完成一些危险的采矿作业劳动,实现煤矿的安全高效生产。为了实现“无人则安”,机器人代替矿工进行井下作业是大势所趋。

随着“中国制造2025”“德国工业4.0”“美国工业互联网”等战略的提出,5G通信、物联网、大数据、云计算和人工智能等技术的逐渐成熟,极大地推动了我国传统制造业的转型升级[2]。作为一种新兴的科学技术,人工智能能够使计算机技术更加精准、快速、便捷地完成人类大脑无力承担的复杂科学计算,实现对人脑的部分代替、延伸和加强,进而创造出能代替人类完成复杂危险作业的智能机器[3]。

未来的煤矿生产将向无人化、自主化、智能化、高效化发展,其中人工智能技术将起到无可替代的作用,多样化的人工智能技术将会应用到煤矿机器人中[4]。虽然当前人工智能在工业煤矿领域的应用还处于摸索期,然而随着人工智能技术在煤矿领域中越来越广泛的应用,建设无人化作业矿井势在必行[5]。

1煤炭行业亟待解决的问题

我国煤炭行业经历了40多年的发展历程,煤炭矿产资源的开采逐渐趋于智能化,但当前依旧存在一些瓶颈问题亟待解决。

1.1技术设备亟需升级

我国煤炭的开采、运输虽已经历了数字化、自动化、信息化等阶段,但整体技术水平与生产设备依然低于发达国家[6]。2019年,原国家煤矿安全监察局提出了加快掘进、采煤、运输、安控、支护和救援等煤矿机器人的产业化应用。当前的煤矿机器人已不再是仅仅完成简单的重复性操作,它可以感知周围环境并实时反馈外界的信息,但其还不具备独立的思维、识别、推理、判断与决策能力,仍需要人为参与来完成一些复杂的工作任务。

1.2安全生产隐患严重

煤炭行业属于高危行业,生产中的每个环节都存在着各种危险,水、火、瓦斯、煤尘、地质构造等灾害频发,未知的复杂地下环境严重威胁井下作业人员的生命安全。基于物联网、大数据、云计算等的煤矿智能监测与预警技术虽在很大程度上降低了事故的发生率,保障了煤矿的安全生产,但仍然存在诸多问题。传感器的精度和灵敏度较差导致前兆信息采集不全面、不及时;监测系统相互独立、功能单一,云端平台集成应用融合深度不够;监测系统数据库安全性较弱;监测设备缺少深度学习以及自适应能力[7]。

1.3环境污染严重

煤矿在开采过程中会产生煤尘,也会产生一氧化碳、二氧化碳等有害气体污染大气环境[8]。同时,煤矿开采产生的生产污水中含有大量重金属、酸性物质等,易渗入土壤或进入地下水污染地质及水源。煤矿开采工程会侵占大量植被及农业耕地,开采后土地易出现坍塌现象导致地表层破坏[9]。

2人工智能的主要研究内容2.1模式识别

人工智能技术中的模式识别借助先进计算机技术强大的数据采集、分析和处理功能,通过提前设置相应的程序来模拟人类对于外界环境的感知及识别功能。融入模式识别的智能机器人可以更好地模拟人类的感官能力,对字符、声音、图像、场景及其融合信息进行高准确度的识别,通过多源信息的获取对周围环境进行精确的感知与建模[10]。

人工智能技术中的机器视觉作为最重要的环境感知方式之一,模拟人类的视觉能力,提高机器人对于井下环境、作业过程和反馈现象的理解能力。融入机器视觉的智能机器人一是能够很好地适应井下作业环境,与其他人造设备进行良好的协作;二是能够捕捉到更多的外界景观信息,通过立体视觉、视觉检验以及动态图像分析技术,对图像的内容进行深入的理解与挖掘;三是能够判断作业进程的地底反馈现象,将机器人的状态信息反馈给运动控制系统[11]。

2.2专家系统

专家系统是将人类专家的知识和经验进行建模,用于解决系统决策、工艺、故障等问题的技术。通过人工智能技术,为井下系统建立知识系统,模拟人类解决作业过程中遇到的实际问题。人类专家在解决实际问题时,可以根据当前系统的状态,例如设备显示与声音、运行数据参数、产品的状态,对系统故障进行预测,判断故障点并生成故障排除方案。因此,专家系统常用于故障预测、诊断和故障排除。此外,在制造业领域,专家系统也用于生产方案决策、生产工艺优化、生产协调以及设备参数优化。

2.3机器学习

人工智能技术中的机器学习通过模型框架和算法来模拟人类的学习能力,通过训练数据、环境信息和反馈,自动提取内在规律,以提高系统的性能,提高环境适应性和鲁棒性。融入机器学习的机器人具备类人的规律提取、知识总结能力,从收集到的大量信息资源中找出有效信息,并加以学习来提升自身的智能化水平。机器学习技术能够有效解决突发状况下的系列难题,很大程度上降低人力成本与生产成本[12]。

2.4分布式人工智能

分布式人工智能系统通过科学合理地结合人工智能与计算机技术,将异构的多智能体系统进行协调调度和控制,从而增强人工智能系统的性能,提升任务执行能力,提高智能机器人中的各个独立系统的协同工作效率。当智能机器人遇到一些突发情况时,依旧可以保障各个分系统进行正常工作。当前分布式人工智能系统还处于研发起步阶段,技术难点在于如何协调好不同系统的运行规则[13]。

3人工智能在煤矿机器人中的应用现状3.1人工智能在煤矿机器人运动控制中的应用

为了确保煤矿机器人能够在复杂的井下环境中正常运行,研究学者将专家系统、人工神经网络等人工智能技术应用于机器人运动控制方式、算法及协同作业等方面。煤矿机器人通过模拟人类专家思维及知识水平,可以解决一些复杂多维的非线性问题,降低动力学系统分析、参数设置及数据处理的运算量,提高控制效率及准确性。

王念等[14]研究人员基于嵌入式ucos设计了一款智能矿井机器人,并利用GSM网络实现对设备的远程控制;张传才等[15]研究人员采用BP神经网络建立了一种根据电机速度、运行时间确定机器人转角的测量方法,可以提供角度参数用于机器人的路径规划;王雪松等[16]研究人员基于改进的Elman神经网络逼近动力学不确定参数,利用神经-模糊控制器为煤矿机器人伺服系统发送控制指令;宋鑫等[17]研究人员将神经网络应用于机器人控制领域,完成机械臂多关节耦合控制、末端轨迹规划、液压阀控制等动作。

3.2人工智能在煤矿机器人智能感知与险情预测中的应用

矿用巡检机器人通过搭载各类传感器实现全方位感知井下环境信息,实时监控仪器设备故障、人员安全及瓦斯、煤尘、水、火等灾害信息,并及时发出预警,减少煤矿事故的发生。针对井下复杂环境中的识别不准确、监测不及时等多个技术难题,研究人员使用深度学习、模式识别、专家系统等技术,进一步提升机器人对井下突发险情的精确识别与实时监控。

卢万杰等[18]研究人员使用基于卷积神经网络的深度学习算法,对煤矿设备进行建模和训练,使井下巡检机器人能够准确识别煤矿设备的类型;张帆等[19]研究人员针对井下噪声对可视化作业环境的扰动影响,提出基于残差神经网络的矿井图像重构方法,有效提高监控图像的清晰度及实时性能;聂珍等[20]研究人员采用基于BP神经网络的遗传算法搭建巷道气体环境智能检测系统,实时获取煤矿巡检机器人路径中不同巷道截面上气体浓度分布数据;潘越等[21]研究人员使用BP神经网络对风机故障建立诊断模型,建立风机故障类型与风机转子振动频率段之间的映射关系,进而实现风机故障诊断;闫君杰等[22]研究人员基于人工神经网络对煤矿机械齿轮故障建立诊断模型,使用输入信号训练神经网络模型,对输出信号进行分类,进而判断齿轮故障。

3.3人工智能在煤矿机器人自主定位导航与地图构建中的应用

实现复杂非结构化煤矿环境中的自主定位导航既要考虑GPS技术无法直接应用于井下的问题,又要克服粉尘、温度、湿度、噪音、气流等外界因素的干扰,这对井下受限封闭环境中的机器人自主精准定位导航技术提出了更高的要求。基于人工智能技术进行煤矿机器人地图构建、定位导航、路径规划、实时避障成为应用研究热点。

白云[23]提出变结构模糊神经网络,并将其应用于蛇形井下救援机器人的环境感知过程中,将多源传感器数据进行融合,实现蛇形机器人在恶劣环境下的障碍物识别与环境建模;付华等[24]研究人员使用人工神经网络模型,将智能化煤矿监测系统的工作空间进行建模和动态描述,利用神经网络模型对机器人进行避障路径规划;张耀锋等[25]研究人员采用基于Elman网络对井下机器人超声波传感器测量误差进行补偿,大大提高了超声测距的精度和障碍物探测的能力;翟国栋等[26]研究人员总结了双目视觉技术在煤矿救援机器人中获取事故现场信息和实现自主避障及路径规划的研究,包括模式分类与识别、视觉测量和三维重建、组合测量与定位、视觉伺服控制等方面;马宏伟等[27]研究人员构建了基于深度相机的机器视觉系统,提出了一种基于深度视觉的导航方法,机器人搭载RGB-D深度相机进行数据采集,实现地图创建与自主导航。

4煤矿机器人智能化研究

人工智能技术种类繁多,应用于煤矿机器人领域主要研究内容包括多模态融合智能感知、知识学习与智能决策、智能控制协同作业等。通过感知、学习、决策、协同控制,实现煤矿机器人智能化发展。

4.1多模态融合智能感知

煤矿机器人通过搭载各类防爆、高精度、高可靠性传感器,构建视觉、听觉、嗅觉、触觉等多模态融合的智能感知系统,完成智能识别分析、异常声音识别、温度异常监测、烟雾检测、有害气体浓度检测、自主避障、自主抓持等作业。

(1)研究煤矿应用场景下机器视觉识别、视觉检测等技术。通过图像处理与理解,机器人一是能够识别和监控设备数字表、液晶屏、指示灯、阀门等;二是能够检测管路液体滴漏、胶带跑偏开裂;三是能够进行人员入侵、人员在岗、人员穿戴着装检测;四是能够对胶带上出现的矸石、锚杆、道木、铁管等异物进行识别与跟踪。

(2)研究煤矿应用场景下机器人听觉即声音检测与识别等技术。利用高灵敏度拾音传感器、高速DSP数字信号处理器,结合适应动态降噪处理技术、音频特征提取与检测模型算法识别技术,识别矿井内异常声音。

(3)研究煤矿应用场景下机器人嗅觉即气体检测智能识别技术。准确检测环境中的甲烷、硫化氢、一氧化碳、氧气等多种气体浓度和烟雾是否超限,及时发现气体泄漏和预警着火。

(4)研究煤矿应用场景下机器人触觉技术。通过接触或非接触的方式采集电机、水泵、轴承、托辊、胶带等物体温度,并进行数据分析;通过力感设备,对接触力、抓持力、作业力、内应力进行实时监控,实现力的感知与安全控制。

4.2知识学习与智能决策

针对目前煤矿机器人系统协议不兼容、缺乏信息共享与融合等问题,将煤矿机器人与新一代信息技术深度融合,构建煤矿机器人相互学习和知识共享的泛化、标准、弹性系统,突破煤矿机器人场景理解、安全探测、精确定位、自主感知及高效导航等技术瓶颈。实现煤矿机器人共性技术的云端在线服务,解决个体机器人的局限性,提高煤矿机器人的智能决策水平。

(1)建立个体与整体相融合的学习与泛化框架。在个体层面,单台机器人在作业过程中,将传感、决策、控制、协作以及人机交互信息进行整合,通过以神经网络为代表的人工智能学习框架进行增量、实时、在线训练,对机器人的作业状态进行动态调整,实现全周期的最优化控制与决策。在整体层面,多机器人之间通过新一代信息技术,将自身学习的知识进行上传和分发,当某机器人面对全新作业任务时,可以借助其它机器人的知识结果,快速熟悉作业特性,减少重新学习时间,提升整体系统的任务弹性和适应能力。

(2)建立机器人本体与云端相融合的作业模式。突破传统机器人研发与集成模式,借助“5G+云计算”,实现本地轻量化机器人本体与云端高性能数据处理能力相融合的新型机器人研发集成路线。将智能环境感知、模式识别、地图构建、自主导航等需要强大计算能力的算法部分移入云端,本地机器人将机载传感器、执行器数据实时上传云端,通过云端强大的数据处理和计算能力,对感知、建模、执行等各个环节进行优化计算;计算结果实时下发本地机器人,减少了本地机器人的计算负担,将更多的硬件资源向传感器和执行端转移,实现轻量化、精简化、高效能的作业机器人设计。

4.3智能控制协同作业

将深度学习、激光/视觉SLAM技术融入到煤矿机器人,再结合多模态融合的智能感知系统,实现煤矿机器人在矿井复杂环境下自主移动、精确定位、位姿调整、智能作业规划、自主作业以及灾害智能感知等功能,实现探测、掘进、支护作业过程智能协同控制。

(1)将神经网络技术融入到多台煤矿机器人协同作业控制和规划中。矿井移动机器人自组织、自组网、自协调,实现异构设备整合。通过智能任务分解、任务分配、负载均衡技术,组建矿井复杂环境下的机器人群,应用井下空间自主导航、多传感器状态感知、智能作业规划、多机协同控制等技术,实现工作面掘进、钻探、采掘、运输、支护等多机器人间高效协同作业。

(2)将人与单台机器人交互的模式扩展到人与多机器人群的交互,实现操作人员对机器人群的干预和协作。煤矿机器人作业过程中,各个不同功能的异构机器人形成复杂的多机器人协作群。同时,多机器人协作群需要能与操作人员进行深度的协作。通过AI技术,突破现有人机交互技术的简单的“指令-执行-显示”模式,将人的干预融入控制循环中,实现“人在环内”的融合人机交互新模式,实现“井下无人系统群+井上操作员”的作业模式,提升整体系统的作业效能、任务弹性和鲁棒性。

面向智慧煤矿目标,开展“煤矿机器人+”研究,“煤矿机器人+5G”实现全面感知互联、全域信息共享和多通道人机交互;“煤矿机器人+云计算”实现轻量低成本机器人本体和高效能学习计算能力的兼容;“煤矿机器人+大数据”实现动态预测、信息共融,为机器人进化学习提供数据基础;“煤矿机器人+AI”实现智能自主感知、最优分析决策和知识学习进化,从而形成矿山立体感知、自主学习、协同控制的完整智能系统。

5未来展望

人工智能在煤矿机器人领域得到了广泛的应用,并取得了较多的研究成果。但是人工智能作为新兴的前沿技术,仍存在局限性。

(1)目前的人工智能技术主要面向单一任务,尚未实现能够面对多种任务的通用型人工智能框架。例如针对图像识别训练的模型不能使用于声音检测和识别;识别某特定目标物的算法框架,也无法扩展到任意目标物的识别,在出现新的分类目标时,需要构建数据集并重新进行训练。该特点限制了人工智能在复杂任务场景下的应用。

(2)人工智能算法需要依赖于大量的数据,而数据的采集、加工、标定和校准等操作需要人工完成,效率较低,如何使用更少量的数据,实现更高的性能,成为当前人工智能方法的研究热点之一。

(3)煤矿机器人种类众多,存在大量的感知设备,驱动设备和执行设备。各设备的数据格式多样,难以形成统一的数据接口,使得各个系统之间的数据相互独立。不兼容数据导致人工智能系统难以将煤矿生产各环节的机器人进行统筹协调,也难以获取所需的足够数据,无法针对整个生产流程形成闭环式的统一规划。

(4)煤矿机器人所处的环境极度危险,因此仅依靠目前的人工智能系统无法保证高度的安全性和稳定性。如何将人工智能系统与操作人员的人工干预相融合,并将人的干预融入整个人工智能系统的运行回环之中,成为下一步需要解决的重点内容之一。

未来,应用于煤矿机器人的人工智能系统将会朝着通用化、低开销、统一化和人机协作方向发展,出现面向多种任务的通用型人工智能算法框架,使用少量的数据和低成本的训练方法不断地在线学习和进化,能够结合煤矿生产各环节的关键数据进行统筹计算和调度,并能够和人类相互协同,实现高效、安全、自主的煤矿生产。

6结语

随着人工智能技术的发展,煤矿行业将会迎来大变革。借助人工智能高效的模型构建、并行计算和统筹规划能力,煤矿机器人的智能化、自动化水平将会迈上新的台阶,真正实现煤矿生产的无人化和安全性要求。同时,人工智能将会使煤矿生产效率大幅提高,推动煤矿行业安全、健康和可持续发展。

参考文献:

[1]李芳玮,胡而已,张冬阳.煤矿机器人研发应用现状及趋势[J].中国煤炭,2019,45(7):28-32.

[2]孙晓彬.人工智能技术在工业生产中的应用探究[J].现代商贸工业,2019,40(23):200.

[3]陈芳.人工智能技术应用研究现状和发展前景[J].科技传播,2020,12(12):130-131.

[4]葛世荣,胡而己,裴文良.煤矿机器人体系及关键技术[J].煤炭学报,2020,45(1):455-463.

[5]孙召胤.物联网、人工智能在智能煤矿开采中的应用[J].建筑工程技术与设计,2020,(21):4061.

[6]仝维欣.人工智能对煤炭行业发展的影响[J].科技创新与应用,2020(3):50-51.

[7]郑学召,童鑫,郭军,等.煤矿智能监测与预警技术研究现状与发展趋势[J].工矿自动化,2020,46(6):35-40.

[8]陈积梁.浅析煤矿综采工作面粉尘防治技术[J].内蒙古煤炭经济,2020(8):111-113.

[9]桂阿娟.物联网数据监测下露天煤矿开采环境污染模型研究[J].环境科学与管理,2020,45(6):126-131.

[10]姚轶峰.人工智能技术在机器人运动规划中的应用[J].信息记录材料,2019,20(12):172-173.

[11]朱铭明.人工智能在智能机器人系统中的应用研究[J].数字化用户,2018,24(29):49.

[12]赵英花.人工智能在智能机器人系统中的应用研究探讨[J].内燃机与配件,2018(18):217-219.

[13]陈海燕,徐翔,朱良.浅析人工智能在智能机器人领域中的研究与应用[J].现代信息科技,2019,3(10):21-22.

[14]王念,盛荣,郝宇浩.基于嵌入式ucos的智能矿井机器人设计[J].煤矿机械,2014,35(1):19-21.

[15]张传才,贺利乐,匡伟春.基于BP神经网络的机器人转角测量.煤矿机械,2008,29(4):175-176.

[16]王雪松.基于多传感器信息融合的煤矿机器人路径规划及控制的研究[D].2002.

[17]宋鑫,边春娜.煤矿井下机器人钻臂智能控制研究.煤矿机械,2013,34(4):55-57.

[18]卢万杰,付华,赵洪瑞.基于深度学习算法的矿用巡检机器人设备识别[J].工程设计学报,2019,26(5):527-533.

[19]张帆,徐志超.基于残差神经网络的矿井图像重构方法[J].煤炭学报,2019,44(11):3614-3624.

[20]聂珍,马宏伟.煤矿巡检机器人巷道气体环境智能检测系统设计[J].工矿自动化,2020,46(6):17-22.

[21]潘越,陈尉,平建明,等.基于BP神经网络的煤矿风机故障诊断[J].煤矿机械,2013,34(2):254-255.

[22]闫君杰,苏晨.基于人工神经网络的煤矿机械齿轮故障诊断研究[J].煤炭技术,2017,36(9):266-268.

[23]白云.煤矿救援蛇形机器人环境建模方法研究[J].西安科技大学学报,2014,34(4):485-489.

[24]付华,杜晓坤,陈峰.基于Elman网络的超声测距补偿在煤矿机器人中的应用[J].煤炭学报,2005,30(6):783-787.

[25]张耀锋,陈宝玲,刘沂,等.基于人工神经网络的智能化煤矿监测系统的路径规划[J].传感器世界,2016(10):31-33.

[26]翟国栋,张文涛,岳中文,等.基于双目视觉技术的煤矿救援机器人研究进展[J].煤炭科学技术,2020,48(7):206-217.

[27]马宏伟,王岩,杨林.煤矿井下移动机器人深度视觉自主导航研究[J].煤炭学报,2020,45(6):2193-2206.

ApplicationofartificialintelligenceincoalminerobotsZHANGChen1,FANYong2,LIYibin1,YANGTong3

(1.SchoolofControlScienceandEngineering,ShandongUniversity,Jinan,Shandong250061,China;2.SchoolofRailTransportation,ShandongJiaotongUniversity,Jinan,Shandong250357,China;3.ShandongInstituteofAdvancedTechnology,ChineseAcademyofSciences,Jinan,Shandong250000,China)

AbstractWiththerapiddevelopmentofartificialintelligence(AI)technology,theapplicationofAIinthecoalindustryhasbecomemoreandmoreextensive.TheurgentdemandforrobotsubstitutioninminingproductionhasacceleratedtheindustrialapplicationofcoalminerobotsandtheapplicationofAItechnologyincoalminerobots.TheapplicationofAItechnologyincoalminerobotwereanalyzesandexplored,themainresearchcontentofAItechnologyanditsapplicationinindustrywereintroduced,theapplicationstatusofAIinthecoalindustrywasanalyzed,andtheideaofapplyingAItechnologytocoalminerobotseffectivelywaselaborated,andthefuturedevelopmentofAIincoalminerobotswasprospected.

Keywordsartificialintelligencetechnology,coalminerobot,intellisense,intelligentdecision,intelligentmonitoring

中图分类号TD67

文献标志码A

移动扫码阅读

引用格式:张辰,范永,李贻斌,等.人工智能在煤矿机器人中的应用[J].中国煤炭,2021,47(1):93-98.doi:10.19880/j.cnki.ccm.2021.01.013

ZHANGChen,FANYong,LIYibin,etal.Applicationofartificialintelligenceincoalminerobots[J].ChinaCoal,2021,47(1):93-98.doi:10.19880/j.cnki.ccm.2021.01.013

作者简介:张辰(1993-),男,山东平度人,博士研究生。主要研究方向为机器人环境感知、多机器人协同规划与控制。E-mail:zchen@mail.sdu.edu.cn

通讯作者:李贻斌(1960-),男,山东聊城人,工学博士,教授,国家重点研发计划智能机器人专项总体组专家。主要研究方向为智能机器人技术、智能控制系统。E-mail:liyb@sdu.edu.cn

(责任编辑路强)

随机过程及其在机器学习中的应用指南

许多物理和工程系统使用随机过程作为建模和推理的关键工具。随机过程是一个概率模型,描述了代表可能的样本路径的时间有序的随机变量的集合。它被广泛用作系统和现象的数学模型,这些系统和现象似乎以随机的方式变化。作为统计学的一项经典技术,随机过程被广泛用于各种领域,包括生物信息学、神经科学、图像处理、金融市场等。在这篇文章中,我们将详细讨论随机过程,并试图了解它与机器学习的关系以及它的主要应用领域是什么。本文要讨论的主要内容概述如下。

目录一般的随机过程随机过程随机过程的例子随机系统与其他系统的比较机器学习中的随机过程随机过程的应用

让我们先来了解一下随机的一般含义。

随机性的一般意义

随机性是指被随机概率分布很好地描述的特性。虽然随机性和随机性是不同的,前者指的是一种建模方法,后者指的是现象,但这两个术语经常被互换使用。此外,随机过程的正式概念也被称为概率论中的随机过程。

随机性被应用于各种领域,包括生物学、化学、生态学、神经科学和物理学,以及图像处理、信号处理、信息理论、计算机科学、密码学和电信。它也被运用于健康、语言学、音乐、媒体、色彩理论、植物学、制造业和地貌学,所有这些都受到金融市场中看似随机的运动的影响。在社会科学中,利用了随机建模。

随机过程

尽管随机过程的定义各不相同,但它通常被描述为由某个集合索引的随机变量的集合。在没有明确描述索引集的情况下,随机过程和随机过程这两个短语被认为是同义词,可以互换使用。短语"集合"和"族"可以互换使用,而"参数集"或"参数空间"偶尔也被用来代替"索引集"。

一些理论上定义的随机过程包括随机漫步、马汀格、马尔可夫过程、莱维过程、高斯过程、随机场、更新过程和分支过程。概率论、微积分、线性代数、集合论和拓扑学,以及实分析、度量论、傅里叶分析和函数分析,都被用于研究随机过程。

随机过程的例子泊松过程

泊松过程是一个具有多个定义和应用的随机过程。它是一个计数过程,是一个随机过程,在这个过程中,随着时间的推移,会显示出随机数量的点或发生。一个随时间变化的泊松随机变量被定义为一个过程中在零和某一时间之间的点的数量。非负数构成了这个过程的索引集,但自然数构成了状态空间。因为它可以被设想为一种计数操作,所以这个过程通常被称为泊松计数过程。

伯努利过程

最基本的随机过程之一是伯努利过程。它是一组独立和相同分布(iid)的随机变量,每个变量的概率为1或0,例如,1的概率为p,0的概率为1-p。这种方法类似于反复投掷硬币,得到头的概率为p,数值为1,得到尾的概率为0。换句话说,伯努利过程是一组iid伯努利随机变量,每次抛硬币代表一次伯努利试验。

随机漫步

简单的随机漫步是随机漫步的一个典型例子。它是一个以整数为状态空间的离散时间的随机过程,以伯努利过程为基础,每个伯努利变量要么取正值,要么取负值。换句话说,简单的随机漫步发生在整数上,其数值以概率p增长1,或以概率1-p降低1,因此这种随机漫步的索引集是自然数,但其状态空间是整数。如果p=0.5,这种随机行走被称为对称随机行走。

将随机系统与其他系统进行比较

让我们把随机系统与其他偶尔被用作随机的同义词的类似术语进行比较,以便更好地掌握它。随机是随机和概率的同义词,尽管非决定性与随机有区别。

随机性与梯度

随机性与概率性

随机性和概率性这两个词经常被互换。概率性很可能是更广泛的术语。随机性取决于以前发生的情况,比如股票价格的波动是基于前一天的价格,但概率性是独立于其他观察的,比如中奖号码,它们应该是相互独立的。

随机性与非决定性

确定性指的是一个变量或过程可以根据当前情况预测发生的结果。简单地说,我们可以说明,在决定论的模型中没有任何东西是随机的。另一方面,非决定性是指一个变量或过程,同样的输入可能导致不同的结果。

因为结果是不可预测的,所以随机性经常与非决定性的方法交替使用。在我们可能使用预期结果和方差等概率工具进行分析时,随机性与非决定性略有不同。因此,将一个变量定义为随机性而不是非决定性是一个更有力的主张。

随机性Vs随机性

在大多数情况下,随机性与随机性是可以互换使用的。随机指的是不可预测,在理想的情况下,所有的结果都是同样可能的,意味着不依赖其他的观察,比如抛出一个公平的硬币,而随机指的是随机选择的变量的概率性质。

机器学习中的随机过程

随机性被用来解释几个机器学习方法和模型。这是由于许多优化和学习算法必须在随机领域发挥作用,而且一些算法依赖于随机性或概率性决定。让我们更详细地看看机器学习中不确定性的来源和随机算法的性质。

在机器学习中是如何识别的

涉及不确定性的领域被称为随机性。统计噪音或随机错误会导致目标或目标函数的不确定性。也可能是由于用于拟合模型的数据是更大群体的一个样本。最后,所采用的模型很少能够捕捉到领域的所有元素,而是必须概括到未知的情况,从而导致保真度的损失。

优化随机的

创建和采用随机变量的优化方法被称为随机优化(SO)。随机变量存在于随机问题的优化问题本身的表述中,它包含了随机目标函数或随机约束。随机迭代方法也包括在随机优化方法中。一些随机优化方法结合了随机优化的两个定义,使用随机迭代来解决随机问题。

以下是随机优化算法的一些实例:

粒子群优化模拟退火遗传算法随机学习算法

机器学习中最普遍和广泛使用的两种算法是随机梯度下降和随机梯度提升。

随机梯度下降(SGD)是梯度下降技术的一个变种,它为训练数据集中的每个例子计算误差并更新模型。由于模型是为每个训练实例更新的,随机梯度下降经常被称为在线机器学习算法。

随机梯度提升算法是决策树技术的集合。随机方面指的是从训练数据集中抽取的随机行子集,利用它来建立树,特别是树的分裂点。

随机过程的应用

随机模型被用于金融市场,以反映资产的看似随机的行为,如股票、商品、相对货币价值(即一种货币相对于另一种货币的价格,如美元相对于欧元的价格)和利率。

制造程序被认为是随机的。这个假设对批量和连续的制造过程都是正确的。过程控制图描绘了一个跨时间的特定过程控制参数,用于记录过程的测试和监测。

观众口味和偏好的营销和转移,以及某些电影和电视首映的招徕和科学的吸引力(即开幕周末、口碑、被调查群体中的首要知识、明星名字的认可,以及社会媒体宣传和广告的其他元素),都部分地受到随机模型的影响。

StanislawUlam和NicholasMetropolis推广了蒙特卡洛方法,这是一种随机方法。随机性的使用和程序的重复性让人想起了赌场活动。仿真和统计抽样方法通常被用来测试一个先前理解的确定性问题,而不是反过来。尽管历史上存在"倒置"技术的例子,但在蒙特卡洛方法得到普及之前,它们并没有被视为一种通用策略。

结论

在这篇文章中,我们用不同的概念和应用领域来理解随机过程。我们在这篇文章中经历了随机的定义,它与随机、概率、非确定性等相关术语的区别,以及随机在机器学习中的意义。此外,我们还有一些基本的和常见的随机过程的例子,这些例子可以在通用术语中看到。

参考文献随机过程随机优化机器学习中的随机性意味着什么?

SLAM在机器人中的应用

SLAM在机器人中的应用​

伴随着人工智能、机器人、无人驾驶等技术的蓬勃发展,越来越多的相关智能产品出现在了我们的日常生活中,作为底层技术基石之一的SLAM也逐渐被大家所熟知。下面通过“机器人对于人类的意义”、“机器人为什么需要SLAM技术”和“搭载SLAM算法的机器人有哪些用途”这样三个问题,来探讨SLAM在机器人中的应用。

温馨提示本篇文章已经收录在我最新出版的书籍《机器人SLAM导航核心技术与实战》,感兴趣的读者可以购买纸质书籍来进行更加深入和系统性的学习,购买链接如下:点这里购买:《机器人SLAM导航核心技术与实战》购买链接点这里观看视频讲解:《机器人SLAM导航核心技术与实战》书籍配套教学视频一、机器人对于人类的意义

从某种意义上说,人类的躯体延展了人类的智能。互联网技术和人工智能技术则是对人类智能的又一次延展,而机器人又对人工智能技术进行了延展,如图1所示。这种延展性,是机器人对于人类的重要意义。

 

图1 人类躯体和智能的不断延展

人类学会使用工具,可以看成是人类躯体的第一次延展。试想一下在不会使用工具的远古时代,人类祖先只能靠采摘树上的水果维持生计,就连那些美味的坚果由于无法被牙齿咬开而十分遗憾地远离了人类的食谱。当人类学会了使用简单的工具(比如石斧、长矛、弓箭等),就可以用这些工具劈开坚硬的食物外壳、捕杀野兽以及保卫家园,这极大促进了人类的进步。再到后来学会制造和使用青铜器、铁器、汽车、轮船、飞机等一系列更先进的工具,这大大突破了人类躯体自身所能触及大自然的极限。

机器人的出现,可以看成是人类躯体的第二次延展。机器人相比于以往的单纯工具显然具有更高的自由度,能解决更复杂的问题。通常可以将人类的社会活动归结为人适应自然环境并改造自然环境的过程,站在技术的角度讲就是人的社会活动是人与自然环境时时刻刻发生的交互行为的总和。机器人作为人类与自然环境发生交互行为的重要工具,机器人的行为当然也就要围绕与自然环境的交互而展开。机器人通过搭载的传感器对环境进行感知,即传感器是机器人系统的输入端;机器人通过搭载的执行机构与环境进行交互,即执行机构是机器人系统的输出端;决策作为机器人的中枢系统连接输入端和输出端,决策由低智能的认知层和高智能的逻辑推理层构成,常见的人脸识别、语音识别、机器人定位、机器人避障等都属于低智能的认知层,而复杂的逻辑推理目前在机器人中还比较难实现。

而互联网技术的普及是对人类智能的又一次延展,我们可以借助互联网巨大的信息存储以及检索能力来管理我们的知识(以前靠人脑维护这些知识则需要消耗掉我们很大一部分的心智),同时互联网提供的便捷交流渠道加速了人类认识并改造自然的进程。伴随着互联网技术而兴起的人工智能技术则是对人类智能的进一步延展,如果将传统互联网技术看成是信息存储、检索和传播的载体,那么人工智能技术则可以看成是对载体上的信息进行挖掘并应用新信息的一种工具。简单点说就是传统互联网技术本身并不生产信息而只是起到信息传播的作用,信息仍然由使用它的人产生;而人工智能技术则可以从人产生的信息中生成新信息,即机器能发掘出人不知道的一些知识经验。

如果人工智能技术仅仅停留在虚拟的网络和数据之中,那么其挖掘并利用新知识的能力很难扩展开来。可以说机器人是人工智能技术应用能力的有效延展,特别是能自主移动的机器人极大地扩展了人工智能技术的应用范围,而基于SLAM的自主导航技术正是当下实现机器人自主移动的热门研究领域。

二、机器人为什么需要SLAM技术

虽然我们还没有彻底搞清楚人类智能的本质以及生命存在的意义这个终极哲学问题,但就目前取得的进展而言,人工智能技术和机器人无疑极大地增加了人与自然环境交互的可能性。让机器人成为人的第二躯体,能极大地延展人与自然环境交互的范围和速度。当从量变发展为质变时,就有可能让人类摆脱自身躯体的局限而取得跨越式的发展。而这样的机器人应该具备高度的自主性,让机器人实现完全自主化也就成了人类一直以来的梦想。所谓完全自主化,就是在没有外界指令的干预下,机器人能通过传感器和执行机构与环境自动发生交互,并完成特定的任务。比如,自主与人类发生语言和情感交流,自主识别、抓取和操控物体,自主移动等。完成这些特定任务的每一种底层技术都可以认为是机器人时代的一种基础设施,比如由语音识别、语音合成、自然语言理解等技术组成的语音交互基础设施,由目标识别、运动规划、行为决策等技术组成的物体抓取基础设施,由建图、定位、路径规划等组成的自主移动基础设施等。

自主移动--->SLAM导航自主抓取自主交互 ……

由于我们生活在一个三维空间环境中,在环境空间中移动是机器人与环境发生交互最基本的形式之一,因此自主移动也被誉为机器人自主化的“圣杯”。换句话说,要实现机器人的完全自主化,就必须先实现机器人的自主移动。试想一下如果人类拥有一个非常聪明的脑瓜子但却被限制在固定的地方不能移动,那么人与人之间的交流将很大程度地被阻断,人类的分工协作、社会生产、认识并改造自然的能力也将不复存在。既然自由移动对于人类这么重要,那么作为人类第二躯体的机器人,其自主移动的重要性也就不言而喻了。

1.什么是自主移动

自主移动实质上就是解决从地点A到地点B的问题,这个问题看似简单,实则非常复杂。当向机器人下达移动到地点B的命令后,机器人不免会问出3个颇具哲学性的问题,即“我在哪”、“我将到何处去”和“我该如何去”,如图2所示。

 

图2 自主导航的本质

经过近几十年来的研究,形成了一套有效解决机器人自主移动的方案,即SLAM导航方案。SLAM导航方案由建图(mapping)、定位(localization)和路径规划(pathplanning)3大基本问题组成,这3大问题互相重叠和嵌套又组成新的问题,也就是SLAM问题、导航问题、探索问题等,如图3所示。

 

图3 SLAM导航方案

2.什么是SLAM

SLAM用于解决定位和建图两个问题,也就是常说的同时定位与建图。要搞清楚SLAM是怎么来的,就要先了解单独的定位和建图这两个子问题。

对于单独的定位问题来说,是在已知全局地图的条件下,通过机器人传感器测量环境,利用测量信息与地图之间存在的关系求解机器人在地图中的位姿。定位问题的关键点是必须事先给定环境地图,比如分拣仓库中货架上粘贴的二维码路标,就是人为提供给机器人的环境地图路标信息,机器人只需要识别二维码并进行简单推算就能求解出当前所处的位姿,如图4所示。

图4 基于已知全局地图的定位问题

而对于单独的建图问题来说,是在已知机器人全局位姿的条件下,通过机器人传感器测量环境,利用测量地图路标时刻的机器人位姿和测量距离与方位信息,很容易求解出观测到的地图路标点坐标值。建图问题的关键点是必须事先给定机器人观测时刻的全局位姿,比如装载了GPS定位的街景绘制汽车,汽车由GPS提供全局定位信息,测量设备基于GPS定位信息完成对街道建筑物的测绘,如图5所示。

 

图5 基于已知全局位姿的建图问题

很显然,这种建立在环境先验基础之上的定位和建图具有很大的局限性。将机器人放置到未知环境(比如火星探测车、地下岩洞作业等场景),前面这种上帝视角般的先验信息将不再存在,机器人将陷入一种进退两难的局面,即所谓的“先有鸡还是先有蛋”的问题。

 

图6 未知环境是先建图还是先定位

如果没有全局地图信息,机器人位姿将无法求解;没有机器人位姿,地图又将如何求解呢?于是将机器人位姿量与地图路标点作为统一的估计量进行整体状态估计,这是SLAM问题研究的起源。简单点理解的话,SLAM的建图与定位过程如图7所示。

 

图7 SLAM的建图与定位过程

当机器人来到一个完全陌生的环境之中,机器人通过传感器(比如激光雷达)对该位置上能观测到的环境物体进行扫描,这样就获得了一个很小的局部初始地图。接着机器人就可以在移动的过程中利用这个局部初始地图进行定位,这样就能获得下一个时刻机器人的位置。当然在移动的过程中,机器人会扫描到环境中新的物体。这样往复,机器人就可以不断利用以往的地图进行定位,同时在定位的基础上对以往地图进行更新。当然,SLAM算法的实际实现过程要比这个复杂得多,涉及到概率论、状态估计、优化理论、感知融合等,这里就不具体展开了。

3.什么是SLAM导航

其实机器人的自主导航,就是在回答“我在哪”、“我将到何处去”和“我该如何去”这样三个问题。仅仅依靠SLAM技术所提供的建图和定位功能还无法实现机器人的自主移动,还需要将SLAM与导航算法以及人工规则等相结合,这种结合也就是所谓的SLAM导航。SLAM一方面为导航算法中的路径规划提供机器人定位信息,另一方面为导航算法提供可动态更新的全局地图。而导航算法主要解决序贯决策问题,包括障碍物度量、路径规划、运动控制等研究课题。

 

图8 SLAM导航

由于SLAM和导航是两个相对独立的系统,通常SLAM在导航应用中有两种模式。第一种模式,SLAM先运行建图模式构建好环境地图后将地图保存,接着载入已保存的全局地图并启动SLAM重定位模式提供定位信息。第二种模式,SLAM直接运行在线建图模式,建图过程中直接提供地图和定位信息。后一种模式下的SLAM导航也称为环境探索,利用已有地图进行导航,然后导航控制机器人移动的过程又反过来更新了地图。

三、搭载SLAM算法的机器人有哪些用途

目前以SLAM导航技术为支撑的自主移动应用领域已经十分广泛了,涵盖航天、军事、特种作业、工业生产、智慧交通、消费娱乐等众多领域。航天领域的典型应用要属火星探测车,在遥远的星球上自主移动无疑是一项必备的技能。军事上借助自主移动的坦克、机器人士兵、飞机等,可以打一场无人化战争。在特种作业场合的自主移动机器人将发挥无可替代的作用,比如管道清洗、矿井作业、抢险救援、排爆、安防巡检、深海勘探等。农业上的应用,比如自主栽培、自主除草、自主施肥、自主采摘等。还有自动驾驶汽车、机器人终端物流配送、全自动化工厂、机器人智慧养老、机器人餐厅、家庭服务机器人等。总之,就是用机器人去替代人类各种体力活的场合都用得到SLAM。下面结合更详细的案例,来说明这些用途的广泛性。

 

图9 SLAM在机器人中的应用

1.导览机器人

如果一台平板电脑被赋予了自动行走的能力,将具备巨大的应用潜力。这里将要介绍的机器人讲解员、迎宾机器人、引导机器人等案例就是其中的一些典型应用,这些机器人通过SLAM技术实现自主移动,并通过搭载的可触摸平板电脑终端以及语音交互技术与用户进行交互。

像博物馆、展览馆、陈列室这类以讲解游览为主的应用场景,机器人讲解员能很好地替代人类讲解员高度机械重复的工作。在博物馆的入口,游客可以挑选一台空闲的机器人讲解员,然后从机器人屏幕推荐的游览路线中选择出一条感兴趣的路线,接着就可以在机器人的带领下游览路线中的各个展台并听取机器人在对应展台的讲解。

 

图10 机器人讲解员

当然在机器人讲解员的基础上添加专门的知识库以及语音交互技术的支持,这样的机器人就可以充当迎宾机器人。机场问询服务、医院导诊、银行大堂接待、公司前台等应用场景,迎宾机器人都可以充当一名辛勤的工作人员耐心提供咨询服务以及相应引导。

 

图11 迎宾机器人

如果将地图以及货架商品等信息录入机器人,那么机器人就可以提供更加详细以及贴切的查询指引服务。比如在大型商超,顾客可以通过机器人的指引从成千上万件商品中找到需要商品的摆放位置。如果是在图书馆的话,可以用类似的方法找到想要查阅书籍的摆放位置。引导机器人除了可以为顾客提供查询引导服务外,还可以充当自主移动的购物车,并且是一块具有移动属性的天然广告牌。

 

图12 引导机器人

2.安防机器人

对于变电站、计算机机房、厂房等环境严酷恶劣的场景,日常的设备巡检就可以交由机器人来完成,工作人员只需在远程进行分析判断即可。利用SLAM自主移动技术、高清摄像头、机械手臂、无线通信等,就可以搭建起一台巡检机器人。

 

图13 巡检机器人

上面提到的巡检机器人都是与机器设备打交道,而下面这种安保机器人则主要是与人打交道。在巡检机器人的基础上,增加以人工智能技术为依托的各种物体识别、行为识别、舆情监测等算法,就可以让机器人在机场、游乐园、大型活动现场等场景提供日常安保服务。安保机器人上搭载的各种传感器(红外夜视、气体传感器、火焰传感器、金属探测器等)以及人工智能算法,可以对各种违禁品(比如打火机、酒精、管制刀具等)、可疑包裹、异常行为等进行识别并预警。

 

图14 安保机器人

由于近年来疫情在全世界的大流行,防疫机器人也越来越受重视。体温检测、戴口罩识别、紫外线消杀、雾化消毒、空气净化等防疫工作,也越来越多的由防疫机器人来分担完成。

其实将安保机器人稍加改装,摇身一变就成了一台防疫机器人。

 

图15 防疫机器人

3.清扫机器人

相信大家一定已经对家用扫地机器人不陌生了,最早的扫地机器人仅依靠红外线传感器和碰撞传感器进行乱撞式的导航,也就是走到哪撞到哪,撞到障碍物后就换一个方向继续前进。这种早期的扫地机器人显然非常不智能且工作效率极低,后来的一种改进方案是扫地机器人主动向天花板投射散色的红外线,如果扫地机器人能收到反射回来的红外光就说明扫地机器人钻进了桌子或椅子底下,这种方式能在一定程度上保证扫地机器人不被陷入导航困境,但是还是显得比较“智障”。那么要如何让扫地机器人显得不那么“智障”呢?目前主流的扫地机器人基本都采用SLAM技术进行导航,主要是激光SLAM方案和视觉SLAM方案。激光雷达一般采用低成本的单线激光雷达,视觉传感器则包括单目、双目和RGB-D相机。目前搭载单线激光雷达的激光SLAM导航基本是扫地机器人的标配,一些稍微高端点的扫地机器人还会在搭载单线激光雷达的基础上搭载额外的双目或RGB-D相机之类的进行更智能的避障辅助。

 

图16 家用扫地机器人

随着SLAM以及无人驾驶技术的逐步成熟,扫地机器人也越来越多的应用于环卫、公共场所、大型空间的清扫。环卫清扫机器人典型应用场景包括机场、火车站、大型商超、工地厂房、游乐园、公园等,传统的环卫车需要人来驾驶,而在传统环卫车上加装激光雷达以及SLAM导航算法就能变成一台无人驾驶环卫车,这样能大大节省人力提高效率。

 

图17 无人驾驶环卫车

4.配送机器人

上面提到的几种机器人大都是提供某种服务或者完成某种作业任务,这里将介绍自动运载货物的机器人应用。用SLAM导航技术给机器人赋能后,机器人或无人车便能完成货物的运输和投递任务。比较常见的应用包括送餐机器人、送快递机器人、酒店配送机器人等。

 

图18 送餐机器人、送快递机器人、酒店配送机器人

其实,除了送餐、送快递、送酒店物品外,具备自主导航能力的机器人还可以配送很多其他东西。比如在智能泊车停车场,泊车机器人可以将汽车自动运送到指定车位。在港口,货运机器人可以将轮船上卸载的集装箱运送到码头对应的存放区域。在工厂,AGV自主导航小车可以在各个产线之间帮忙运送各种生产原料以及成品。在养殖场,自主导航机器人可以完成饲料投喂以及农副产品收捡。

图19 智能泊车机器人

 

图20 港口集装箱货运机器人

 

图21 工厂AGV自主导航小车

 

图22 养殖场自动投喂机器人

当然生活中需要配送货物的场景绝不仅以上列举的这些,也就是说具备SLAM导航能力的配送机器人具有非常广阔的应用范围。

5.家庭服务机器人

所谓家庭服务机器人,简单点理解就是“机器人保姆”。端茶递水、扫地做饭、照看小孩、陪伴老人等,可以说服务机器人是机器人发展的终极目标之一。

图23 家庭服务机器人

当然这些功能非常炫酷的家庭服务机器人目前还比较少见,而更多是以智能玩具的角色出现。比如智能逗猫机器人、游戏对战机器人、教育陪伴机器人等。

图24 智能逗猫机器人

 

图25 大疆第一人称游戏对战机器人

 

图26 教育陪伴机器人

6.农业机器人

虽然人类已经踏进了工业化的时代,但农业依然还没有实现完全自动化。机器人(特别是搭载SLAM导航技术的自主移动机器人)在农业领域的应用,有望实现农业生产的完全自动化。比如农业采摘机器人、农药喷洒机器人、自动割草机器人等。

 

图27 农业采摘机器人

 

图28 农药喷洒机器人

图29 自动割草机器人

7.无人驾驶

有很多非技术的朋友会认为无人驾驶汽车只需要依靠事先人为制作的高精地图(比如谷歌地图、高德地图、百度地图等),然后利用GPS和IMU进行惯性导航,同时利用激光雷达、毫米波雷达、超声波雷达等进行避障就能实现无人驾驶了。其实仔细研究,显然没有这么简单。

如果无人驾驶汽车完全行驶在道路场景完全不变化的封闭理想环境下,也就是道路两旁的花草树木永远保持原样、马路永远不发生维修和扩建、马路两旁的建筑物永远保持原样不随时间更迭、马路上最好没有其他车辆。这样只需要给无人驾驶汽车导入事先人为制作好的高精地图,基于这个不变的高精地图无人驾驶汽车就可以实现高精度定位,并基于这个高精度定位以及避障传感器实现自主导航与避障。

但是上面这种理想的一成不变的道路场景在实际生活中是不存在的,只有在游戏世界中能保证。前几年国内一些巨头宣传自己的无人驾驶汽车能在实际道路上行驶,其实都是选在场景单一不确定性极小的封闭高速公路中测试的。这些公司其实也知道,以目前的技术水平无人驾驶汽车大概还只能在封闭理想环境下运行,以规避道路上的各种不确定性。但不管怎么说,无人驾驶是未来的趋势,这种趋势将势不可挡。

所以简单点说,就是因为无人驾驶汽车所工作的道路场景具有极大的不确定性,所以无人驾驶汽车离不开SLAM技术。因为SLAM解决了“先有鸡还是先有蛋”的问题,即可以应对多变复杂的路况,并实时更新环境地图和实时定位。其实SLAM是一种解决问题的思想,并不仅仅指代某种算法。SLAM的全称是同时定位与建图,也就是解决未知多变环境内的定位与环境建模问题。SLAM的具体实现非常之多,经典的激光SLAM、视觉SLAM、多传感器融合SLAM、以及各种AI技术与SLAM相结合的方案,可以说SLAM是一个非常开放的研究话题。

值得庆幸的是,目前在一些环境相对稳定的场景内无人驾驶已经得到了广泛的应用,比如校园通勤无人驾驶巴士、景区无人驾驶观光车、无人货运卡车、无人驾驶公交车等。

 

图30 校园通勤无人驾驶巴士

 

图31 景区无人驾驶观光车

图32 无人货运卡车

 

图33 无人驾驶公交车

8.特种作业机器人

曾经有这样一种说法,人类对地球海洋的了解可能比外太空还要少,足以见得对地球海洋的探索将具有极大的意义。由于深海是一个极具未知性、生存环境异常恶劣、人类通信技术很难讫及的地方,因此海底探索基本上要依赖水下机器人。水下机器人的自主导航与陆地机器人的自主导航既有许多相似性也有很多不同,比如SLAM导航技术在水下机器人中就不是基于激光雷达或视觉了,水下探测传感器主要依靠超声波传感器(也就是常说的声呐)。

图34 水下机器人

当前还有其他许多在特殊场合应用的机器人,这里统称为特种作业机器人。比如城市下水道检修机器人、核废物清理机器人、消防机器人、岩洞勘测机器人、垃圾回收机器人等。

图35 城市下水道检修机器人

 

图36 福岛核电站核废物清理机器人

图37 消防机器人

图38 岩洞勘测机器人

 

图39 垃圾回收机器人

9.军工机器人

很多先进的科技成果都是源于军工科技并且最早也是应用于军工,机器人其实也不例外。根据相关资料,很多年前美国发射的火星探测车上就已经应用了SLAM技术进行自主导航和环境探索。在遥远的外太空星球上,探测车在陌生环境的作业任务基本离不开SLAM技术。另外,还包括军事补给运输机器人、机器人士兵等。

图40 火星探测车

 

图41 军事补给运输机器人

 

图42 机器人士兵

10.其他

上面列举了大量SLAM在机器人中的应用案例,其实SLAM技术还在其他很多方面有广泛的应用,比如三维建模、国土测绘、AR/VR等。

对于一个房产经纪人,可以利用手持的SLAM建图特别快速扫描现场的房屋以得到三维户型信息,这样就可以快速将信息录入系统。房屋的三维户型信息不仅对房产经纪人有用,对装修公司、住户都有非常大的用处。

图43 手持SLAM建图仪

虽然借助于遥感卫星能对大致的地形地貌进行测绘,但更精细的测绘还是要借助于无人机之类的近距离测绘。通常会在无人机上搭载超远距离多线激光雷达进行SLAM建图,以完成对农田、湖泊、山丘等的精细测绘。

图44 测绘无人机

当然AR/VR就更少不了SLAM技术的支持了,可以说SLAM技术已经在慢慢渗透到生活的方方面面。

 

图45 SLAM技术在AR/VR中的应用

参考文献[1]张虎,机器人SLAM导航核心技术与实战[M].机械工业出版社,2022.

 

 

 

序前言编程基础篇第1章ROS入门必备知识1.1ROS简介21.1.1ROS的性能特色21.1.2ROS的发行版本31.1.3ROS的学习方法31.2ROS开发环境的搭建31.2.1ROS的安装41.2.2ROS文件的组织方式41.2.3ROS网络通信配置51.2.4集成开发工具51.3ROS系统架构51.3.1从计算图视角理解ROS架构61.3.2从文件系统视角理解ROS架构71.3.3从开源社区视角理解ROS架构81.4ROS调试工具81.4.1命令行工具91.4.2可视化工具91.5ROS节点通信101.5.1话题通信方式121.5.2服务通信方式151.5.3动作通信方式191.6ROS的其他重要概念251.7ROS2.0展望281.8本章小结28第2章C++编程范式2.1C++工程的组织结构292.1.1C++工程的一般组织结构292.1.2C++工程在机器人中的组织结构292.2C++代码的编译方法302.2.1使用g++编译代码312.2.2使用make编译代码322.2.3使用CMake编译代码322.3C++编程风格指南332.4本章小结34第3章OpenCV图像处理3.1认识图像数据353.1.1获取图像数据353.1.2访问图像数据363.2图像滤波373.2.1线性滤波373.2.2非线性滤波383.2.3形态学滤波393.3图像变换403.3.1射影变换403.3.2霍夫变换423.3.3边缘检测423.3.4直方图均衡433.4图像特征点提取443.4.1SIFT特征点443.4.2SURF特征点503.4.3ORB特征点523.5本章小结54硬件基础篇第4章机器人传感器4.1惯性测量单元564.1.1工作原理564.1.2原始数据采集604.1.3参数标定654.1.4数据滤波734.1.5姿态融合754.2激光雷达914.2.1工作原理924.2.2性能参数944.2.3数据处理964.3相机1004.3.1单目相机1014.3.2双目相机1074.3.3RGB-D相机1094.4带编码器的减速电机1114.4.1电机1114.4.2电机驱动电路1124.4.3电机控制主板1134.4.4轮式里程计1174.5本章小结118第5章机器人主机5.1X86与ARM主机对比1195.2ARM主机树莓派3B+1205.2.1安装UbuntuMATE18.041205.2.2安装ROSmelodic1225.2.3装机软件与系统设置1225.3ARM主机RK33991275.4ARM主机Jetson-tx21285.5分布式架构主机1295.5.1ROS网络通信1305.5.2机器人程序的远程开发1305.6本章小结131第6章机器人底盘6.1底盘运动学模型1326.1.1两轮差速模型1326.1.2四轮差速模型1366.1.3阿克曼模型1406.1.4全向模型1446.1.5其他模型1486.2底盘性能指标1486.2.1载重能力1486.2.2动力性能1486.2.3控制精度1506.2.4里程计精度1506.3典型机器人底盘搭建1516.3.1底盘运动学模型选择1526.3.2传感器选择1526.3.3主机选择1536.4本章小结155SLAM篇第7章SLAM中的数学基础7.1SLAM发展简史1587.1.1数据关联、收敛和一致性1607.1.2SLAM的基本理论1617.2SLAM中的概率理论1637.2.1状态估计问题1647.2.2概率运动模型1667.2.3概率观测模型1717.2.4概率图模型1737.3估计理论1827.3.1估计量的性质1827.3.2估计量的构建1837.3.3各估计量对比1907.4基于贝叶斯网络的状态估计1937.4.1贝叶斯估计1947.4.2参数化实现1967.4.3非参数化实现2027.5基于因子图的状态估计2067.5.1非线性最小二乘估计2067.5.2直接求解方法2067.5.3优化方法2087.5.4各优化方法对比2187.5.5常用优化工具2197.6典型SLAM算法2217.7本章小结221第8章激光SLAM系统8.1Gmapping算法2238.1.1原理分析2238.1.2源码解读2288.1.3安装与运行2338.2Cartographer算法2408.2.1原理分析2408.2.2源码解读2478.2.3安装与运行2588.3LOAM算法2668.3.1原理分析2668.3.2源码解读2678.3.3安装与运行2708.4本章小结270第9章视觉SLAM系统9.1ORB-SLAM2算法2749.1.1原理分析2749.1.2源码解读3109.1.3安装与运行3199.1.4拓展3279.2LSD-SLAM算法3299.2.1原理分析3299.2.2源码解读3349.2.3安装与运行3379.3SVO算法3389.3.1原理分析3389.3.2源码解读3419.4本章小结341第10章其他SLAM系统10.1RTABMAP算法34410.1.1原理分析34410.1.2源码解读35110.1.3安装与运行35710.2VINS算法36210.2.1原理分析36410.2.2源码解读37310.2.3安装与运行37610.3机器学习与SLAM37910.3.1机器学习37910.3.2CNN-SLAM算法41110.3.3DeepVO算法41310.4本章小结414自主导航篇第11章自主导航中的数学基础11.1自主导航41811.2环境感知42011.2.1实时定位42011.2.2环境建模42111.2.3语义理解42211.3路径规划42211.3.1常见的路径规划算法42311.3.2带约束的路径规划算法43011.3.3覆盖的路径规划算法43411.4运动控制43511.4.1基于PID的运动控制43711.4.2基于MPC的运动控制43811.4.3基于强化学习的运动控制44111.5强化学习与自主导航44211.5.1强化学习44311.5.2基于强化学习的自主导航46511.6本章小结467第12章典型自主导航系统12.1ros-navigation导航系统47012.1.1原理分析47012.1.2源码解读47512.1.3安装与运行47912.1.4路径规划改进49212.1.5环境探索49612.2riskrrt导航系统49812.3autoware导航系统49912.4导航系统面临的一些挑战50012.5本章小结500第13章机器人SLAM导航综合实战13.1运行机器人上的传感器50213.1.1运行底盘的ROS驱动50313.1.2运行激光雷达的ROS驱动50313.1.3运行IMU的ROS驱动50413.1.4运行相机的ROS驱动50413.1.5运行底盘的urdf模型50513.1.6传感器一键启动50613.2运行SLAM建图功能50613.2.1运行激光SLAM建图功能50713.2.2运行视觉SLAM建图功能50813.2.3运行激光与视觉联合建图功能50813.3运行自主导航50913.4基于自主导航的应用51013.5本章小结511附录ALinux与SLAM性能优化的探讨附录B习题

人工智能时代机器人外科诊疗进展及展望

黄沙,何哲浩,王志田,汪路明,张翀,吕望,胡坚

浙江大学医学院附属第一医院胸外科(杭州 310003)

通信作者:胡坚,Email:dr_hujian@zju.edu.cn

关键词: 人工智能;机器人手术;胸外科;智能化手术流程

引用本文:黄沙,何哲浩,王志田,汪路明,张翀,吕望,胡坚.人工智能时代机器人外科诊疗进展及展望.中国胸心血管外科临床杂志,2019,26(3):197-202.doi:10.7507/1007-4848.201812043

点击查看本文图表

全文

近年来,随着各种智能设备与技术不断融入人们日常生活,例如手机智能助理、语音文字识别、生物识别、自动驾驶技术、扫地机器人等。我们对人工智能(artificialintelligence,AI)这个名词愈发熟悉。人工智能技术正进行着全方位的渗透,当然医疗领域也不例外。

AI是用于模拟和扩展人类智能的理论方法、技术手段及应用系统的一门学科[1]。其利用机器学习技术,使用通用的学习策略,可以从数据中发现规律或联系,因此能够根据新数据自动调整,而无需重设程序算法。AI中有三大分支同医疗关系最密切,分别是专家系统、人工神经网络和数据深度挖掘。当今时代AI在医疗的布局涵盖院前管理、院内诊疗、院后康复和药物研发,涉及的方面从慢病管理到医学影像、辅助决策和诊疗的方方面面。目前AI在医疗最成功的商用代表是由IBM与纪念斯隆-凯特林癌症中心(MemorialSloan-KetteringCancerCenter,MSK)联合开发而成的Watson系统。它采集了近1500万页医学资料,综合运用MSK享誉全球的癌症专业知识与IBMWatson的分析速度为患者提供个性化癌症治疗方案,加上其具备机器学习功能,能够持续学习肿瘤学研究成果。

现今,AI技术开始在胸外科领域进行了探索,并且在胸外科相关影像与病理判读方面取得一定突破,未来AI也将在代表胸外科手术最高智能化的手术机器人上持续发力,本文将对AI与机器人外科的结合作一讨论。

1  人工智能在胸外科的应用现状

计算机断层扫描(computedtomography,CT)是胸外科医生检测肺结节最常见且最基本的技术,是肺癌筛查和诊断的主要临床手段。现阶段的筛查是由人工阅片完成的,但随着筛查人数的快速增长,高分辨率CT的图像数增加至上百张,人工处理图像的方法越来越难胜任此项任务,因此AI辅助医生显得必要且高效。得益于卷积神经网络(convolutionalneuralnetwork,CNN)的兴起,机器学习的技术在影像识别领域取得了显著的进步,CNN的学习过程模拟了动物视觉皮层组织,一个成功训练的CNN模型可以在预处理信息的过程中构建层次信息[2]。目前已有报道,针对局部征象的CNN模型快速成功地识别出胸部X线片中的各类病灶,包括:结节、间质影、胸膜牵拉、气胸、实体占位、心脏肥大等[3]。另有一些深度学习模型对肺癌筛查的计算机辅助检测(computer-aideddetection,CAD)系统进行了评估,在肺结节分类及恶性风险预测方面显示出相当大的可行性[4-5]。肺结节CAD技术通过各类分析算法实现了胸部CT图像中肺实质的分割、肺结节的分割与检测以及肺结节良恶性判断等[6]。Ciompi等[7]提出一种基于CNN的肺结节自动分类法,其性能强大可媲美临床专家,另外王媛媛等[8]的研究表明CNN对于CT/PET-CT多模态图像识别有良好的效果,能实现较高的肺部肿瘤识别率。虽然CNN能更加准确快速地识别肺结节,但目前仅有少数方法通过结合AI深度学习与CT影像来识别肺结节。

病理阅片与CT影像在胸外科虽属不同范畴的诊断手段,但有异曲同工之处:两者均依赖视觉图像;两者均面临繁重的工作量。AI在合适的阶段介入了病理诊断领域并有替代人工诊断的势头。Koller和他的同事基于机器学习技术开发了一套病理切片的肿瘤识别工具,称为C-Path[9]。其能够在细胞上皮与基质中分辨细胞核与细胞质的毗邻关系,确定胞核的大小与定位。C-Path经过不断的训练,可以实现肿瘤识别,甚至利用病理结果、基因背景以及临床特征,多维度预测患者预后[10]。AI病理识别模型已经在乳腺癌与胃癌领域大放异彩[11],相信不久的将来就能有辅助诊断肺癌、食管癌或胸腺瘤的AI出现。

上述AI的技术应用更偏向于辅助诊断,但对于胸外科医生来说,手术是核心,且常使用例如达芬奇机器人这类全球顶尖外科机器人技术来完成胸外科手术。据美国直觉公司的统计,2017年胸外科达芬奇机器人手术量已占全美胸外科手术的12%,高精尖科技与胸外科结合已大势所趋,那么同为高端技术代表的AI在机器人手术中已有何种应用?并将会碰撞出何种火花呢?

2  机器人手术应用进展

如果说1985年由美国洛杉矶医院研制的脑组织活检定位机器人Puma560的出现代表着手术机器人的开端,那么2000年IntuitiveSurgical公司推出的 daVinci®机器人就标志着外科正式进入了手术机器人时代。达芬奇手术机器人系统凭借多种核心技术:高清视觉、直觉操作、人体工程学控制台和高自由度仿真手腕等,成为了全世界应用最广、最先进的手术机器人,其应用范围涵盖心胸外科、普外科、泌尿外科等数十个学科。

近10年来,电视胸腔镜辅助胸外科手术(video-assistedthoracicsurgery,VATS)和机器人辅助胸外科手术(robot-assistedthoracicsurgery,RATS)共同组成了胸外科的微创外科(minimallyinvasivesurgery,MIS)理念。MIS下的胸外科手术出血量少、患者术后疼痛减轻、住院时间明显缩短、安全性高、围术期死亡率低。VATS的运用已趋于成熟规范化,处于平台期,是目前胸外科手术的主流;RATS对比VATS有局部优势,擅长解剖狭窄部位,可以拓展至更复杂的手术,譬如支气管袖状切除或局部晚期手术,RATS下主刀舒适性提高,手术团队获益,并且容易上手,对于成熟胸外科医生来说仅需20台次的训练即可掌握。然而RATS在解剖性肺叶切除术中对比VATS无明显的优势[12]。RATS虽是高端手术技术的代表,仍处于探索期,需要不断发展前进。手术机器人的发展已从常规优化进一步迈向从非智能状态向初-中级智能化的创新变革。

2.1  微创化

机器人手术的微创化目前有两大改变,一个是机器人操作孔的改变;另一个是机器人操作臂的改变。单孔(single-port)技术的发展使得机器人手术常规需要的4个操作孔变为1个,手术机器人的器械与内镜经由单孔多通道的Port交叉进入术野,加上远端固定点技术可以减少对Port的牵拉,机器人手术到达了微微创的程度。

机械臂单孔化作为机器人微创化的另一大思路,目前已有成熟产品面世:daVinci®SP系统,其通过将3个仿生手腕工具和摄像臂集于2.5cm的单孔套管内,实现单孔化手术,并可深入腔体内部达24cm,不受局限地完成手术。

2.2  多功能化

手术机器人的多功能化之一是术中光学示踪—使用额外的荧光激发与接收设备实现关键解剖部位的结构识别。其基本原理是利用吲哚菁绿(indocyaninegreen,ICG)与白蛋白结合的特性,且ICG受激发后能够发出近红外(near-infrared,NIR)荧光。NIR自发荧光效应低并具有较强的组织穿透能力,这些特性造就了ICG结合于MIS后有诸多的应用,包括可视化血管、评估吻合口的灌注、寻找前哨淋巴结、判断段间平面等[13]。

机器人手术术中超声定位是肺结节实时定位的又一项新技术,其实质是机械臂的多功能化—机器人专用探头的彩色多普勒超声扫描诊断仪可对靠近膈面、纵隔面、肩胛骨等部位、难以行CT引导下定位操作的结节进行快速术中定位。研究表明,术中超声定位并未延长手术时间,同时还具有减少出血量,缩短住院时间等优势[14]。同样,有团队运用胃镜在食道病灶处放置金属标记夹,配合超声进行定位后完成MIS下食管癌切除术[15]。

手术机器人多功能化之三为短距离放疗。Xoft®的近距离放疗系统配合达芬奇机器人实现了术中放疗,该产品的球囊施源器能通过1cm的穿刺器,将放射剂量精准施加在可疑残留肿瘤细胞的区域,显著降低局部肿瘤复发可能性,延长生存期,提高肿瘤综合治疗效果。相较于传统外放射治疗,短距离放疗优势在于能达到更高的局部放射剂量并减少治疗总周期。随着技术革新与人工智能算法的辅助,胸部放疗机器人也应运而生。近日,Dou等[16]报道了一种新型的CT引导下机器人辅助肺癌近距离放疗系统,该系统拥有较高的准确度与可重复性,通过放疗规划系统地控制实现靶向部位的自动定位后穿刺。虽然全世界范围内目前正式临床化与商业化的短距离放疗机器人系统寥寥无几,且仅有的放疗机器人针对的靶器官几乎都是前列腺,至于针对其他靶器官放疗系统的成熟产品更是仍在摇篮中[17],但是放疗是肺癌综合治疗重要的一环,机器人辅助下的胸部放疗系统是未来开拓的方向,在缩短人工操作时间的同时又能提高病灶定位与治疗范围评估的准确性。

短距离放疗机器人背后的技术保证正是手术机器人多功能化之四:穿刺机器人。ROBIOTM EX作为当今操作性机器人的代表,是一种CT和PET-CT引导的机器人定位系统,机器人的辅助有助于快速准确地定位肿瘤、放置工具,适用于腹部和胸部的介入手术,包括活检、细针抽吸细胞学检查、疼痛治疗、引流和肿瘤消融。

2.3  一体化

一体化的目标是将多功能化的产品均在一种设备上实现,这就要求单个功能的微型化和集成化,例如术中光学示踪的实现需要近红外激发与接收设备,实际上,机器人技术已将荧光染料与达芬奇机器人专用的相机头、内窥镜和激光光源结合在一起。外科医生现在可以在三维组织表面下实时识别脉管系统,同时也可以观察关键解剖结构[18]。

高端技术的杂交使得机器人手术更加高效、安全和精准。对于胸外科医生来说,肺癌冰冻病理决定着一部分患者的手术是行亚肺叶切除术还是肺叶切除术,许多胸外科医生都有苦苦等待冰冻病理结果的时候,而当今机器人手术一体化技术另一令人兴奋的突破为术野实时病理。显微内镜的发明使体内、原位、实时的组织学细胞学诊断站上了病理学的舞台,使高效的切缘病理分析、实时组织活检成为现实[19]。显微内镜经过几代技术革新达到仅需毫米级微型生物光子探头就可实现细胞水平成像,且可以完美辅助于达芬奇机器人系统。显微内镜与机器人系统一体化通过两种方式实现,一是将探头结合在达芬奇机械臂的持针手腕上;二是作为独立的机械臂[20]。另外,新型力感应显微内镜探头增加了在复杂、大面积的三维表面上获取类似组织学图像的能力[21]。共聚焦显微内镜技术可提供大面积、高分辨率的图像,这些都是组织识别与切缘评估的重要保障[22]。Lopez等[23]将正式病理切片图像与通过大面积、高速、深度扫描而获得的高分辨率显微图像进行比对时发现了两者高度契合,这令人不禁对组织影像诊断学充满信心。也不禁令人联想到:AI的深度学习功能可通过学习HE染色病理切片的诊断模型进而识别显微内镜图像中相应细胞结构,最终达到术野实时的AI病理评估。

手术机器人的微创化、多功能化和一体化代表着当今最先进的机器人手术技术,但是胸外科医生们是否满足于此呢?达芬奇机器人手术系统是外科医生操作机械臂手术的人机协作型机器人,它不能代表人工智能化的手术,并且达芬奇机器人系统是“全科”机器人,面对日益细分学科的外科,其不能胜任专科任务。因此,具备智能诊断并提供全功能手术解决方案的高智能化手术机器人是未来,是变革的方向。

3  机器人手术的未来

得益于CNN技术和机器学习的进步,我们相信,机器人手术将更加智能。抱着使患者利益最大化的宗旨,AI化的机器人手术流程贯穿术前到术中直至手术完成,包括术前智能诊断、预测术中风险、智能选择方案到术中病灶定位识别并通过快速现场细胞学评估(rapidonsitecytologicalevaluation,ROSCE)强化诊断,以期进一步评估或修订手术方案、优化术式;见图1。AI的加入绝不是与医疗技术两者间生硬的加法,而是作为桥梁,是连结现有各项诊疗技术孤岛的跨海大桥。

3.1  术前规划

胸外科医生术前规划最常依赖于CT,但CT提供的断层图像不够直观,因此应运而生的胸部CT三维重建技术加上三维数字软件将患者全肺图像立体化,可清楚显示病灶所属肺段,清晰观察器官内部、占位与血供。有经验的主刀医生甚至可以在脑海中预演一遍开刀全过程。那么为何不让AI来完成这部分预手术的全过程?深度学习并能自我推演、模拟的AI利用顶尖胸外科医生手术知识和经验,依托数字化三维肺部重建的数据仿真各类胸外科手术全过程,可视化展现手术方案与步骤,上传数据至达芬奇机器人系统以实时辅助主刀,制定手术切除范围,计算患者术后肺残量,预测阳性淋巴结,最终针对患者完成标准化的精准手术。

3.2  术中导航

如果将完成机器人手术的主刀医生与民航飞行员做个类比,我们不难发现,两者均需要实时的操作“窗口”,看清目标的“相机”,保驾护航的各类“传感器”,实现精细操作的“机翼”,以及至关重要的“导航”系统和“地图”。胸外科医生虽然可以做到“起飞”前的路径规划,达到最终目标,但“航线”偏差也是可能的事,因此眼见为实的实时病灶或淋巴结定位就显得非常必要。

多中心、前瞻性研究显示,利用放射性胶体和蓝色染料的双示踪可绘制胃癌的前哨淋巴结(sentinelnode,SN)分布地图。肺癌、食管癌中的SNs广泛分布于颈部至腹部,其转移模式不可预测,因此SN导航不仅能作为检测淋巴结转移的准确诊断工具,也可针对SN行个体化淋巴结清扫或预防性照射,而且借助AI的分析力其也能作为早期肺癌、食管癌患者预后分层的工具[24]。鉴于SN导航技术的进步,机器人系统下可视化SN导航技术可以辅助主刀完成优先、精确的淋巴结清扫术。

机器人术中超声是术中导航的另一解决方法,它能实时观察到结节,但超声特异度和准确率仍不够理想,且易受干扰。不过利用AI强大的学习能力,完全可以弥补既有的缺陷,通过大样本量建立肺结节术前CT-术中超声-术后病理的多模态模型,实时分析术中采集的超声图像完成病灶定位。我们可期超声定位与AI的技术融合将开创术中肺结节自动识别的时代!说到结节定位,另外一项不得不提的技术为电磁导航支气管镜。目前证明电磁导航引导下经皮肺活检诊断肺部结节是安全、可行的[25];经电磁导航引导放置染色标记物,对肺部小结节进行定位也同样是安全有效的[26]。

上述技术可谓是内外科融合的典范。那么我们完全可以大胆设想磁导航与机器人手术结合,经磁导航引导定位放置“标记物”以标定结节,AI将借助达芬奇机器人系统的高清视野通过光学、影像学、染色标记物等最终识别结节,并在主刀视野中显示方位。未来“里应外合”的杂交技术完全可以将肺结节定位准确率提高至100.0%。

3.3  术中强化诊断

ROSCE是以快速现场细胞学评价为核心,实时伴随于病灶标本取材过程的快速细胞学判读技术。随着平台与学科的交叉融合,基于ROSCE的手术方式选择、切除范围界定、淋巴结清扫范围确定、最佳方案的决定可交由AI做辅助判断。三大技术保障术中强化诊断:非离体的密闭空间内组织标本处理技术;集成适用于病理诊断显微镜的机器人操作臂;AI病理诊断系统。手术方案不仅仅由主刀经验或者临床指南来制定,而是基于影像-病理-术式-预后模型的AI最优方案推荐。高新技术服务于临床,辅助胸外科医生决策,缩短手术时间的同时使RATS达到真正的微创化。

3.4  辅助手术

AI辅助达芬奇机器人手术绝非技术突破后一朝一夕就可实现,因为AI也如同人类需要学习,在千万次学习与反馈后,成熟的AI才能真正辅佐主刀医生,包括:R0切除前提下依赖影像-实时病理-预后模型的最优切缘的划分,以期最大程度保留患者肺功能;结合术中超声,AI展示病灶周围血管、支气管的毗邻关系;虚拟展示不同切割边界时肺残量容积;利用靶段温度区分法判断段间平面[27];为主刀挑选最合适的切割吻合器与钉仓。

另外,达芬奇机器人成像系统的AI化是足以改变传统外科学手术方式的技术。增强现实(augmentedreality,AR)技术将虚拟图像带入现实,目前AR依靠AI强大的解析能力,可以在RATS上实现三维虚拟现实模型的展现,术中应用于实时视频图像的叠加,“透视”解剖结构[28]。采集并数字化每例患者的CT数据,构建基于生物力学模型的器官变形预测,可以在手术操作时和呼吸运动过程中提供肺部的实时三维图像,个性化展现气管、动静脉等解剖结构。叠加在RATS主刀视野上的AR解剖图像能遵循主刀提拉器官等操作时的组织形态变化而动态改变。基于图像特征的形态变化检测与力检测功能,也同时解决了达芬奇机器人没有力反馈的缺陷。

手术常伴随着风险,通常对于紧急情况的处置依靠于主刀医生的经验,但术中的情况千变万化,不能保证每一次突发状况主刀都有相应的经验储备,然而AI就可以成为术中风险处置的“百科全书”。AI依托大数据收集所有术中意外情况,并给出相应处理模式;依托影像基础,对实际情况进行分析,辅助主刀医生找到破裂血管,突破人眼受术区模糊干扰的限制;AI也可以警惕主刀医生的危险性动作,规避各类风险。AI的局部全掌控,将尽可能保留患者功能,从此机器人手术进入零并发症时代。

3.5  专科手术机器人

科学的飞速发展、社会需求的日益复杂,使得知识体系内部“分化”和“碎片化”的状况与外部要求的“综合”和“应用性”之间的冲突愈益频繁。譬如医学的发展何尝不是分分合合呢,手术机器人也正经历着分化、综合、再分化的过程。达芬奇机器人的器械对于各类手术都是通用的,通用机器人远远不能满足现代医学的需要,因此应运而生的专科机器人正崭露头角。

骨科的全膝关节置换机器人用于塑造患者股骨、胫骨和髌骨。神经外科的Remebot,具有自动三维建模、立体定向定位、多靶点路径规划、多功能手术台、标志点精准识别、病灶体积计量等功能,适用于近百种神经外科手术。血管外科有微创心血管介入手术机器人,通过人机对话方式在导航系统引导下利用机械手为患者进行精确的血管介入手术[29]。

那么,胸外科的手术机器人呢?我们大可期待于多学科交叉的共同研发,未来的肺癌手术机器人、食管癌手术机器人、纵隔手术机器人等等会服务于胸外科医生。专科手术机器人将是整合术前规划-术中导航-术中辅助等全智能化手术流程的精准胸外科手术工具,高度的智能化甚至可一定程度替代主刀医生的操作。随着外科机器人系统的发展,机器人辅助手术的未来进展将会使我们能够进一步了解胸腔和纵隔的显微解剖,执行精细的手术操作,精准外科时代将来临。

4  结语

机器人手术路在何方?我们认为,路在脚下,在于高新技术不断积累和转化下奠定的基础。目前手术机器人发展态势良好,据估计2021年该市场将达到200亿美元,虽然IntuitiveSurgical垄断着全球手术机器人的市场,但国内国外已经有越来越多的巨头企业和医疗机构加入了医疗机器人的研发。另一方面,AI的兴起给手术机器人带来了更多的可能性,多学科协作下的学科交叉必然引起机器人手术方式的质变,可以确定地说:机器人手术智能化是必然趋势。

AI不能完全替代人脑,对于未知的情况无法分析,因此无法处置千变万化的手术和复杂情景,并且缺少一个很重要的能力:情感,这意味着诊疗不能因人、因情、因事而区别对待。相信在不久的将来,AI能很好地辅佐胸外科医生进行医疗活动。虽然当下铺天盖地打着AI标签的技术充斥着我们的视线,但AI时代才刚刚拉开帷幕,并且我们应当认识到高端AI代表着人类社会的发展方向,因此支持并参与到AI辅助医疗的开发中去是新时代医生们的使命。

运动控制在智能机器人中的应用及发展前景

运动控制在智能机器人中的应用及发展前景

文:天津巨龙科技有限公司蔡明晨2018年第五期

  摘要:运动控制技术已成为机电一体化的关键技术。本文介绍了机器人的分类以及各种应用方向,分析了不同运动控制在机器人上的应用与发展现状。介绍了智能移动机器人技术的发展现状,以及世界各国智能移动机器人的发展水平,然后讨论了运动控制在智能移动机器人中的发展趋势以及对未来技术的展望。

关键词:智能移动机器人;运动控制;发展前景、

前言

  机器人是一种可编程和多功能的,用来搬运材料、零件、工具的操作机,或是为了执行不同的任务而具有可改变和可编程动作的专门系统。智能移动机器人则是一个在感知-思维-效应方面全面模拟人的机器系统,外形不一定像人。它是人工智能技术的综合试验场,可以全面地考察人工智能各个领域的技术,研究它们相互之间的关系。还可以在有害环境中代替人从事危险工作、上天下海、战场作业等方面大显身手。一部智能移动机器人应该具备三方面的能力:感知环境的能力、执行某种任务而对环境施加影响的能力和把感知与行动联系起来的能力。智能移动机器人与工业机器人的根本区别在于,智能移动机器人具有感知功能与识别、判断及规划功

  随着智能移动机器人的应用领域的扩大,人们期望智能移动机器人在更多领域为人类服务,代替人类完成更复杂的工作。然而,智能移动机器人所处的环境往往是未知的、很难预测。智能移动机器人所要完成的工作任务也越来越复杂;对智能移动机器人行为进行人工分析、设计也变得越来越困难。目前,国内外对智能移动机器人的研究不断深入。

  高速度高精度的运动控制是工业机器人的优势。工业机器人固定在工位上完成相应的搬运,焊接,喷涂,抛光,上下料等工作,工作效率很高。但在工厂换线的时候需要对机器人进行重新布局和编程,造成工厂停工时间长。而协作机器人布局灵活,可以装在移动平台上,提高了机器人的运动能力和产线的柔性,可以灵活部署。最近几年大公司对机器人移动能力的方向非常关注,有很多起对移动机器人的收购兼并案例。而各种各样的服务机器人对运动能力的要求更是有增无减,波士顿动力的ATLAS机器人的运动能力就达到相当高的水准。

1、智能机器人发展现状

  智能移动机器人是第三代机器人,这种机器人带有多种传感器,能够将多种传感器得到的信息进行融合,能够有效的适应变化的环境,具有很强的自适应能力、学习能力和自治功能。

  目前研制中的智能移动机器人智能水平并不高,只能说是智能移动机器人的初级阶段。智能移动机器人研究中当前的核心问题有两方面:一方面是,提高智能移动机器人的自主性,这是就智能移动机器人与人的关系而言,即希望智能移动机器人进一步独立于人,具有更为友善的人机界面。从长远来说,希望操作人员只要给出要完成的任务,而机器能自动形成完成该任务的步骤,并自动完成它。另一方面是,提高智能移动机器人的适应性,提高智能移动机器人适应环境变化的能力,这是就智能移动机器人与环境的关系而言,希望加强它们之间的交互关系。

  智能移动机器人涉及到许多关键技术,这些技术关系到智能移动机器人的智能性的高低。这些关键技术主要有以下几个方面:多传感信息耦合技术,多传感器信息融合就是指综合来自多个传感器的感知数据,以产生更可靠、更准确或更全面的信息,经过融合的多传感器系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性;导航和定位技术,在自主移动机器人导航中,无论是局部实时避障还是全局规划,都需要精确知道机器人或障碍物的当前状态及位置,以完成导航、避障及路径规划等任务;路径规划技术,最优路径规划就是依据某个或某些优化准则,在机器人工作空间中找到一条从起始状态到目标状态、可以避开障碍物的最优路径;机器人视觉技术,机器人视觉系统的工作包括图像的获取、图像的处理和分析、输出和显示,核心任务是特征提取、图像分割和图像辨识;智能控制技术,智能控制方法提高了机器人的速度及精度;人机接口技术,人机接口技术是研究如何使人方便自然地与计算机交流。

  在各国的智能移动机器人发展中,美国的智能移动机器人技术在国际上一直处于领先地位,其技术全面、先进,适应性也很强,性能可靠、功能全面、精确度高,其视觉、触觉等人工智能技术已在航天、汽车工业中广泛应用。日本由于一系列扶植政策,各类机器人包括智能移动机器人的发展迅速。欧洲各国在智能移动机器人的研究和应用方面在世界上处于公认的领先地位。中国起步较晚,而后进入了大力发展的时期,以期以机器人为媒介物推动整个制造业的改变,推动整个高技术产业的壮大。

2、运动控制技术的发展及应用前景

  随着机电一体化技术的发展,世界各国对运动控制技术越来越重视。各种运动控制的新技术、新产品如雨后春笋层出不穷。下面介绍几种有代表性的运动控制技术。

2.1全闭环交流伺服驱动技术(FullClosedACServo)

  在一些定位精度或动态响应要求比较高的机电一体化产品中,广泛使用数字式交流伺服系统。这种伺服系统的驱动器对电机轴后端部的光电编码器进行位置采样,在驱动器和电机之间构成位置和速度的闭环控制系统。位置控制分辨率高,可靠性好。

  通常情况下,带位置环的伺服系统,位置环的反馈采样取自伺服电机的编码器,对于传动链上的间隙及误差还不能补偿克服,只能形成半闭环的位置控制系统。日本松下公司新近推出了一种更加完善、可以实现更高精度的全闭环全数字式的伺服系统。该系统克服了上述半闭环系统的缺陷,位置环的采样可以直接采自装在最后一级机械上的位置反馈元件(如光栅尺、磁栅尺、旋转编码器等),而电机上的编码器此时仅作为速度环的反馈,这样就可以消除机械存在的一些间隙,并且该伺服系统还可以对机械传动上出现的误差进行补偿,达到真正全闭环的功能,实现高精度的位置控制。该系统广泛应用于数控机床等高精度数控设备。

2.2直线电机驱动技术(LinerMotorDriving)

  近几年来,直线电动机在机床进给伺服系统中的应用,已在世界机床行业得到重视。在机床进给系统中,采用直线电动机直接驱动与原旋转电动机传动的最大区别是前者取消了从电动机到工作台之间的一切机械传动环节,把机床进给传动链的长度缩短为零。这种传动方式被称为零传动!。正是由于这种零传动!方式,带来了原旋转电动机驱动方式无法达到的优良性能和特点:一是响应快。由于系统中取消了一些响应时间常数较大的机械传动件如丝杠等,使整个闭环控制系统动态响应性能大大提高。二是精度高。直线驱动系统取消了由于丝杠等机械机构引起的传动误差,减少了插补时因传动系统滞后带来的跟踪误差,故大大提高了机床的定位精度。三是传动刚度大。由于直接驱动,避免了启动、变速和换向时因中间传动环节的弹性变形、摩檫磨损和反向间隙造成的滞后现象,大大提高了其传动刚度。四是速度快且加减速过程短。直线电机最早应用于磁悬浮列车(速度可达8300M/min),故在机床进给驱动中使用直线电机,完全可以满足机床超高速切削的最大进给速度(60(100M/min)。也是由于其高速响应性,使其加减速过程大大缩短。五是行程长度不受限制。在导轨上通过串联直线电机,可以无限延长其行程长度。六是运动安静。由于取消了丝杠等部件的机械摩檫,且导轨又可采用滚动导轨或磁悬浮导轨,其运动时噪音大大降低。七是效率高。由于无中间传动环节,消除了机械摩檫时的能量损耗,提高了传动效率。因此该系统广泛应用于磁悬浮列车、高精度机床等设备。

  运动控制主要包括:位置控制、速度控制、加速度控制、转矩或力矩控制;运动控制的按照动力实现方式不同,可以分为电机传动,气动和液压。工业机器人主要采用交流伺服电机控制系统,交流伺服运动控制的趋势基本上也是机器人运动控制的趋势,比如性能提升,智能化,模块化和网络化等。而服务机器人的运动控制方式更加多样化,技术路径更加丰富多彩。

2.2.1电机的应用:移动机器人平台和小型人形机器人平台

  电机控制在机器人中应用广泛,特别是在人形机器人和移动平台中,至少用几十个电机,多的上百个电机。

2.2.2液压和电机的混合应用:人形机器人

  美国DARPA(美国国防部先进研究项目局)举行的机器人比赛是展现人形机器人最先进能力的比赛,比赛的机器人主要有两种不同的技术路线,纯电机驱动和液压电机混合驱动,但实际情况是除了ATLAS是液压外其他都是电机驱动。2015年大赛的第一名是韩国KAIST的机器人,全部运用电机方案,驱动80公斤重的机器人,需要的电机不仅数量多,电机的功率要求也高。第二名是波士顿动力的ATLAS,它是液压和电机混合驱动的,主要的动力来自于液压驱动,只有一些关节部分由于空间限制采用了电机。

3、运动控制发展前景

  运动控制市场很大程度上取决于下游机械设备制造行业的景气度,其中,机床行业是运动控制产品最大的下游市场。据IHS估算,2015年机床(金属切削机床、金属成形机床)超运动控制销售额的40%,特别是数控产品高度集中于机床行业,超过八成的数控产品销售额来自于该行业。IHS季度机械行业追踪数据显示机床行业在连续两年的增长后,2015年出现下滑,特别是在亚太及美国市场的大幅下滑。中国是全球最大的机床生产及消费国,随着经济增速及行业投资的放缓,金属切削及成形机床均在2015年出现两位数下滑,严重冲击运动控制市场需求。美国机床行业同样遭遇寒冬,行业数据显示,2015年机床行业订单比2014年减少17.4%。其他传统自动化行业,如橡胶、塑料、纺织、造纸等行业需求低迷。食品饮料、包装机械等消费品相关的下**业的需求稳定。此外,机器人和智能手机相关的电子装联行业表现突出,强力支撑通用运动控产品的需求。

  全球宏观经济形势及机械设备行业表现是深度影响运动控制市场走势的两大主要因素。IHS连续多年追踪全球运动控制市场行情的数据显示,该行业在近些年随着全球经济环境的转变及下流产业的需求变化呈现猛烈波动的趋势。

  工业4.0、智能制造、工业物联网等概念的深入推广与逐步落地,极大地推动了运动控制产品在工业以太网、模块化及分布式伺服驱动器、深度软件开发等领域的发展。目前,现场总线仍是伺服驱动器及控制器的主流通讯技术,2015年分别有53.5%及79.4%的驱动器及运动控制器通过现场总线连接网络。随着工业4.0,工业物联网的推广,要求实时、高效的工业设备通讯。IHS预计2015-2020年工业以太网技术在运动控制市场的应用将保持年均近20%的高速增长,逐步取代现场总线技术。在众多工业以太网协议中,西门子主导的PROFINET与罗克韦尔推行的EtherNet/IP受益于两大公司在PLC及运动控制市场的主导地位,将保持强势增长,此外,倍福主导研发的EtherCAT技术因其开源性在近年来越来越多地受到运动控制厂商的认可,增速高于其他应用于运动控制产品的通讯协议。IHS预计截至2020年,超六成的驱动器及近三成的运动控制器采用工业以太网技术。

4、结论

  运动控制市场依赖机床、包装机械、机器人、半导体、电子等下游机械行业,随下游市场波动较大。随着行业应用的不断拓展,工业智能化和网络化的深度推进,运动控制市场将走向更加成熟、稳健的发展轨道。

运动控制,智能机器人

中传动网版权与免责声明:

凡本网注明[来源:中国传动网]的所有文字、图片、音视和视频文件,版权均为中国传动网(www.chuandong.com)独家所有。如需转载请与0755-82949061联系。任何媒体、网站或个人转载使用时须注明来源“中国传动网”,违反者本网将追究其法律责任。

本网转载并注明其他来源的稿件,均来自互联网或业内投稿人士,版权属于原版权人。转载请保留稿件来源及作者,禁止擅自篡改,违者自负版权法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇