高科技与产业化
近日,中国工程院院士、湖南大学教授王耀南在2021世界机器人大会上表示,未来机器人一定是朝着自主化更强,容错性更好的多机协作方向发展。机器人的发展态势应该是网络化、自主化、协同化、灵巧化。机器人要发展好,首先一定要规划好,第二要有一个好的创新环境,第三机器人一定要有标准,第四人才是关键。以下为现场报告整理。
机器人在智能时代发挥重要作用
人类从机械化发展到电器化、信息化,今天已经进入智能化时代,机器人在智能化时代中发挥着重要的作用。最早的机器人可以追溯到中国东汉时期,如无人车、指南车。真正的现代机器人是出现在1978年的工业机器人,其被广泛地应用到机器生产线、电子和汽车生产线——从这时起工业机器人和机器人才真正在产业方面被发挥应用。
近几年来,机器人已经在各大领域发挥重要作用,成为高端装备、智能制造的核心重要工具,同时也是推动重大装备加工、测量、检测等的重要引擎和工具。如今机器人在重大工程当中也发挥着重要的作用,在重大工程建模、运维、维护等各个方面,都有机器人的参与。机器人在重大基础设施建设和运维方面,都已发挥不可替代的重要的作用。
近年来我国制造业不断转型升级,劳动力的短缺加速推动了机器人的发展。当前全球多个发达国家都非常重视机器人产业,美国、德国、中国和日本四国是其中发展最迅速的,均发布了各自的产业规划。
无论是工业机器人、服务机器人还是特种机器人,简单而言,机器人就是光机电一体化的机械化装置。近几年间在机械化装置发展下,增加了机器人的感知、规划、决策、控制等功能,使机器人更加智能。
从机器人应用的角度划分,过去是工业机器人、服务机器人、特殊机器人等。从专业角度看,机器人结构分为仿生机构,并联机构等;从空域角度划分,可面向地面、空中和水下等。如今机器人已经广泛应用在工业、水下以及航空航天,近几年发展迅速的就是无人驾驶。
感知技术
机器人是一个典型的反馈的、闭环的控制系统。不管机器人构造如何复杂,都包含四个核心的关键技术:本体结构技术,感知系统与感知技术,决策与规划、调度、控制技术及执行技术。
目前机器人已经广泛应用到现实生活当中,如智能机器人、新材料、仿生、机器人的能源动力,以及脑机接口、医疗机器人——包括机器人的伦理等,都是未来机器人发展和挑战的方向。未来机器人一定是朝着自主化更强,容错性更好得多机协作的方向发展。
我们团队认为一个完整的机器人要具备五大能力(要素),包括感知要素、运动要素、规划要素、学习能力及决策能力。从专业角度来说,机器人就是一个闭环的反馈控制系统,三个关键的核心技术起到支撑作用。第一个是环境感知,第二个是规划决策,第三个方面是协同控制。
近几年来,我们团队在视觉传感器方面,研制视觉传感器的成像,在视觉成像后对视觉信息进行处理,再做成视觉的硬件和软件嵌入式系统。
首先,怎么打造高速高精的视觉感知与传感器呢?如何才能够有效地应用到机器人中,给机器人备上一双明亮的眼睛?近几年发展比较迅速的是支持性的光学成像、机器学习以及实时硬件处理等,能有效地应对高实时、高可靠、高性能的视觉感知系统。
处理微小、微弱业务时怎样有效地识别、判断?能让医疗、工业机器人在行走时能够精准地感知?机器人要装配一个零部件,首先得通过学习提取特征,用大量的样本训练,学习完以后用模型来建立三维的环境、场景的感知。通过这个三维模型让机器人固化在控制系统里,形成一个实时的视觉伺服控制以有效应对。目前发展得比较迅速的是三维地图定位与重建。
机器人控制系统发展迅速
在感知环节后,我们还要依托感知的信息,来控制机器人的操作。如今机器人的控制系统发展得也非常迅速。第一个方面是柔性控制,第二个方面是机器人视觉伺服控制,第三个方面是机器人的学习、智能控制,第四个方面是机器人的多机协同,多机协同是未来的发展方向。
机器人学习是一个漫长的过程,通过不断地学习后,设计学习控制器,可以将其通过硬件固化在机器人大脑、关节控制器、系统控制中,近几年强化学习控制器发展非常迅速。此外,我们加工一个大型复杂构件、完成一个医疗手术需要深度迭代的运动控制学习,只有通过传统控制不断迭代、不断训练,学习完成后才可以完成复杂的作业。当然,环境发生变化后可以再学习,这并不是一成不变。
比如在加工一个非常复杂的、杂乱无章的零部件时,我们怎么有效地抓取、识别与装配?这其中涵盖三个方面,即要将视觉感知、视觉伺服和精确的控制有机地结合起来,真正成为一个集三维深度感知的学习控制器。
控制器研发最重要的是多机协作,而多机控制需要解决几个关键性的核心问题:多传感器信息融合、协同感知、协同规划及协同控制。解决好这四个关键技术,就能够加工出一个大型的复杂部件。
比如智能制造或智能车间,如何在小品种、多批量、批量变化的要求下生产出产品?这就需要柔性化生产与作业,要解决多机器的协同、多工序的协同和多任务的分配。
机器人可以广泛应用到不同的场景,无论是工业、农业,或者物流、医疗等,都属于集成创新。但是要把集成创新做好非常不容易,所以我把它归结为第五大技术。
基于这五大技术,就可以广泛应用到不同的行业。第一个典型行业案例如我国基于高速机器视觉的饮料罐装机器人,近几年来发展非常迅速,但是在十多年前,工序不发达的情况下都是靠手工操作。
第二个典型应用在医药制造领域。过去配药、罐装药、封装药、分解药都采用人工。2003年非典疫情后,各大制药剂工厂提倡高速无菌化、高速无人化的生产。如今,机器人在疫苗生产当中也发挥着非常重要的作用。
第三个典型应用领域的代表是三星。作为电子领域传统企业,三星大量采用机器视觉、机器人的运动控制,来解决电子印刷电路板的装配问题。第四个应用方面是机器人的机械加工、激光加工焊接;第五个方面是高危作业。这些都是机器人在工业、农业、特殊作业行业等应用的典型案例,也就是基于五大关键技术以研发机器人。
智能机器人的未来发展
典型的机器人包括控制器、减速器、伺服器,再加一个完备的人机界面。1.0被称为自动化的机器,近几年迅速发展到2.0数字化,加入了视觉感知、轨迹规划以及视像等。
未来,在学术界、工业界以及产业界需求最高的服务机器人,更多地要向3.0协作机器人发展。要让机器人实现认知学习、人机交互、语意分析,尤其是对自然语言的理解。
人和机器协作,必须了解自然语言。将来机器人还要成为自主性的机器人,还有更多的技术正在迭代。机器人的发展过程是不断迭代的,让机器人变得更加聪明、更加有效、更加可靠,为人类带来更好的服务。
未来的机器人发展中,人工智能非常重要。人工智能的关键技术决定了机器人的未来。人工智能的四大技术——记忆技术、感知技术、行动规划以及机器学习,近年来发展非常迅速。这些技术完全可以移植到机器人里,未来的机器人一定是一个完备的、能够自主化、网络化的闭环的控制系统。
此外,从服务机器人身上可以发现,机器人能像人一样看懂说明书,能够自动地装配;机器人通过眼睛视觉,能感知得到,还要分析判断,要有认知。从感知智能到认知智能,再到行为智能,这些都是需要人工智能的技术。
而在智能工厂发展方向,也体现出人工智能的作用。比如网络化协同制造,过去一个工厂大批量地生产,今天的工厂则是小批量定制化或多品种。一件产品要制造,两件产品也要制造,要承担这么样艰巨的任务,工厂一定要做成柔性化、智能化的产线。而这就要依靠数字化、网络化和智能化的升级。
在关键的产线方面,实现制造的智能化、服务的智能化,才能真正地打造有竞争力的柔性的工厂,这需要工业互联网的加入,也需要制造云,才能建成新型的智慧工厂,也就是俗称的“灯塔工厂”“黑灯工厂”“无人工厂”。
物流方面也同样如此。5G技术的出现,为机器人的发展带来了福音。同时,智能网联交通包括人机交互技术等非常重要。此外,机器人在无人系统、无人作业、空地天协同作业等均能发挥重要作用。但其中的核心是,空间协同无论怎样发展,都需要一个高性能的类脑计算,目前业内都在设计无人系统的类脑芯片。
简单而言,人工智能与机器人的有机结合可以体现在四个方面。第一在感知层面,很多人工智能的技术已经被大量地应用,很多企业都在开发。第二在认知层技术,第三在决策层,第四在控制执行层,都能体现出人工智能技术融入机器人里。
机器人的发展态势应该是网络化、自主化、协同化、灵巧化。机器人要发展好,首先一定要规划好。第二要有一个好的创新环境,第三机器人一定要有标准,第四人才是关键。
深度研报:人工智能机器人开启第四次科技革命
图片来源@视觉中国
文|光锥智能&势乘资本,作者|谢晨星、王嘉攀、赵江宇
在互联网红利基本散尽的时代,未来到底属于web3、元宇宙,还是碳中和?到底什么样的革命性技术可以引领人类社会走出经济衰退、疫情和战争的影响,并将全球经济体量再向上推动数十倍?
我们的答案是,我们早已处于人工智能时代之中。
我们正处于传统信息技术时代的黄昏,和人工智能时代的黎明。
在过去的260年间,人类社会经历了三次巨大的科技创新浪潮,蒸汽机、电力和信息技术,将全球GDP提升了近千倍。每一次科技浪潮都通过某一项先进生产力要素的突破,进而引起大多数行业的变革:比如蒸汽机的出现推动了汽车、火车、轮船、钢铁等行业的巨大发展,140年前美国铁路行业的恶性竞争史,就如同现今互联网行业BAT之间的竞争。而铁路行业发展、兼并所需的巨额金融资本,又驱动了华尔街的发展,逐渐成为全球的金融中心。
二战之后以信息技术为核心的第三次科技革命迄今已逾70年,将全球GDP提升约60倍。其中可分为两段:1950年-1990年,是半导体产业迅猛发展的时代,推动了大型计算机向个人PC的小型化;1990年至今是近30年的互联网全球化时代,而互联网时代又细分为桌面互联网和移动互联网两段。
但随着摩尔定律的失效和信息技术红利彻底用尽,加上疫情黑天鹅影响,全球GDP衰退,引发并加剧了全球地缘政治和军事冲突,开始向逆全球化发展。
所以未来到底属于web3、元宇宙,还是碳中和?到底什么样的革命性技术可以引领人类社会走出经济衰退、疫情和战争的影响,并将全球经济体量再向上推动增长下一个50倍?
我们的答案是,我们早已处于人工智能时代之中。就像直到2010年iphone4发布,绝大多数人也并未意识到移动互联网革命早已开始一样,如今人工智能其实也已广泛应用,比如到处遍布的摄像头和手机人脸识别,微信语音和文本转换,抖音动态美颜特效、推荐算法,家庭扫地机器人和餐厅送餐机器人,背后都是人工智能核心技术在过去十年不断取得的巨大突破。
互联网已经是传统行业。
互联网技术作为过去30年最先进的生产力要素,改变了全球的所有人、所有产业、社会经济,甚至是政治、军事、宗教。
虽然互联网的技术红利已基本用尽,但我们仍可通过研究其历史规律,来预测未来新技术发展的可能路径。
30年的互联网发展历程总体可分为桌面互联网和移动互联网两个时代,按产业渗透规律,又可分为信息互联网、消费互联网和产业互联网三大阶段。
系统硬件都是最先起步,包括底层芯片、操作系统、联网通信、整机等,进而初步向媒体工具、文娱游戏行业渗透,因为这些领域最易受新技术的影响。当2002年中国网民达到6000万人,2012年中国智能手机出货量达到2亿部之后,互联网和移动互联网开始全面开花,渗透变革了直接toC的众多行业,如零售消费、交通出行、教育、金融、汽车、居住、医疗等。而当用户量进一步上涨、新技术的渗透进一步加深,企业服务、物流、制造、农业、能源等toB产业被影响。
而这个过程中可以发现,移动互联网时代对产业的渗透深度比桌面互联网更深,桌面互联网介入行业基本停留在信息连接层面,而到移动互联网时代,众多掌握先进技术要素的公司开始自己下场开超市、组车队、重构教育内容和金融机构,甚至是卖房、造车。也有些公司虽然诞生在桌面时代,但成功抓住移动爆发红利杀出重围,比如美团、去哪儿、支付宝。
抖音的崛起是中国移动互联网时代的最大变数,也是数据通信传输技术不断提升的必然,引发了用户流量结构的重组,进而催生了一大批抓住抖音流量红利崛起的消费品牌,如完美日记、花西子等等。但最终都逃不过被平台收割的命运,就像当年淘品牌的结局一样。微信支付、支付宝的普及极大推动了线下连锁零售的数字化程度和管理半径,减少了上下游现金收款产生的风险,促使其在资本市场被重新认可,连锁化率进一步提升,比如喜茶、瑞幸、Manner等等。这两条逻辑共同构成了过去几年的消费投资热潮主线。
如何评判一个新技术是否能引领未来的发展方向?
我们要看它能否从本质上解放生产力、发展生产力。
蒸汽机之所以推动了第一次科技革命,是因为其极大的提升了劳动生产力,并将大量劳动人口从第一产业农业的低级劳动中解放出来,进入第二产业工业。电力加速了这一过程,并推动了第三产业服务业的出现和发展。信息技术将更多的人口从第一、二产业中释放,进入第三产业(如大量年轻人不再进厂而去送外卖、跑滴滴),于是形成了如今全球第三产业GDP占比55%,中国第三产业劳动人口占比50%的格局。
机器人即是人工智能技术的硬件形态,在可见的未来,将第一二三产业的劳动人口从低级劳动中大比例释放和替代,并在这个过程中推动全球GDP继续百倍增长。
同时可大胆预言,以创新为职业的第四产业将会出现,而这个职业在人类的历史长河中其实一直存在于第一二三产业的边缘,不断用突破性创新推动着人类技术的进步,且社会生产力的提升促使该职业人群不断扩大。这大约能证明刘慈欣的技术爆炸假说来源。
人工智能从模块上可分为感知、计算和控制三大部分,由表及里可分为应用层、数据层、算法层、算力层,而随着2012年芯片进入28nm制程后的量子隧穿效应导致摩尔定律失效,“每提升一倍算力,就需要一倍能源”的后摩尔定律或将成为人工智能时代的核心驱动逻辑,算力的发展将极大受制于能源,当前全球用于制造算力芯片的能源占全球用电量的约1%,可以预测在人工智能大规模普及的未来数十年后,该比例将会大幅提升至50%甚至90%以上。而全球如何在减少化石能源、提升清洁能源占比,从而确保减少碳排放遏制全球升温的同时,持续提升能源使用量级,将推动一系列能源技术革命。关于该方向的研究可参考我们的另一篇报告《碳中和:能源技术新革命》。
早在第一次科技革命之前260年,哥伦布地理大发现就使西班牙成为了第一个全球化霸主。蒸汽机驱动英国打败西班牙无敌舰队,电力和两次世界大战使美国超过英国,信息技术又让美国赢得和苏联的冷战对抗,全球过了30年相对和平的单极霸权格局。
因此中国如果仅在现有技术框架中与欧美竞争,只会不断被卡脖子,事倍功半。只有引领下一代人工智能和碳中和能源技术科技革命浪潮,才能从全球竞争中胜出。
尽管中国已经跻身人工智能领域的大国,但是我们必须认识到中美之间在AI领域仍然有着明显的差距。从投资金额和布局上看,从2013年到2021年,美国对人工智能公司的私人投资是中国的2倍多。当前美国AI企业数量领先中国,布局在整个产业链上,尤其在算法、芯片等产业核心领域积累了强大的技术创新优势。更关键的是,尽管近年来中国在人工智能领域的论文和专利数量保持高速增长,但中国AI研究的质量与美国仍然有较大差距(集中体现在AI顶会论文的引用量的差距上)。
请输入图说2013-2021年中美在AI领域私有部门(如风险投资、个人投资等)投资金额上差距逐渐拉大
请输入图说中国在AI顶会上发表的文章数量已经反超美国,但影响力上仍然与美国有较大差距
图片来源:The2022AIIndexReport,StandfordUniversity
因此,中国需要持续加大在AI领域的研发费用规模,特别是加大基础学科的人才培养,吸引全世界优秀的AI人才。只有这样,中国才能有朝一日赶超美国,在基础学科建设、专利及论文发表、高端研发人才、创业投资和领军企业等关键环节上的拥有自己的优势,形成持久领军世界的格局。
一、AI发展简史
人工智能的概念第一次被提出是在1956年达特茅斯夏季人工智能研究会议上。当时的科学家主要讨论了计算机科学领域尚未解决的问题,期待通过模拟人类大脑的运行,解决一些特定领域的具体问题(例如开发几何定理证明器)。
那么到底什么是人工智能?目前看来,StuartRussell与PeterNorvig在《人工智能:一种现代的方法》一书中的定义最为准确:人工智能是有关“智能主体(Intelligentagent)的研究与设计”的学问,而“智能主体”是指一个可以观察周遭环境并做出行动以达致目标的系统。这个定义既强调了人工智能可以根据环境感知做出主动反应,又强调人工智能所做出的反应必须达成目标,同时没有给人造成“人工智能是对人类思维方式或人类总结的思维法则的模仿”这种错觉。
到目前为止,人工智能一共经历了三波浪潮。
第一次AI浪潮与图灵和他提出的“图灵测试”紧密相关。图灵测试刚提出没几年,人们似乎就看到了计算机通过图灵测试的曙光:1966年MIT教授JosephWeizenbaum发明了一个可以和人对话的小程序——Eliza(取名字萧伯纳的戏剧《茶花女》),轰动世界。但是Eliza的程序原理和源代码显示,Eliza本质是一个在话题库里通过关键字映射的方式,根据人的问话回复设定好的答语的程序。不过现在人们认为,Eliza是微软小冰、Siri、Allo和Alexa的真正鼻祖。图灵测试以及为了通过图灵测试而开展的技术研发,都在过去的几十年时间里推动了人工智能,特别是自然语言处理技术(NLP)的飞速发展。
第二次AI浪潮出现在1980-1990年代,语音识别(ASR)是最具代表性的几项突破性进展之一。在当时,语音识别主要分成两大流派:专家系统和概率系统。专家系统严重依赖人类的语言学知识,可拓展性和可适应性都很差,难以解决“不特定语者、大词汇、连续性语音识别”这三大难题。而概率系统则基于大型的语音数据语料库,使用统计模型进行语音识别工作。中国学者李开复在这个领域取得了很大成果,基本上宣告了以专家系统为代表的符号主义学派(SymbolicAI)在语音识别领域的失败。通过引入统计模型,语音识别的准确率提升了一个层次。
第三次AI浪潮起始于2006年,很大程度上归功于深度学习的实用化进程。深度学习兴起建立在以GeoffreyHinton为代表的科学家数十年的积累基础之上。简单地说,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型;如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。本质上,指导深度学习的是一种“实用主义”的思想。实用主义思想让深度学习的感知能力(建模能力)远强于传统的机器学习方法,但也意味着人们难以说出模型中变量的选择、参数的取值与最终的感知能力之间的因果关系。
需要特别说明的是,人们往往容易将深度学习与“机器学习”这一概念混淆。事实上,在1956年人工智能的概念第一次被提出后,ArthurSamuel就提出:机器学习研究和构建的是一种特殊的算法而非某一个特定的算法,是一个宽泛的概念,指的是利用算法使得计算机能够像人一样从数据中挖掘出信息;而深度学习只是机器学习的一个子集,是比其他学习方法使用了更多的参数、模型也更加复杂的一系列算法。简单地说,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。本质上,指导深度学习的是一种“实用主义”的思想。实用主义思想让深度学习的感知能力(建模能力)远强于传统的机器学习方法,但也意味着人们难以说出模型中变量的选择、参数的取值与最终的感知能力之间的因果关系。
二、AI的三大基石解析
如前所述,人工智能由表及里可分为应用层、数据层、算法层和算力层。
1.算力
算力层包括具备计算能力硬件和大数据基础设施。回顾历史我们就会发现,历次算力层的发展都会显著推动算法层的进步,并促使技术的普及应用。21世纪互联网大规模服务集群的出现、搜索和电商业务带来的大数据积累、GPU和异构/低功耗芯片兴起带来的运算力提升,促成了深度学习的诞生,促成了人工智能的这一波爆发。而AI芯片的出现进一步显著提高了数据处理速度:在CPU的基础上,出现了擅长并行计算的GPU,以及拥有良好运行能效比、更适合深度学习模型的现场可编程门阵列(FPGA)和应用专用集成电路(ASIC)。
当前,人工智能的算力层面临巨大的挑战。随着2012年芯片28nm的工艺出现,原先通过在平面上增加晶体管的数量来提升芯片性能的思路因为量子隧穿效应而不再可取,摩尔定律开始失效。晶体管MOSFET这个芯片里最基础的单元,由平面结构变成立体结构(由下图中的Planar结构转向FinFET结构,2018年之后进一步从FinFET结构转向GAAFET结构)。
三代MOSFET的栅极结构演化。其中灰色代表电流流经区域,绿色代表充当闸门的栅极
芯片结构的改变直接导致了芯片制造步骤的增加,最终体现为成本的上升。在2012年28nm工艺的时候,处理器的生产大概需要450步。到了2021年的5nm工艺时,生产环节已经增加到了1200步。对应到每1亿个栅极的制造成本上,我们从图中可以清楚地看到,从90nm工艺到7nm工艺,生产成本先下降后上升。这就使得摩尔定律的另一种表述形式——“同样性能的新品价格每18-24个月减半”不再成立。未来我们很可能见到的情况是,搭载了顶级技术和工艺生产出来的芯片的电子产品或设备价格高昂,超过了一般消费者的承受力度。
每1亿个栅极的制造成本、图片来源:MarvellTechnology,2020InvestorDay
不过算力层的这个变化让半导体制造企业受益最大,因为只要需求存在,台积电、三星、英特尔等几家掌握先进工艺的厂商就会持续投入资金和人力,不断设计和制造新一代芯片,然后根据自身成本给产品定价。
想要彻底解决摩尔定律失效的问题,需要跳出当前芯片设计的冯·诺依曼结构。类脑芯片、存算一体、寻找基于硅以外的新材料制造芯片,甚至量子计算等等都是潜力巨大的解决方案,但是这些方案距离成熟落地还非常遥远(最乐观地估计也需要几十年的时间),无法解决当下芯片行业的困局。在这段时期内,行业内为了提升芯片性能,开始广泛应用Chiplet技术,或者使用碳基芯片、光芯片等等。
Chiplet技术
Chiplet技术的原理有点类似搭积木,简单来说就是把一堆小芯片组合成一块大芯片。这种技术能够以较低的成本制造过于复杂的芯片,并且保证足够优秀的良率,从2012年开始就逐步被使用。当前Chiplet技术已经能够在二维平面上实现用不同的材料和工艺加工拼接的小核心,Intel等公司正在把Chiplet技术引入新的阶段发展:在垂直方向上堆叠多层小核心,进一步提升芯片的性能(例如Intel于2018年开发的Foveros3DChiplet)。不过Chiplet技术路线面临的最大问题来源于芯片热管理方面:如果在三维结构上堆叠多层小核心,传统的通过CPU顶部铜盖一个面散热的方案将无法解决发热问题,因此可能需要在芯片的内部嵌入冷却装置来解决发热功率过高的问题。
碳纳米管技术
使用碳纳米管可能是另一个短期解决方案。这项技术属于碳基芯片领域,具体来说就是用碳纳米管承担芯片里基础元件开关的功能,而不是像传统芯片一样使用掺杂的半导体硅来传输电子。这种技术的优势在于导电性好、散热快、寿命长,而且由于其本质上仍然保留了冯·诺依曼架构,当前的生产工艺、产业链等匹配设施都不需要做出太大的调整。但是目前碳纳米管的大规模生产和应用还有一些困难,距离把碳纳米管按照芯片设计的要求制造出来可能还需要几十年。
短期内,围绕Chiplet技术在热管理方面的探索,和碳纳米管技术的灵活生产制造突破是算力层面上我们重点关注的机会。当然,我们也要了解目前类脑芯片、存算一体和量子计算等终局解决方案的相关情况。这里为大家简单介绍如下:
类脑芯片
类脑芯片的灵感源于人脑。类脑芯片和传统结构的差异体现在两方面:第一,类脑芯片中数据的读取、存储和计算是在同一个单元中同时完成的,也即“存算一体”;第二,单元之间的连接像人类神经元之间的连接一样,依靠“事件驱动。
目前,类脑芯片的相关研究分为两派。一派认为需要了解清楚人脑的工作原理,才能模仿人类大脑设计出新的结构。但是目前人类对人脑的基本原理理解得仍然很粗浅,因此这一派取得的进展相当有限。另外一派则认为,可以先基于当前已有的生物学知识,比照人脑的基础单元设计出一些结构,然后不断试验、优化、取得成果,实现突破。目前这一派的研究人员依照神经元的基础结构,给类脑芯片做了一些数学描述,也搭建了模型,并且做出了不少可以运行的芯片。
存算一体
存算一体可以简单被概括为“用存储电荷的方式实现计算”,彻底解决了冯诺依曼结构中“存储”和“计算”两个步骤速度不匹配的问题(事实上,在以硅为基础的半导体芯片出现之后,存算速度不匹配的情况就一直存在)。存算一体机构在计算深度学习相关的任务时表现突出,能耗大约是当前传统计算设备的百分之一,能够大大提升人工智能的性能。除此之外,这种芯片在VR和AR眼镜等可穿戴设备上有广阔的应用前景,也能推动更高分辨率的显示设备价格进一步降低。
目前,存算一体仍然有两个问题没有突破:第一是基础单元(忆阻器)的精度不高,其次是缺少算法,在应对除了矩阵乘法以外的计算问题时表现远不如冯·诺依曼结构的芯片。
量子计算
量子计算是用特殊的方法控制若干个处于量子叠加态的原子,也叫作“量子”,通过指定的量子态来实现计算。量子计算机最适合的是面对一大堆可能性的时候,可以同时对所有可能性做运算。为了从所有的结果中找一个统计规律,我们需要使用量子计算机进行多次计算。不过由于退相干的问题,量子计算很容易出错。目前量子计算的纠错方法有待突破,只有解决了这个问题量子计算才可能被普遍使用。
当前量子计算机体积过大、运行环境严苛、造价昂贵。目前来看量子计算与经典计算不是取代与被取代的关系,而是在对算力要求极高的特定场景中发挥其高速并行计算的独特优势。中科大的量子物理学家陆朝阳曾总结道,“到目前为止,真正可以从量子计算中受益的实际问题仍然非常有限,享受指数级加速的就更少了——其他的仅有更有限的加速”。
总体而言,量子计算机的相关成果都只停留在科学研究的阶段,距离实际应用还很遥远。
2.算法
算法层指各类机器学习算法。如果根据训练方法来分类,机器学习算法也可以分成“无监督学习”、“监督学习”和“强化学习”等。按照解决问题的类型来分,机器学习算法包括计算机视觉算法(CV)、自然语言处理算法(NLP)、语音处理和识别算法(ASR)、智慧决策算法(DMS)等。每个算法大类下又有多个具体子技术,这里我们为大家简单介绍:
2.1计算机视觉
计算机视觉的历史可以追溯到1966年,当时人工智能学家Minsky要求学生编写一个程序,让计算机向人类呈现它通过摄像头看到了什么。到了1970-1980年代,科学家试图从人类看东西的方法中获得借鉴。这一阶段计算机视觉主要应用于光学字符识别、工件识别、显微/航空图片的识别等领域。
到了90年代,计算机视觉技术取得了更大的发展,也开始广泛应用于工业领域。一方面是由于GPU、DSP等图像处理硬件技术有了飞速进步;另一方面是人们也开始尝试不同的算法,包括统计方法和局部特征描述符的引入。进入21世纪,以往许多基于规则的处理方式,都被机器学习所替代,算法自行从海量数据中总结归纳物体的特征,然后进行识别和判断。这一阶段涌现出了非常多的应用,包括相机人脸检测、安防人脸识别、车牌识别等等。
2010年以后,深度学习的应用将各类视觉相关任务的识别精度大幅提升,拓展了计算机视觉技术的应用场景:除了在安防领域应用外,计算机视觉也被应用于商品拍照搜索、智能影像诊断、照片自动分类等场景。
再细分地来看,计算机视觉领域主要包括图像处理、图像识别和检测,以及图像理解等分支:
图像处理:指不涉及高层语义,仅针对底层像素的处理。典型任务包括图片去模糊、超分辨率处理、滤镜处理等。运用到视频上,主要是对视频进行滤镜处理。这些技术目前已经相对成熟,在各类P图软件、视频处理软件中随处可见;
图像识别和检测:图像识别检测的过程包括图像预处理、图像分割、特征提取和判断匹配,可以用来处理分类问题(如识别图片的内容是不是猫)、定位问题(如识别图片中的猫在哪里)、检测问题(如识别图片中有哪些动物、分别在哪里)、分割问题(如图片中的哪些像素区域是猫)等。这些技术也已比较成熟,图像上的应用包括人脸检测识别、OCR(光学字符识别)等,视频上可用来识别影片中的明星;
图像理解:图像理解本质上是图像与文本间的交互,可用来执行基于文本的图像搜索、图像描述生成、图像问答(给定图像和问题,输出答案)等。图像理解任务目前还没有取得非常成熟的结果,商业化场景也正在探索之;
总体而言,计算机视觉已经达到了娱乐用、工具用的初级阶段。未来,计算机视觉有望进入自主理解、甚至分析决策的高级阶段,真正赋予机器“看”的能力,从而在智能家居、无人车等应用场景发挥更大的价值。
2.2语音识别
第一个真正基于电子计算机的语音识别系统出现在1952年。1980年代,随着全球性的电传业务积累了大量文本可作为机读语料用于模型的训练和统计,语音识别技术取得突破:这一时期研究的重点是大词汇量、非特定人的连续语音识别。1990年代,语音识别技术基本成熟,但识别效果与真正实用还有一定距离,语音识别研究的进展也逐渐趋缓。
随着深度神经网络被应用到语音的声学建模中,人们陆续在音素识别任务和大词汇量连续语音识别任务上取得突破。而随着循环神经网络(RNN)的引入,语音识别效果进一步得到提升,在许多(尤其是近场)语音识别任务上达到了可以进入人们日常生活的标准。以AppleSiri为代表的智能语音助手、以Echo为首的智能硬件等应用的普及又进一步扩充了语料资源的收集渠道,为语言和声学模型的训练储备了丰富的燃料,使得构建大规模通用语言模型和声学模型成为可能。
与语音识别紧密关联的是语音处理。语音处理为我们提供了语音转文字、多语言翻译、虚拟助手等一系列软件。一个完整的语音处理系统,包括前端的信号处理、中间的语音语义识别和对话管理(更多涉及自然语言处理),以及后期的语音合成。
前端信号处理:语音的前端处理涵盖说话人声检测、回声消除、唤醒词识别、麦克风阵列处理、语音增强。
语音识别:语音识别的过程需要经历特征提取、模型自适应、声学模型、语言模型、动态解码等多个过程。
语音合成:语音合成的几个步骤包括文本分析、语言学分析、音长估算、发音参数估计等。基于现有技术合成的语音在清晰度和可懂度上已经达到了较好的水平,但机器口音还是比较明显。目前的几个研究方向包括如何使合成语音听起来更自然、如何使合成语音的表现力更丰富,以及如何实现自然流畅的多语言混合合成。
2.3自然语言处理
早在1950年代,人们就有了自然语言处理的任务需求,其中最典型的就是机器翻译。到了1990年代,随着计算机的计算速度和存储量大幅增加、大规模真实文本的积累产生,以及被互联网发展激发出的、以网页搜索为代表的基于自然语言的信息检索和抽取需求出现,自然语言处理进入了发展繁荣期。在传统的基于规则的处理技术中,人们引入了更多数据驱动的统计方法,将自然语言处理的研究推向了一个新高度。
进入2010年以后,基于大数据和浅层、深层学习技术,自然语言处理的效果得到了进一步优化,出现了专门的智能翻译产品、客服机器人、智能助手等产品。这一时期的一个重要里程碑事件是IBM研发的Watson系统参加综艺问答节目Jeopardy。机器翻译方面,谷歌推出的神经网络机器翻译(GNMT)相比传统的基于词组的机器翻译(PBMT),在翻译的准确率上取得了非常强劲的提升。
自然语言处理从流程上看,分成自然语言理解(NLU)和自然语言生成(NLG)两部分,这里我们简单为大家介绍知识图谱、语义理解、对话管理等研究方向。
知识图谱:知识图谱基于语义层面,对知识进行组织后得到的结构化结果,可以用来回答简单事实类的问题,包括语言知识图谱(词义上下位、同义词等)、常识知识图谱(“鸟会飞但兔子不会飞”)、实体关系图谱(“刘德华的妻子是朱丽倩”)。知识图谱的构建过程其实就是获取知识、表示知识、应用知识的过程。
语义理解:核心问题是如何从形式与意义的多对多映射中,根据当前语境找到一种最合适的映射。以中文为例,需要解决歧义消除、上下文关联性、意图识别、情感识别等困难。
对话管理:为了让机器在与人沟通的过程中不显得那么智障,还需要在对话管理上有所突破。目前对话管理主要包含三种情形:闲聊、问答、任务驱动型对话。
2.4规划决策系统
真正基于人工智能的规划决策系统出现在电子计算机诞生之后。1990年代,硬件性能、算法能力等都得到了大幅提升,在1997年IBM研发的深蓝(DeepBlue)战胜国际象棋大师卡斯帕罗夫。到了2016年,硬件层面出现了基于GPU、TPU的并行计算,算法层面出现了蒙特卡洛决策树与深度神经网络的结合。人类在完美信息博弈的游戏中已彻底输给机器,只能在不完美信息的德州扑克和麻将中苟延残喘。人们从棋类游戏中积累的知识和经验,也被应用在更广泛的需要决策规划的领域,包括机器人控制、无人车等等。
2.5算法的发展趋势和面临的瓶颈
近年来。处在机器学习也产生了几个重要的研究方向,例如从解决凸优化问题到解决非凸优化问题,以及从监督学习向非监督学习、强化学习的演进:
从解决凸优化问题到解决非凸优化问题
目前机器学习中的大部分问题,都可以通过加上一定的约束条件,转化或近似为一个凸优化问题。凸优化问题是指将所有的考虑因素表示为一组函数,然后从中选出一个最优解。而凸优化问题的一个很好的特性是局部最优就是全局最优。这个特性使得人们能通过梯度下降法寻找到下降的方向,找到的局部最优解就会是全局最优解。
然而在现实生活中,真正符合凸优化性质的问题其实并不多,目前对凸优化问题的关注仅仅是因为这类问题更容易解决。人们现在还缺乏针对非凸优化问题的行之有效的算法。
从监督学习向非监督学习、强化学习的演进
目前来看,大部分的AI应用都是通过监督学习,利用一组已标注的训练数据,对分类器的参数进行调整,使其达到所要求的性能。但在现实生活中,监督学习不足以被称为“智能”。对照人类的学习过程,许多都是建立在与事物的交互中,通过人类自身的体会、领悟,得到对事物的理解,并将之应用于未来的生活中。而机器的局限就在于缺乏这些“常识”。
无监督学习领域近期的研究重点在于“生成对抗网络”(GANs),而强化学习的一个重要研究方向在于建立一个有效的、与真实世界存在交互的仿真模拟环境,不断训练,模拟采取各种动作、接受各种反馈,以此对模型进行训练。
从“堆数据”到研发低训练成本的算法
MITDigitalLab的研究者联合韩国的相关机构在2020年发表了一项基于1058篇深度学习的论文和数据的研究。在分析了现有的深度学习论文成果后,研究人员提出了一个悲观的预言:深度学习会随着计算量的限制,在到达某个性能水平后停滞不前,因为在深度学习领域有这样一条规律:想提升X倍的性能,最少需要用X^2倍的数据去训练模型,且这个过程要消耗X^4倍的计算量。即便是10倍性能提升和1万倍计算量的提升,这样失衡的比例关系也仅仅是理论上最优的。在现实中,提升10倍性能往往要搭上10亿倍的运算量。以今天地球资源的状况看,想把一些常用的模型错误率降低到人们满意的程度,代价高到人类不能承受。因此,在深度学习领域非常值得关注的是可大幅降低训练成本的新算法创新。
图像分类、物体识别、语义问答等多个领域AI算法准确率及对应所需算力(Gflops)、碳排放量和经济成本
(Today水平截止于2020年已经发表的成果)
3.数据
数据层指的是人工智能为不同的行业提供解决方案时所采集和利用的数据。事实上,使用人工智能解决问题的步骤绝不仅仅包括搜集和整理数据。这里我们简单介绍一下完整的流程和思路:
收集数据:数据的数量和质量直接决定了模型的质量。
数据准备:在使用数据前需要对数据进行清洗和一系列处理工作。
模型选择:不同的模型往往有各自擅长处理的问题。只有把问题抽象成数学模型后,我们才能选择出比较适合的模型,而这一步往往也是非常困难的。
训练:这个过程不需要人来参与,机器使用数学方法对模型进行求解,完成相关的数学运算。
评估:评估模型是否较好地解决了我们的问题。
参数调整:可以以任何方式进一步改进训练(比如调整先前假定的参数)。
预测:开始使用模型解决问题。
如果我们想利用人工智能解决的问题被限定在足够小的领域内,那么我们就更容易活动具体场景下的训练数据,从而更高效、更有针对性地训练模型。在金融、律政、医疗等行业的细分场景下,人工智能已经逐步被应用,且已经实现了一定的商业化。
一、为什么是机器人
1.机器人的外延及框架
虽然机器人产业已有超过60年发展史,在传统【工业机器人】及【服务机器人】分析框架下,全球机器人产业仅有300-400亿美元行业规模,但我们认为,在智能化加持下,机器人的外延及边界已被数倍扩大,新物种的诞生及传统设备的智能化将共同驱动“机器人”产业十倍及百倍增长。
概括来讲,机器人普遍存在的意义是“为人类服务”的可运动智能设备,包括机器人对于人类劳动的替代、完成人类所无法完成任务的能力延伸以及情感陪伴等价值。
面对人类对于物质及精神永不停止的需求增长,相对于元宇宙,机器人将会是“现实宇宙”中的最佳供给方案。
2.AI将会带给机器人怎样的质变
(1)智能化大幅提升
可软件升级:传统机器人无法实现软件算法在线升级,智能化机器人能够通过软件算法的迭代持续提升性能;这让机器人的能力理论上是没有上限的
规模效应:机器人应用规模越大,收集数据越多,算法迭代越完善,机器人越好用
可适用性大幅增加:机器人智慧程度线性增加,可适用的场景及价值将会指数增加
(2)智能化带来的场景适用性提升
AI技术将会是机器人全面爆发的最大变量,机器人产业的爆发极有可能是新物种引领;例如近三年全面爆发的机器人项目,在10年前几乎不存在(例如九号公司、石头科技、普渡、擎朗、云迹、高仙、梅卡曼德、极智嘉等)。
二、为什么是现在?
1.劳动力替代及升级趋势不可逆
在人口老龄化趋势下,2015-2020年,我国劳动力人口减少约1700万人,我国人均收入从4.97万元增至7.15万元,在用工难及用工贵的不可逆趋势下,智能化机器人的补充成为最重要的生产力增长点。
2021年我国人均GDP已超1.2万美元,在我国将成为全球人口最多的高收入国家(门槛为人均1.25万美元)的进程中,作为全球最大的制造业大国转型升级,将会带来全世界体量最大的机器人用工需求。
2.成熟的技术与产业基础
我们认为,智能手机及智能汽车产业的发展,实质上为现阶段智能机器人产业爆发奠定了大量技术基础:
感知层面:视觉模组、激光雷达、毫米波雷达的逐渐发展,成本降低到可用的程度;数据采集、算法训练及软件在线迭代为智能机器人未来持续升级提供了借鉴范式;
决策层面:智能SoC芯片提供了足够的算力基础,汽车自动驾驶与移动机器人在底层技术上亦有相通之处;
控制层面:近十年锂电技术提升了电池续航能力,同时有线及无线充电技术快速进步,5G及WIFI技术发展为机器人提供了通讯控制基础;
环境基础:我国拥有全世界最适合机器人产业发展的土壤,例如低成本敏捷供应链、低成本清洁能源供给、工程师红利、最广大数据收集场景;现阶段创造一款机器人新品的零配件采购难度要远低于十年前;
三、如何判断未来十年新机遇
1.从职业场景出发——寻找未被满足的大赛道
我们认为投资机构在机器人领域投的并不单纯是智能硬件或国产替代,而是押注未来数个万亿级、数十个千亿级、上百个百亿级工作场景的无人化;未来机器人公司主流定价方式很可能取决于可替代的必要劳动价值,机器人公司直接提供高粘性持续的收费服务(RobotasaService),而非按照传统的“BOM成本+一定的毛利空间”去定价。
我们收集了不同职业场景的从业人数及人均收入数据,得出不同职业劳动力成本总和,制作了机器人领域潜在替代场景图谱。
未来机器人对于人工的替代将从大场景、低复杂度入手,逐步向中小型场景、高复杂度渗透;未来10年最有潜力的投资方向将会是现阶段供给基本空白的大场景。
数据来源:国家统计局等机构
上图部分职业又可细分出上百个环节(根据“十四五”机器人发展规划)
(1)制造业:焊接、自动搬运、防爆物品生产、分拣、包装、协作生产、打磨、装配等工作
(2)建筑业:建筑部件智能化生产、测量、材料配送、钢筋加工、混凝土浇筑、楼面墙面装饰装修、构部件安装、焊接等工作
(3)农业:可进一步拆分为果园除草、精准植保、果蔬剪枝、采摘收获、分选,以及用于畜禽养殖业的喂料、巡检、清淤泥、清网衣附着物、消毒处理等工作
(4)矿业:采掘、支护、钻孔、巡检、重载辅助运输等工作
(5)医疗康复:手术、护理、检查、康复、咨询、配送等工作
(6)养老助残:助行、助浴、物品递送、情感陪护、智能假肢等应用
(7)家用场景:家务劳动、教育、娱乐、安防监控等工作
(8)公共场所:讲解导引、餐饮、配送、代步等工作
(9)水下场景:水下探测、监测、作业、深海矿产资源开发等工作
(10)安防场景:安保巡逻、缉私安检、反恐防暴、勘查取证、交通管理、边防管理、治安管控等工作
(11)危险环境作业:消防、应急救援、安全巡检、核工业操作、海洋捕捞等工作
(12)卫生防疫:检验采样、消毒清洁、室内配送、辅助移位、辅助巡诊查房、重症护理辅助操作等工作
2.从技术可行性出发——细分场景的实现难度
(1)从【场景是否单一】及【工作复杂度】两个维度进行分析
分析一项职业被机器人替代的难度,我们认为可以落入以下四个象限进行分析;其中场景维度指该项工作是否需要适应多变的环境,是否需要转移;复杂度指完成该项工作需要的知识储备多少及解决问题的难度
A.单一场景、低复杂度:例如简单的加工制造工序、搬运、安保、清洁、农业养殖等劳动更容易率先实现机器替代
B.单一场景、高复杂度:例如绘画、音乐演奏、作家、医生、教育、财务、销售、厨师等场景
C.多场景、低复杂度:例如应对不同场景下的无人驾驶,不同种类的家务劳动
D.多场景、高复杂度:例如警察、外交官、企业管理人员、研发创新等工作
(2)从机器与人类的思维长处分析
机器智能在大规模数据与信息处理、细节分析等方面具备天然优势
在需要情感、综合推理、想象力、创造力等方面的职业,人类被机器人替代的难度较大
3.从经济性出发——替代人效比
如何判断某个细分场景下,是否已经到达了机器人应用拐点?我们认为核心指标是替代人效比,即机器人的购买及维护成本相对于同岗位人力成本的回本周期
ROI<48个月时,该细分赛道会有产品出现,客户开始考虑尝试
ROI<24个月时,该细分赛道客户开始批量购买测试
ROI<12个月时,市场开始全产爆发
经济性逐渐提升背后的因素:人员成本上涨、人力紧缺、上游零配件成本下降、规模量产降低了成本、AI技术发展使得功能实现的成本降低等
四、机器人智能化三要素解析
什么样的机器人能够称得上是智能机器人?目前世界范围内还没有一个统一定义
我们认为如果对智能机器人进行抽象化解析,往往需要具备三大要素——即感知、决策和控制。
感知要素:用来认识周围环境状态,包括能感知视觉、接近、距离等的非接触型传感器和能感知力、压觉、触觉等的接触型传感器。这些要素实质上就是相当于人的眼、鼻、耳等五官,功能可以利用诸如摄像机、像传感器、超声波传成器、激光器、导电橡胶、压电元件、气动元件、行程开关等机电元器件来实现。
决策要素:也称为思考要素,根据传感器收集的数据,思考出采用什么样的动作。智能机器人的思考要素是三个要素中的关键。思考要素包括有判断、逻辑分析、理解等方面的智力活动。这些智力活动实质上是一个信息处理过程,而计算机则是完成这个处理过程的主要手段。
控制要素:也称为运动要素,对外界做出反应性动作;对运动要素来说,智能机器人需要有一个无轨道型的移动机构,以适应诸如平地、台阶、墙壁、楼梯、坡道等不同的地理环境。它们的功能可以借助轮子、履带、支脚、吸盘、气垫等移动机构来完成。在运动过程中要对移动机构进行实时控制,这种控制不仅要包括有位置控制,而且还要有力度控制、位置与力度混合控制、伸缩率控制等。
从商业机会的角度来讲,三大要素并不是独立割裂的,例如做视觉传感器的玩家往往要配套相应的软件算法,服务于各细分场景的厂商需要极强的多传感器融合、多机型控制及面向行业的智能决策能力。
三大要素中既有专精于某一环节的零部件或软件供应商机会(如核心零部件、操作系统、关键控制算法等),也有整合了其中2-3个环节的关键技术要素,为细分场景提供全套服务的应用机会(例如在清洁、配送、交通等场景的机器人服务商)。
1.感知——机器人感觉器官
(1)传感器分类
内部传感器:内部传感器是用于测量机器人自身状态的功能元件,其功能是测量运动学量和力学量,用于机器人感知自身的运动状态,使得机器人可以按照规定的位置、轨迹和速度等参数运动;包括位置传感器、速度传感器、加速度传感器、力传感器、压力传感器、力矩传感器、姿态传感器等。
外部传感器:外部传感器主要是感知机器人自身所处环境以及自身和环境之家的相互信息,包括视觉、力觉等。包括激光雷达、嗅觉传感器、视觉传感器、语音合成、语音识别、可见光和红外线传感器等。
(2)传感器在智能机器人的应用
视觉和接近传感器:类似于自动驾驶车辆所需的传感器,包括摄像头、红外线、声纳、超声波、雷达和激光雷达。某些情况下可以使用多个摄像头,尤其是立体视觉。将这些传感器组合起来使用,机器人便可以确定尺寸,识别物体,并确定其距离。
触觉传感器:微型开关是接触传感器最常用型式,另有隔离式双态接触传感器(即双稳态开关半导体电路)、单模拟量传感器、矩阵传感器(压电元件的矩阵传感器、人工皮肤——变电导聚合物、光反射触觉传感器等)。
射频识别(RFID)传感器:可以提供识别码并允许得到许可的机器人获取其他信息。
声学传感器(麦克风):帮助机器人接收语音命令并识别熟悉环境中的异常声音。如果加上压电传感器,还可以识别并消除振动引起的噪声,避免机器人错误理解语音命令。先进的算法甚至可以让机器人了解说话者的情绪。
湿温度传感器:是机器人自我诊断的一部分,可用于确定其周遭的环境,避免潜在的有害热源。利用化学、光学和颜色传感器,机器人能够评估、调整和检测其环境中存在的问题。
运动稳定性感知:对于可以走路、跑步甚至跳舞的人形机器人,稳定性是一个主要问题。它们需要与智能手机相同类型的传感器,以便提供机器人的准确位置数据。在这些应用采用了具有3轴加速度计、3轴陀螺仪和3轴磁力计的9自由度(9DOF)传感器或惯性测量单元(IMU)。
传感器微型化趋势:过去传感器的性能与体积往往成正比,限制了其在机器人领域应用。芯片制程技术提升使微型传感器的制造成为可能,从而广泛应用于机器人领域。
(3)多传感器融合是未来趋势
多传感器信息融合技术是近年来十分热门的研究课题,指综合来自多个传感器的感知数据,经过融合的多传感器系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性。融合后的多传感器信息具有以下特性:冗余性、互补性、实时性和低成本性。
多传感器信息融合方法主要有贝叶斯估计、Dempster-Shafer理论、卡尔曼滤波、神经网络、小波变换等。
2.决策——机器人大脑
机器人决策我们认为是最具场景差异化的部分,因为不同职业场景下的工作方式、思维逻辑是大相径庭的;在机器人算法与决策方面的创业团队需要非常熟悉场景需求,提炼出标准化的操作流程,然后应用于机器人软硬件控制中。
想要让机器人解决问题我们需要完成三个步骤:第一,明确问题的方向和边界;第二,建立数学模型;最后,找到合适的算法解决问题。这里我们重点讨论将复杂的现实问题转化为数学语言的“建模”过程和选择算法的过程。
建模的第一步需要确定假设。我们需要先明确想让机器人做出什么样精度的决策,以及能否实现,从而确定需要考虑和舍弃哪些要素。在确定了重要变量和核心关系后,我们就把复杂的现实问题转化成计算机可以理解、算法可以处理的数学问题。确定假设后,常识能帮助我们验证模型,但是多数情况下需要我们不断地将模型和现实问题作比较,从而把现实问题尽可能无损地映射进计算机里面。
在建立了模型后,我们需要选择合适的算法来解决不同模型对应的具体现实问题。在进行算法选择的时候需要具体问题具体分析,兼顾“质量”与“效率”。比如同样是让计算机处理图像数据,家庭场景下的扫地机器人和专门用来处理天文观测数据的计算机对算法要求就不一样:前者要求在较快的时间内完成对图像精准度适中的处理,而后者对时间则无感,对精准度有极高的要求。也正是因为绝大多数问题不存在唯一解或者绝对正确的解,算法工程师需要根据机器人工作的场景和目标做出最合适的取舍。
在机器人决策环节中,让机器人自身的硬件处理多少计算任务是一个关键的问题。通常情况下,如果任务的执行依赖于多个机器人采集的多点数据,那么计算任务就更可能在多点数据汇集起来后,被放在远端的云服务器上进行处理。比如,如果有大量的机器人在特定的街区内追捕嫌犯,那么我们就需要所有机器人把采集到的图像等信息上传到云端处理,在一个“大脑中枢”规划了每一个机器人的路径后,每个机器人执行自己所接收到的指令。当然,多数情况下应用云计算的场景是,每个机器人自身的芯片算力不足或者单位能耗过大。云计算提供了一种更加经济的算力解决方案,帮助机器人解决所面临的问题。在此基础上,为了避免网络带宽不足、处理时间过长等问题,人们还会使用边缘计算、雾计算等方案。
以上是机器人决策部分所需要考虑的共性问题。当然,不同场景下机器人所面临的的决策问题非常不同,我们认为这也是机器人应用中最具场景差异化的部分。不过站在更高的维度上进行抽象后,我们依然能够发现大多数机器人都需要面对三大类决策问题:按照什么规则移动位置——移动决策、按照什么规则调整自身——机械臂运动决策,以及如何保障贯彻人类指令——人机交互决策。
(1)平面移动能力
定位导航技术需要机器人的感知能力,需要借助视觉传感器(如激光雷达)来帮助机器人完成周围环境的扫描,并配合相应的算法,构建有效的地图数据,以完成运算,最终实现机器人的自主定位导航。
同步定位:主要涉及激光SLAM以及视觉SLAM。前者主要采用2D或3D激光雷达进行数据搜集,后者主要有两种技术路径——基于RGBD的深度摄像机和基于单目、双目或鱼眼摄像头。
地图构建:机器人学中的地图构建主要有4种:栅格地图、特征点地图、直接表征法以及拓扑地图。
路径规划:路径规划是导航研究中的一个重要环节,主要方法有3种:基于事例的学习方法、基于环境模型的规划方法、基于行为的路径规划方法。
(2)三维空间运动能力
空间机械臂操控过程中涉及的5项关键技术,包括:交会对接与捕获技术、自主规划与智能控制技术、传感与感知技术、智能协同与操控技术及系统安全保障技术。
视觉系统的是智能机械臂三维运动最重要的组成部分,主要由计算机、摄影设备及图像采集设备构成。机器人视觉系统工作过程主要有图像采集、图像分析、图像输出等,其中,图像特征分析、图像辨别、图像分割均为关键任务,视觉信息的压缩和滤波处理、特定环境标志识别、环境和故障物检测等是视觉信息处理中难度最大、最核心的过程。
(3)人机交互能力
语音交互:结合语音人机交互过程,人机交互中的关键技术中包含了自然语音处理、语义分析和理解、知识构建和学习体系、语音技术、整合通信技术以及云计算处理技术。
视觉交互:机器人如果需要理解人类的感情,就会涉及人脸识别技术,包括特征提取及分类。
手势交互:目前,常用的手势识别方法主要包括基于神经网络的识别方法、基于隐马尔可夫模型的识别方法和基于几何特征的识别方法。
3.控制——机器人运动能力
(1)常见的运动控制部件
机器人三大核心零部件为减速器、伺服电机、控制器,三大部件成本占机器人成本70%左右,其中减速器占成本构成35%左右,伺服电机占23%左右,控制器占12%左右。
我国工业机器人零部件目前仍处于追赶者,核心零部件主要依赖进口,但国产厂商(如埃斯顿、汇川技术、绿的谐波等)目前正在由守转攻的转折点,市占率即将超过50%,正在开始获得国外头部客户订单;我们认为机器人核心零部件进口只是短期问题,未来3-5年我国在制造水平及成本上有望全面赶超国外水平。
在服务机器人领域(如餐饮、清洁、递送等机器人),我国零部件及本体制造已达到全球领先水平;在供应链优势下,技术及成本上有望进一步突破。
数据来源:公司公告、浙商证券研究所,部分国产份额为预估值
(2)机器人运动如何进一步发展
与其他形态的机器人(如履带式、轮式等)相比,腿足式机器人在移动范围和灵活性上有巨大优势。但是实现行走乃至跑跳对腿足式机器人来说并不容易,除了BostonDynamics研发的腿足式机器人(如Atlas)之外,我们很少看到其他公司研发出灵活的、具有优秀平衡感腿足式机器人
要想让机器人像人一样灵巧、平稳地移动,并在此基础上完成复杂的任务,机器人的每一步都需要动态平衡,需要对瞬间的不稳定性有极强的适应能力。这包括需要快速调整脚的着地点,计算出突然转向需要施加多大的力,更重要的是还要在极短的时间内向足部实施非常大而又精准的力。这对控制理论、系统集成和工程实现等多个
人工智能技术在机器人领域的应用分析
辽宁省大连市第八中学 刘皓明 116021
摘要:时代犹如滚滚浪潮不断前进,而随着我国制造强国战略的逐步深化,科技逐渐成为推动时代发展的最强推动力,人工智能制造成为了“中国制造2025”明确的主攻方向,而机器人方面更是智能制造发展的坚实基础。可以预测在未来,人工智能与机器人技术将进一步融合并取得更高的进步,逐步推动我国大国工业发展进步。关键词:人工智能;机器人;应用分析 1引言 人工智能这个术语包含了一个在操作和行为方面都是智能的机器的整个概念化。预计到2024年人工智能市场到将达到3万亿美元,公司和政府机构都在人工智能和机器人领域投入了大量资金。随着我们周围信息可用性的增长,人类将越来越依赖人工智能系统来生活、工作和娱乐。考虑到人工智能系统的准确性和复杂性的提高,它们将被用于越来越多样化的领域,包括金融、制药、能源、制造业、教育、运输和公共服务。人工智能机器人将改变我们社会的未来—我们的生活习惯、我们的生活环境和我们的经济。 2人工智能概述 2.1人工智能概念 人工智能(AI)是一个常用的名称,旨在科学领域为机器提供执行逻辑、推理、计划、学习和感知等能力。尽管定义中只提到了机器,但后面所述的能力可适用于任何类型的生活智能[1]。同样地,智力的意义,如它在灵长类动物和其他特殊动物中那样,它可以扩展到创造力、情感知识和自我意识。 人工智能这个词与“符号人工智能”领域密切相关,该领域一直流行到20世纪80年代末。为了克服符号人工智能的一些局限性,神经网络、模糊系统、进化计算和其他计算模型等子计算方法开始流行,导致“计算智能”术语成为人工智能的一个子领域。如今,人工智能这个术语包含了一个在操作和社会后果方面都是智能的机器的整个概念化。罗素和诺维格提出了一个实际的定义:“人工智能是研究人工复制的人类智能和行为,使其结果与其设计具有合理的合理性水平”[2]。这一定义可以通过规定对于特定和明确的任务的理性水平甚至可以取代人类来进一步细化。 2.2人工智能应用分析 目前的人工智能技术被用于在线广告、驾驶、航空、医学和个人辅助图像识别。人工智能最近的成功吸引了科学界和公众的想象力。其中的一个例子是配备了自动转向系统的车辆,也被称为自动驾驶汽车。每辆车都配备了一系列的激光雷达传感器和照相机,使它们能够识别其三维环境,并提供了在可变的、真实的交通道路条件下对机动做出智能决策的能力。另一个例子是由谷歌深度思维公司开发的阿尔法-Go,用于棋盘游戏。前几年阿尔法击败了韩国大师李世石,成为第一台击败职业选手的机器,最近它在中国战胜了目前世界排名第一的柯洁。这导致了许多人的兴奋和恐惧,即人工智能将在人类进入的所有领域超越人类。然而真实而完整的人工智能还不存在。在这个层面上,人工智能将模仿人类的认知,使其能够实现梦想、思考、感受情感和有自己的目标。虽然还没有证据表明这种真正的人工智能在2050年之前可能存在,但推动人工智能向前发展的计算机科学原则正在迅速发展。 3人工智能与机器人技术 3.1人工智能和机器人是两个独立的技术领域 (1)什么是机器人? 机器人是一种自主的物理机器,设计成能够快速准确地自动执行动作。与人体相似的机器被称为机器人。然而,许多机器人没有像人类一样的构造。例如,在制造业中挑选和放置物品的机器人一点也不像人类。 (2)什么是人工智能? 人工智能是计算机、机器执行人们通常执行的任务的能力。例如,学习、决策和解决问题的能力。人工智能通过特殊的软件工作,包括算法和技术(如有监督和无监督的机器学习),允许机器从经验中学习并调整自己的行动,而无需人工干预。人工智能的目的是采取最有可能实现特定目标的行动。 (3)机器人与人工智能的关键区别 机器人具有物理形态,可能需要也可能不需要人工智能来完成特定任务。相比之下,人工智能是一个软件程序,所以它不需要是物理形态的。作为一种软件,人工智能可以在手机、笔记本电脑、平板电脑甚至机器人等不同的设备或机器上运行。然而,许多机器人不是人工智能的。 (4)什么是人工智能机器人? 人工智能机器人是人工智能和机器人技术的结合,人工智能软件嵌入机器人系统。换句话说,人工智能在使机器人智能化方面占有关键地位。最先进的机器人是那些由人工智能控制的机器人,它们可以从环境和经验中学习,然后基于这些知识建立自己的能力。许多行业大规模使用机器人。一些最热门的机器人种类包括协作机器人、仓储和物流自动化、农业机器人和自动驾车辆[3]。人工智能机器人的主要优点是把人们不喜欢做的重复性任务自动化,确保更多的机会和时间专注于有价值的工作。人工智能机器人正在改变我们的世界,企业需要接受这些新技术,同时增强和补充人类智能。 3.2支撑人工智能机器人的子领域和关键技术 人工智能是一个多样化的研究领域,以下子领域对它的发展至关重要。这些方法包括神经网络、模糊逻辑、进化计算和概率方法[4]。
期刊文章分类查询,尽在期刊图书馆 (1)人工神经网络 神经网络建立在连接主义领域,主要目的是模仿神经系统处理信息的方式。人工神经网络(ANN)和变体允许人工智能执行相对于“感知”的任务。当与当前的多核并行计算硬件平台相结合时,许多神经层可以堆叠,在学习自己的特性集时提供更高层次的感知抽象,从而消除了对手工特性的需要;一个被称为深度学习的过程。 (2)深度学习 深度学习是机器学习的一部分,通常与深度神经网络和由细节或数据表示的多层次学习组成的深度神经网络相连。通过这些不同的层,信息从低级参数传递到高级参数。这些不同的层次对应于不同层次的数据抽象,从而导致了学习和识别。许多深度学习架构,如深度神经网络、深度卷积神经网络和深度信念网络,已经被应用于计算机视觉、自动语音识别、音频和音乐信号识别等领域,这些领域已经被证明可以在各种任务中产生最前沿的结果。 (3)模糊逻辑 模糊逻辑侧重于对通常不精确的信息的操作。大多数计算智能原理解释了这样一个事实,尽管观察总是准确的,但我们对上下文的知识往往是不完整的或不准确的,就像在许多真实情况下一样。模糊逻辑提供了一个框架,假设一组观测值的不精确程度,以及结构元素来增强学习模型[5]的可解释性。它确实为人工智能方法的形式化提供了一个框架,以及将人工智能模型转换为电子电路。然而,模糊逻辑本身并不提供学习能力,因此它通常是与其他方面的结合,如神经网络、进化计算或统计学习。进化计算依赖于自然选择的原则,或集体行为的自然模式。两个最相关的子领域包括遗传算法和群体智能。它对人工智能的主要影响是对多目标优化,其中它可以产生非常鲁棒的结果。这些模型的局限性就像关于可解释性和计算能力的神经网络一样。 4人工智能机器人应用分析 (1)商业机器人 商业机器人,它使用人工智能自主移动并与人通信。它能够回答问题、识别面孔、提供有关公司服务的信息、扫描和填写文档、接受付款以及显示促销信息。该机器人与第三方服务和外部系统(如数据库、网站和在线服务)无缝连接。这个机器人有各种各样的应用,可以充当顾问、推动者、建筑经理、导游、导航助手以及测量肺活量、体温和血糖等健康指标的评估员。 现场监控机器人是一种引人注目的机器人,比如它可以跟踪建筑项目的进度。在人工智能的驱动下,这种自主机器人可以在建筑工地上移动,对建筑工程进行精确扫描,然后分析数据发现质量问题,并监控整体进度。机器人将收集到的数据发送到云平台进行进一步处理。此过程有助于防止代价高昂的错误,甚至显示出健康或安全问题,例如边缘保护中的漏洞。从整个建筑工地收集这样的数据是一项耗时的任务,这种人工智能机器人不仅节省了时间,减少了返工和浪费,而且保证了高质量的施工。 (2)物流分拣机器人 分拣机器人能够从一个盒子里取出一个物品,扫描它,然后将它放在另一个盒子或分拣系统中。机器人可以自主地从一组非结构化的对象中识别和选择一个物品,然后再将其放入另一个目标中。拣选和放置任务是仓库中仍由人类执行的重复性工作之一,这种机器人能自动完成这项任务,每天24小时,每小时能完成数百个周期。在人工智能的推动下,机器人可以分析每个项目的位置、形状和特征,对其进行检测和处理。为了识别物品,机器人使用条形码、RFID或物品图片。对于检查任务,它分析形状、重量和运动以检测任何异常或质量问题。分拣机器人与仓库管理系统(WMS)、仓库控制系统(WCS)或专有控制软件集成,以确保仓库操作的端到端效率[6]。 (3)家用机器人 家用机器人可以是自主的机器人厨房助理,可以帮助厨师准备新鲜的汉堡和油炸食品,比如脆皮鸡和土豆片。例如,在烤架上烹饪时,它可以自动检测何时放置生汉堡肉饼,实时监控每个肉饼,并在生肉和熟肉之间切换。在油炸锅烹饪时,它可以拿起篮子放在油炸锅里,在煎炸食物时轻轻摇动篮子,监控烹饪时间等。机器人的大脑由云连接的人工智能提供动力,它可以从周围环境中学习,并随着时间的推移获得新的技能。 例如Moley机器人公司是一家创造了世界上第一个机器人厨房的公司——一个全自动和智能烹饪机器人系统。机器人厨房系统包括一整套电器、橱柜、计算机、安全功能和机械臂。它使用来自世界各地顶级厨师的预设食谱,以大师级厨师的技能烹饪。通过一双完全关节化的机器人手来再现人类的手部动作,这个系统可以精确地模仿主厨的动作,烹饪美味的菜肴,并在自己之后进行清理!此外,它还可以学习食谱,制作来自世界各地的饭菜,甚至可以自己烹饪食谱。独自一人。机器人厨房由自己的触摸屏控制或通过智能手机远程控制。不使用时,机械臂会从视野中缩回。Moley被餐饮业、航空公司、厨房开发商甚至厨师培训学校的主要参与者使用。 5结语与展望 总的来说,人工智能的迅速发展,加快了社会生产力进步的步伐,也为机器人领域做着巨大贡献。只要本着科学发展的理念,推动智能制造与机器人技术不断向前迈进,必定能强化人工智能在机器人领域的运用,加快生活步入人工智能化的的步伐,解放生产劳动力,提高社会生产效益,为社会经济发展提供更大动力。参考文献[1]王永庆.人工智能原理与方法[M].西安交通大学出版社,1998.[2]史忠植.高级人工智能[M].科学出版社,2011.[3]田金萍.人工智能发展综述[J].科技广场,2007,000(001):230-232.[4]孙怡宁.浅谈人工智能与机器人的发展趋势[J].电子测试,2016(23).[5]李博.游戏人工智能关键技术的研究[D].上海交通大学.[6]陶亚楠,李明昊.浅析新一代人工智能机器人的发展[J].数码世界,2019,000(006):2.
智能机器人4大类关键技术和应用
2)能够靠自动控制实行作业;
3)能够重新编程作业内容
只具有第1项功能的装置是操作机,操作机再加上第2或第3项功能的为准机器人。
人们通常把机器人划分为三代
第一代是可编程机器人。这种机器人一般可以根据操作人员所编的程序,完成一些简单的重复性操作。这一代机器人是从60年代后半叶开始投入实际使用的,目前在工业界已得到广泛应用。
第一代是可编程机器人。这种机器人一般可以根据操作人员所编的程序,完成一些简单的重复性操作。这一代机器人是从60年代后半叶开始投入实际使用的,目前在工业界已得到广泛应用。
图:世界上第一台可编程的机器人
第二代是“感知机器人”,又叫做自适应机器人。它在第一代机器人的基础上发展起来的,能够具有不同程度的“感知”周围环境的能力。这类利用感知信息以改善机器人性能的研究开始于70年代初期,到1982年,美国通用汽车公司为其装配线上的机器人装配了视觉系统,宣告了感知机器人的诞生,在80年代得到了广泛应用。
第二代是“感知机器人”,又叫做自适应机器人。它在第一代机器人的基础上发展起来的,能够具有不同程度的“感知”周围环境的能力。这类利用感知信息以改善机器人性能的研究开始于70年代初期,到1982年,美国通用汽车公司为其装配线上的机器人装配了视觉系统,宣告了感知机器人的诞生,在80年代得到了广泛应用。
图:美国RethinkRobotics公司的自适应型低成本机器人
第三代机器人将具有识别、推理、规划和学习等智能机制,它可以把感知和行动智能化结合起来,因此能在非特定的环境下作业,称之为智能机器人。1956年在达特茅斯会议上,马文•明斯基提出了他对智能机器的看法:智能机器能够创建周围环境的抽象模型,如果遇到问题,能够从抽象模型中寻找解决方法”。这个定义一直影响着智能机器人的研究方向。
第三代机器人将具有识别、推理、规划和学习等智能机制,它可以把感知和行动智能化结合起来,因此能在非特定的环境下作业,称之为智能机器人。1956年在达特茅斯会议上,马文•明斯基提出了他对智能机器的看法:智能机器能够创建周围环境的抽象模型,如果遇到问题,能够从抽象模型中寻找解决方法”。这个定义一直影响着智能机器人的研究方向。
智能机器人与工业机器人的根本区别在于,智能机器人具有感知功能与识别、判断及规划功能。而感知本身,就是人类和动物所具有的低级智能。
因此机器的智能分为两个层次:
①具有感觉、识别、理解和判断功能;
②具有总结经验和学习的功能。
所以,人们通常所说的第二代机器人可以看作是第一代智能机器人。
智能机器人是一个在感知-思维-效应方面全面模拟人的机器系统,外形不一定像人。它是人工智能技术的综合试验场,可以全面地考察人工智能各个领域的技术,研究它们相互之间的关系。还可以在有害环境中代替人从事危险工作、上天下海、战场作业等方面大显身手。
二、智能机器人涉及的理论、技术
简单来说,智能机器人就是以人工智能决定其行动的机器人。目前研制中的智能机器人智能水平并不高,只能说是智能机器人的初级阶段。智能机器人研究中当前的核心问题有两方面:一方面是,提高智能机器人的自主性,这是就智能机器人与人的关系而言,即希望智能机器人进一步独立于人,具有更为友善的人机界面。从长远来说,希望操作人员只要给出要完成的任务,而机器能自动形成完成该任务的步骤,并自动完成它。另一方面是,提高智能机器人的适应性,提高智能机器人适应环境变化的能力,这是就智能机器人与环境的关系而言,希望加强它们之间的交互关系。
智能机器人涉及到许多关键技术,这些技术关系到智能机器人的智能性的高低。这些关键技术主要有以下几个方面:
多传感信息耦合技术,多传感器信息融合就是指综合来自多个传感器的感知数据,以产生更可靠、更准确或更全面的信息,经过融合的多传感器系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性;
导航和定位技术,在自主移动机器人导航中,无论是局部实时避障还是全局规划,都需要精确知道机器人或障碍物的当前状态及位置,以完成导航、避障及路径规划等任务;
路径规划技术,最优路径规划就是依据某个或某些优化准则,在机器人工作空间中找到一条从起始状态到目标状态、可以避开障碍物的最优路径;机器人视觉技术,机器人视觉系统的工作包括图像的获取、图像的处理和分析、输出和显示,核心任务是特征提取、图像分割和图像辨识;
智能控制技术,智能控制方法提高了机器人的速度及精度;人机接口技术,人机接口技术是研究如何使人方便自然地与计算机交流。
多传感信息耦合技术,多传感器信息融合就是指综合来自多个传感器的感知数据,以产生更可靠、更准确或更全面的信息,经过融合的多传感器系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性;
导航和定位技术,在自主移动机器人导航中,无论是局部实时避障还是全局规划,都需要精确知道机器人或障碍物的当前状态及位置,以完成导航、避障及路径规划等任务;
路径规划技术,最优路径规划就是依据某个或某些优化准则,在机器人工作空间中找到一条从起始状态到目标状态、可以避开障碍物的最优路径;机器人视觉技术,机器人视觉系统的工作包括图像的获取、图像的处理和分析、输出和显示,核心任务是特征提取、图像分割和图像辨识;
智能控制技术,智能控制方法提高了机器人的速度及精度;人机接口技术,人机接口技术是研究如何使人方便自然地与计算机交流。
智能机器人的关键技术
(一)智能机器人的智能
在人工智能研究方面,人们一直沿着模拟脑方向做出努力,研究的内容主要包括:
①理解自然智能(特别是人类智能)的认知机理与决策机理;
②探索各种模拟和实现自然智能工作机理(包括认知的机理和决策的机理)的方法与途径;
③根据经济与社会发展的需要,研制具有一定智能水平的机器系统;
④把智能系统应用于国家经济建设与社会服务各领域,促进科学技术和经济社会发展的智能化。
(二)智能机器人的能源
机器人的能源问题是机器人能否得到广泛应用的基础。要让机器人走出工厂,走出房门,就必须考虑机器人的能源问题。现在的高能电池要么十分昂贵,要么体型巨大,而很多机器人都注定是一个高耗能的机器。因此,能源问题,几乎是机器人的一道门槛。迈不出门槛,机器人就只能是室内插电源线的“室内机器人”。
智能机器人的机动性要求动力源轻、小、出力大。而现有的移动机器人无一例外地拖着“辫子”。以动力源的重量/功率之比为例,目前电池约达到60g/W(连续使用小时),汽油机约为1.3g/W,都不理想,而且使用有局限性。到目前为止,尚未见到改善动力源的有效办法。电机仍然是智能机器人的主要驱动器。要使智能机器人的作业能力与人相当,它的指、肘、肩、腕各关节大致需要3-300Nm的输出力矩和30-60r/min的输出转速。传统伺服电机的重量/功率之比约为30g/W,而人在百米跑和投掷垒球时腿、肩、臂的出力大约为1g/W,相差甚大。
总之,智能机器人性能指标的改进是无止境的,对驱动器的要求也越来越高。什么是客观的衡量标准呢?一个容易接受的办法就是把它与人的体能加以比较。从这个角度来看,智能机器人驱动技术目前差距还相当大。
(三)智能机器人的运算速度
在人们对智能机器人的期望中,都希望机器人能够在极端环境下完成复杂的工作。有的机器人可能需要很小,而且需要完成的工作又极其复杂。这就对现代芯片集成工艺提出了挑战。这种机器人需要集成度更高,运算速度更快,而且能够在极端环境下正常工作的芯片。由于运算器速度的限制,导致许多人类可以轻易完成的任务,而在机器人身上几乎是无法完成的。
解决运算速度的方法有二:
其一是芯片制造工艺上的发展。就像前面说的那样,提高芯片的集成化。但是在现在看来,芯片的集成技术似乎发展到了一个瓶颈的地步。微型的芯片似乎已经到了一个很高的地步。
第二种解决方法就是采用物联网的方式来管理机器人。用一个终端服务器来对机器人遇见的问题进行统一运算。这就是把机器人的“脑袋”统一管理,这样就不需要把用于运算的芯片做得很小了。只要网络传输的速度能符合要求就够了。随着物联网的推广,以后给每一个机器人分一个IP地址也不是问题。所以这种解决方法也是很有前景应用价值的。即运算速度的关键问题,就是远程控制通讯问题以及芯片制造工艺问题。
其一是芯片制造工艺上的发展。就像前面说的那样,提高芯片的集成化。但是在现在看来,芯片的集成技术似乎发展到了一个瓶颈的地步。微型的芯片似乎已经到了一个很高的地步。
第二种解决方法就是采用物联网的方式来管理机器人。用一个终端服务器来对机器人遇见的问题进行统一运算。这就是把机器人的“脑袋”统一管理,这样就不需要把用于运算的芯片做得很小了。只要网络传输的速度能符合要求就够了。随着物联网的推广,以后给每一个机器人分一个IP地址也不是问题。所以这种解决方法也是很有前景应用价值的。即运算速度的关键问题,就是远程控制通讯问题以及芯片制造工艺问题。
近年来,传感器技术发展迅速。一些普通的传感器的价格也越来越便宜。但即使这样,运行了先进传感器技术的现代机器人在一些问题上,任然无法达到人类感触外界的能力。
人类的“传感器”很小,一个神经细胞就是人类的传感器。人的身体外部皮肤,几乎处处都可以起到温觉传感器和压力传感器的作用。人类的耳朵结构也不是话筒就可以简单代替的。人类的眼球里,就有很多“光敏传感器”。这些“光敏传感器”协同工作能力,以及两个眼睛的协同工作能力,也不是简单的两个摄像头可以解决得了的。相对于智能生物---人类而言,现有的传感器技术还远远不够。
智能机器人身上的传感器,应该需要满足以下特点:
①体积小,能耗低或者不耗能。
②初步具有一些物理处理事件的能力。不能把所有的问题都传给“大脑”来处理。
③传感器与传感器之间需要能够互相通信。当一个范围内的传感器都接收到信号时,那个范围内的传感器可以经过通信处理后,决定发送一个统一的信号给计算机处理。
(五)智能机器人驱动方式
到目前为止,现有的大部分机器人和机器的驱动几乎都是依靠电机进行驱动的。我们知道电机可以提供扭矩,可以驱动旋转副。然而人类肢体运动的驱动方式是依靠肌肉的伸缩来完成的。这种驱动方式比电机耗能要低得多。现有的技术中,气压和液压似乎是可以代替人工肌肉来实现伸缩的功能。但是这两种方式都需要气压泵或者液压泵。如果真用气压和液压来驱动机器人,那么要么机器人背着一个气压泵或者液压泵走,要么让机器人脱着一根管子走。这两种方式都不大理想。除非解决了气压泵或者液压泵的重量,体积,以及能耗问题。
必须寻找能够替代气压和液压的东西来解决驱动方式的问题。伸缩的驱动方式在理论上磨损要比旋转的驱动方式要低。现有的智能机器人,比如说日本的一款用来模拟人类表情的机器人。这种机器人的脸上几乎就布满了微型电机。以这种发展趋势看,目前几乎没有完美的解决智能机器人驱动方式的方法。依靠电机的小型化来实现一连串合成且又复杂的动作,必定会增加控制上和能耗上的负担。好比是饮鸩止渴。
三、智能机器人的广泛应用
现代智能机器人基本能按人的指令完成各种比较复杂的工作,如深海探测、作战、侦察、搜集情报、抢险、服务等工作,模拟完成人类不能或不愿完成的任务,不仅能自主完成工作,而且能与人共同协作完成任务或在人的指导下完成任务,在不同领域有着广泛的应用。
智能机器人在各种具体场合可以为人们提供智能化服务:可以在工业生产流水线上执行一定工作流程任务(比如车钳铣刨等操作、设备保养、产品装配、产品检验、材料供应与管理)的智能机器人,可以完成农业生产特定作业(比如选种、育种、播种、施肥、收割、运输)的智能机器人,可以提供特定社会服务(比如文化教育、景点导游、语言翻译、售票检票、宾馆服务、医疗监护、清洁卫生)的智能机器人,可以执行特定家政服务(比如家庭保安、家务劳作、看护老人、照看婴儿、菜肴烹调、餐具清洗)的智能机器人。
在国防领域中,军用智能机器人得到前所未有的重视和发展。近年来,美英等国研制出第二代军用智能机器人,其特点是采用自主控制方式,能完成侦察、作战和后勤支援等任务,在战场上具有看、嗅等能力,能够自动跟踪地形和选择道路,具有自动搜索、识别和消灭敌方目标的功能。如美国的Navplab自主导航车,SSV自主地面战车等。在未来的军事智能机器人中,还会有智能战斗机器人、智能侦察机器人、智能警戒机器人、智能工兵机器人、智能运输机器人等等,成为国防装备中新的亮点。
在服务工作方面,世界各国尤其是西方发达国家都在致力于研究开发和广泛应用服务智能机器人,以清洁机器人为例,随着科学技术的进步和社会的发展,人们希望更多地从繁琐的日常事务中解脱出来,这就使得清洁机器人进入家庭成为可能。
日本公司研制的地面清扫机器人,可沿墙壁从任何一个位置自动启动,利用不断旋转的刷子将废弃物扫入自带容器中;车站地面擦洗机器人工作时一面将清洗液喷洒到地面上,一面用旋转刷不停地擦洗地面,并将脏水吸入所带的容器中;工厂的自动清扫机器人可用于各种工厂的清扫工作。
美国的一款清洁机器人“Roomba”具有高度自主能力,可以游走于房间各家具缝隙间,灵巧地完成清扫工作。
日本公司研制的地面清扫机器人,可沿墙壁从任何一个位置自动启动,利用不断旋转的刷子将废弃物扫入自带容器中;车站地面擦洗机器人工作时一面将清洗液喷洒到地面上,一面用旋转刷不停地擦洗地面,并将脏水吸入所带的容器中;工厂的自动清扫机器人可用于各种工厂的清扫工作。
美国的一款清洁机器人“Roomba”具有高度自主能力,可以游走于房间各家具缝隙间,灵巧地完成清扫工作。
瑞典的一款机器人“三叶虫”,表面光滑,呈圆形,内置搜索雷达,可以迅速地探测到并避开桌腿、玻璃器皿、宠物或任何其它障碍物。一旦微处理器识别出这些障碍物,它可重新选择路线,并对整个房间做出重新判断与计算,以保证房间的各个角落都被清扫。
瑞典的一款机器人“三叶虫”,表面光滑,呈圆形,内置搜索雷达,可以迅速地探测到并避开桌腿、玻璃器皿、宠物或任何其它障碍物。一旦微处理器识别出这些障碍物,它可重新选择路线,并对整个房间做出重新判断与计算,以保证房间的各个角落都被清扫。
甚至在体育比赛方面,也得到了很大的发展,近年来在国际上迅速开展起来足球机器人与机器人足球高技术对抗活动,国际上已成立相关的联合会FIRA,许多地区也成立了地区协会,已达到比较正规的程度且有相当的规模和水平。
机器人足球赛目的是将足球(高尔夫球)撞入对方球门取胜。球场上空(2m)高悬挂的摄像机将比赛情况传入计算机内,由预装的软件做出恰当的决策与对策,通过无线通讯方式将指挥命令传给机器人。机器人协同作战,双方对抗,形成一场激烈的足球比赛。在比赛过程中,机器人可以随时更新它的位置每当它穿过地面线截面,双方的教练员与系统开发人员不得进行干预。机器人足球融计算机视觉、模式识别、决策对策、无线数字通讯、自动控制与最优控制、智能体设计与电力传动等技术于一体,是一个典型的智能机器人系统。
现代智能机器人不仅在上述方面有广泛应用,而将渗透到生活的各个方面:像在煤炭工业在矿业方面,考虑到社会上对煤炭需求量日益增长的趋势和煤炭开采的恶劣环境,将智能机器人应用于矿业势在必行。在建筑方面,有高层建筑抹灰机器人、预制件安装机器人、室内装修机器人、擦玻璃机器人、地面抛光机器人等。在核工业方面,主要研究机构灵巧、动作准确可靠、反应快、重量轻的机器人等等。智能机器人的应用领域的日益扩大,人们期望智能机器人能在更多的领域为人类服务,代替人类完成更多更复杂的工作。
一网打尽系列文章,请回复以下关键词查看:创新发展:习近平|创新中国|创新创业|科技体制改革|科技创新政策|协同创新|成果转化|新科技革命|基础研究|产学研|供给侧热点专题:军民融合|民参军|工业4.0|商业航天|智库|国家重点研发计划|基金|装备采办|博士|摩尔定律|诺贝尔奖|国家实验室|国防工业|十三五预见未来:预见2016|预见2020|预见2025|预见2030|预见2035|预见2045|预见2050|前沿科技:颠覆性技术|生物|仿生|脑科学|精准医学|基因|基因编辑|虚拟现实|增强现实|纳米|人工智能|机器人|3D打印|4D打印|太赫兹|云计算|物联网|互联网+|大数据|石墨烯|能源|电池|量子|超材料|超级计算机|卫星|北斗|智能制造|不依赖GPS导航|通信|MIT技术评论|航空发动机|可穿戴|氮化镓|隐身|半导体|脑机接口先进武器:中国武器|无人机|轰炸机|预警机|运输机|战斗机|六代机|网络武器|激光武器|电磁炮|高超声速武器|反无人机|防空反导|潜航器|未来战争:未来战争|抵消战略|水下战|网络空间战|分布式杀伤|无人机蜂群领先国家:俄罗斯|英国|日本|以色列|印度前沿机构:战略能力办公室|DARPA|Gartner|硅谷|谷歌|华为|俄先期研究基金会|军工百强前沿人物:钱学森|马斯克|凯文凯利|任正非|马云专家专栏:黄志澄|许得君|施一公|王喜文|贺飞|李萍|刘锋|王煜全|易本胜|李德毅|游光荣|刘亚威|赵文银|廖孟豪全文收录:2016文章全收录|2015文章全收录|2014文章全收录其他主题系列陆续整理中,敬请期待……返回搜狐,查看更多机器人的特点有哪些
机器人的特点有哪些优点:机器人和自动化技术在多数情况下可以提高生产率,安全性,工作效率,产品质量和产品的统一性;
机器人可以在危险的环境下工作,而无需考虑生命保障或安全的需要;
机器人无需舒适的环境,例如考虑照明,空调,通风以及噪音隔离等。
机器人能不知疲倦,不知厌烦地持续工作,他们不会有心理问题,做事不拖沓,不需要医疗保险或假期;
机器人除了发生故障或磨损外,将始终如一地保持精确度;
机器人具有比人高得多的精确度。直线位移精度可达千分之几英寸(1英寸=2.54cm),新型的半导体晶片处理机器人具有微英寸级的精度;
机器人和其附属设备及传感器具有某些人类所不具备的能力;
机器人可以同时响应多个激励或处理多项任务,而人类只能响应一个现行激励。
缺点:机器人替代了工人,由此带来经济和社会问题;
机器人缺乏应急能能力,除非该紧急情况能够预知并已在系统中设置了应对方案,否则不能很好地处理紧急情况。同时,还需要有安全措施来确保机器人不会伤害操作人员以及与他一起工作的机器(设备)。这些情况包括:不恰当或错误的反应、缺乏决策的能力、断电、机器人或其它设备的损伤、人员伤害;
机器人尽管在一定情况下非常出众,但其能力在以下方面仍具有局限性(与人相比),表现在:自由度、灵巧度、传感器能力视觉系统、实时响应。
机器人有什么作用机器人是自动执行工作的机器装置。它既可以接受人工命令的功能,也可以运行预先编程的程序,并按照人工智能技术所规定的原则和程序行事。它的任务是协助或取代人类工作的,如原材料、工业、建筑、或危险的工作。
1、操作机器人:自动控制,重复编程,多功能,几自由度,固定或运动,用于相关自动化系统。
2、程控机器人:根据要求的顺序和条件,控制机器人的机械动作。
3、教再现机器人:通过引导或其他方式,首先教机器人动作,输入工作程序,机器人会自动重复操作。
4、数控机器人:不必使机器人动作,通过数值、语言等,来教机器人、机器人根据教学信息进行操作。
5、感觉控制型机器人:使用获得的信息通过传感器来控制机器人的运动。
6、适应控制型机器人:机器人能适应环境的变化,控制其自身的行动。
7、学习控制机器人:机器人可以“体验”工作经验,具有一定的学习功能,在工作中有“学习”的经验。
8、智能机器人:机器人,确定他们的行为与人工智能。