科学网—人形机器人:从“形似”到“神似”
人形机器人:从“形似”到“神似”
图片来源:unsplash
■本报记者张双虎
特斯拉CEO埃隆·马斯克已经着手“造梦”了。
8月26日,特斯拉官网挂出招聘人形机器人(TeslaBot)机械工程师、高级仿人机电机器人架构师和高级仿人建模机器人架构师的信息。
也许是马斯克描述的人形机器人过于炫酷,他宣布明年推出原型机的话音未落,即遭遇学术界和产业界的“群嘲”,多数评论认为这“是个笑话”。
要造出梦想中的机器人,究竟还有哪些瓶颈,还要跨越多少障碍?
“笑话”还是“梦想”
按照特斯拉公布的数据,TeslaBot身高1.72米,56.7公斤重,搭载特斯拉FSD(FullSelf-Driving)计算机和Autopilot摄像头,能携带约20公斤重物、以每小时5公里的速度移动。马斯克表示,这款机器人可以帮助人类去做那些危险和重复无聊的工作,比如跑腿或做家务。
“总体而言,特斯拉人形机器人的研发指标有可行性。”中国科学院自动化研究所复杂系统管理与控制国家重点实验室研究员王鹏对《中国科学报》说。
王鹏解释说,与波士顿动力等人形机器人研究机构或公司以技术突破、展示能力为出发点寻找应用场景的发展路线不同,TeslaBot以代替人工为出发点(执行危险、重复无聊的任务),以量产化产品为最终形态,这有利于其实现“技术—应用—商业”的良性循环,实现人形机器人的真正落地应用。
“特斯拉具备FSD计算机在内的软硬件系统、自动驾驶AI(人工智能)技术,其在汽车领域成功的经验也有助于这一新形态产品的研发和商业化。”王鹏说,“但TeslaBot在类人灵巧操作等能力方面仍存在较大不足,这需要全世界机器人领域研究者的共同努力。”
“如果不计成本去完成某些功能,机器人确实能够满足人们日常生活的一些需求。”新松机器人公司人工智能团队前负责人、目前转战工程机械领域AI技术赋能的王晓东对《中国科学报》说,“特斯拉人形机器人更偏重于服务类机器人。从整体趋势来说,服务类机器人正处于市场化起步阶段,需求量很大。与工业机器人相比,服务类机器人面对的环境更复杂。虽然实现通用型机器人还有很多困难,但特斯拉的创新能力很强,所以非常期待相关产品出现。”
“人人都有梦想。”中国科学院自动化研究所仿生进化机器人团队负责人、副研究员贾立好对《中国科学报》说,“人工智能领域的科研人员一直在探索智能的本质,认识自己,认识这个世界。马斯克也在践行着他的梦想,特斯拉发布的人形机器人计划可圈可点。”
超越“形似”的局限
“目前人形机器人研究大都集中在结构上‘形似’,功能上以运动和感知能力为主,特斯拉人形机器人也是如此。”王鹏说,“从公布的技术指标看,TeslaBot在灵巧操作能力上与人类相去甚远。”
例如,在TeslaBot的设计指标中,手部共12个驱动,即每只手只有6个驱动。与之相比,人类单手关节自由度就大于20个。所以,虽然它和人类一样有5根手指,却远远达不到其宣称的“人类水平(Human-Level)”。
“外形上与人手非常类似,但功能、自由度、内部结构及驱动方式等方面,与人手还存在非常大的差距。”王鹏说,“类人灵巧操作能力是机器人领域亟待解决的核心问题之一,也是机器人的短板。即使机器人手在自由度上能达到人类水平,在灵巧操作的控制、决策等方面如何构建具有类人适应能力和智能性的算法模型也是目前尚未解决的问题。”
对此,中国科学技术大学计算机科学与技术学院教授、机器人实验室主任陈小平有类似看法。
“机器人抓握是个十分困难的课题,难度超过我们的想象。”陈小平告诉《中国科学报》,“上述问题的背后,有一个共同的深层次问题——对人工智能及其难度的认识。”
陈小平认为,研究AI不到10年的人,通常会低估AI的难度;持续研究AI超过20年的人,通常会发现自己过去过于乐观了。
和人类相比,TeslaBot不只“颜色类相似,手爪不相如”,它向前迈出的每一步都很艰难。
为适应不同的应用场景、地形环境和任务,人类设计了各种类型的移动机器人,和其他机器人(四足、轮式)相比,让人形机器人走起来更具挑战性。
“轮式机器人直接借鉴了汽车等领域的成熟机械本体,车轮和地面连续接触,自带静态平衡稳定性,比较适合平坦路面。”贾立好介绍说,“两足机器人行走过程中,通常只有单腿支撑身体,在技术上需要高精密执行结构、传感器以及高精度建模与控制等软硬件方面的支撑,以维持机身稳定。此外,机器人往往还要结合上肢手臂运动实现各类仿人运动和操作,这个交互过程对机器人感知、规划和控制执行来说也是个巨大难题。”
王晓东认为,机器人要实现某一特定功能,不一定要拘泥于“人形”,比如扫地机器人,在处理清洁任务时就比人形更适合。
“机器人的应用场景很多,有适合人形机器人去做的,也有轮式、固定机械臂类机器人擅长的。”王鹏说,“大型人形机器人普遍成本较高,其应用或客户目标往往以家庭等服务场景为主,要求在功能和性能满足需求的同时,用户也买得起。因此,如何降低成本,是其真正走向市场、实现量产的关键。”
实现“神似”尚需时日
今天,不管在银行、酒店、商场还是车站,各种服务机器人并不鲜见,很多机器人的“聪明”程度甚至超出了我们的想象。
“世界范围内已出现了很多人形机器人商品与样机,但这些机器人能实现的功能比较单一,也缺乏比肩某种专用机器人的优势。”贾立好说,“另一方面,这些机器人往往使用了很高性能的电机关节等硬件设备,成本居高不下也是阻碍其走向全面应用的门槛之一。”
对国内当前机器人研究和发展的路径,王鹏认为,应以问题为导向,以应用场景为牵引,做有用的机器人,实现“技术—应用—商业”的良性循环。
“各类机器人的发展离不开应用场景和问题的牵引,可以通过简化或规范场景、梳理和分割任务,以及人机协作、人机共融等方式,实现机器人和人类的合理分工,在实现替代人工的同时,提高效率、降低成本,减少工人健康风险,降低碳排放。”王鹏说。
随着应用领域的不断延伸,机器人面临的任务和场景更加复杂,人们对其智能性、适应能力等方面的要求也越来越高。
“机器人的发展应在实现形似和简单功能的基础上,基于生物机制进行结构设计、研发高智能和可解释性算法,实现机器人与人类或其他生物的‘神似’。”王鹏说,“与脑科学、神经科学、材料科学,以及人工智能、集成电路等相关学科深度交叉融合,在加强应用牵引这一‘立地’目标的同时,开展具有前沿性的‘顶天’研究,强化前沿和基础研究,加强多学科交叉融合,是机器人性能取得突破的主要途径,也是实现中国机器人在技术上自主和引领的关键所在。”
《中国科学报》(2021-09-02第3版信息技术)
机器人发展简史
【20世纪60年代】
1961年,世界上第一个工业机器人Unimate开始加入通用汽车公司在新泽西州的工厂流水线,在装配线上与热压铸机合作。Unimate从机器上取下压铸件,焊接到汽车的车身。按照存储在磁鼓上的循序渐进的命令,4000榜磁臂具有足够的通用性,可以执行各种任务。工业机器人的出现,彻底改变了制造业。
1965年,约翰霍普金斯大学应用物理实验室研制出Beast机器人(约翰霍普金斯野兽)。Beast没有使用计算机,其控制电路由几十个控制模拟电压的晶体管组成,能通过声纳系统、光电管等装置,根据环境校正自己的位置。Beast是一个移动机器人,有初步的智能和独立生存的能力。当它在实验室的白色大厅里漫步时,它会寻找插座。当它找到一个,它会插入和充电。
1966年,Shakey(沙基)机器人是第一个真正可移动和感知的机器人。Shakey有轮子,以笨拙、缓慢、摇摇晃晃著称。Shakey配备了摄像头和碰撞传感器,可以在复杂的环境中导航。Shakey被认为是机器人革命的开始,该项目结合了机器人学、计算机视觉和自然语言处理的研究。正因为如此,这是第一个将逻辑推理和物理行为相结合的项目。Shaky是在斯坦福研究所人工智能中心(现在称为SRI国际)开发的。
1969年,维克多·舍曼发明了斯坦福臂,这是一种机器人臂,被认为是第一批完全由计算机控制的机器人之一。这是一个巨大的突破。它是六轴关节机器人。虽然主要用于教育目的,但“计算机控制”标志着工业机器的重大突破。
【20世纪70年代】
1970年,日本早稻田大学建造了第一个拟人机器人Wabot-1。它由肢体控制系统、视觉系统和会话系统组成,可以自行导航和自由移动,它甚至可以测量物体之间的距离。
它的手具有触觉传感器,这意味着它能抓住和运输物体。它的智力与18个月大的人类相当,标志着人形机器人技术的重大突破。1980年建成的Wabot-2,人形音乐家机器人,能够与人交流,读乐谱,在电子琴上演奏曲调。
1973年,德国库卡公司发布了Famulus,这是第一个具有六个机电驱动轴的工业机器人。
1974年,李察•霍恩(RichardHohn)开发了第一台由微型计算机驱动的工业计算机——明日工具(即T3)。
1976年,机器人Viking1和Viking2登陆火星。这两个机器人都是由放射性同位素热电发电机提供动力的,该发电机利用衰变钚释放的热量发电。它们是我们今天所知道的火星漫游者的先驱。
1976年,东京理工学院Shigeo-Hirose软钳机器人,可以顺应要抓握的物体的形状,比如一个装满鲜花的酒杯,其设计源于对自然界柔性结构的研究,如象鼻和蛇脊髓。
【20世纪80年代】
20世纪80年代:机器人正式进入了主流消费市场,尽管大部分都是简单的玩具。其中最受欢迎的机器人玩具是OmniBot2000,由远程控制,配备了一个托盘,用于提供饮料和零食。另一个备受追捧的机器人玩具是任天堂的R.O.B,或机器人操作伙伴。R.O.B.是任天堂娱乐系统的机器人播放器。它可以响应六个不同的命令,这些命令通过CRT屏幕上进行通信。
1989年,由麻省理工学院的研究人员制造的六足机器人Genghis(成吉思汗),被认为是现代历史上最重要的机器人之一。由于其体积小,材料便宜,Genghis被认为缩短了生产时间和未来空间机器人设计的成本。它有12个伺服电机和22个传感器,可以穿越多岩石的地形。
【20世纪90年代】
20世纪90年代初,机器人带着Cyberknife系统(射波刀,又称“立体定位射波手术平台”、“网络刀”或“电脑刀”)进入手术室,该系统可以通过外科手术治疗肿瘤。Cyberknife由斯坦福大学神经学教授约翰·R·阿德勒(JohnR.Adler)开发,是一种非侵入性手术工具,可以通过窄聚焦的辐射束跟踪和定位肿瘤。
1996年,Sojourner成为第一个被送到火星的漫游者。这台小巧轻便的机器人被送到火星上,并于1997年7月成功着陆。在火星上,Sojourner探索了2691平方英尺(250平方米)的土地,拍摄了550张照片。由于Sojourner收集到的信息,科学家们能够确定火星曾经是温暖湿润的气候。这次任务是美国国家航空航天局(NASA)又开始了火星任务的标志。
1997年5月11日,IBM开发的“深蓝”计算机经过六场比赛,成为世界上首个击败世界国际象棋冠军卡斯帕罗夫的机器。
1998年,戴夫·汉普顿和卡莱布·钟发明了第一个家用或宠物机器人Furby。Furby是类似于仓鼠或猫头鹰一样的动物,在一段时间成为热销的玩具,并持续销售到2000年。
1999年,AIBO(爱宝),是索尼创造的几个机器人宠物之一。AIBO可以通过摄像头看到周围环境,并且可以识别用英语或西班牙语发出的命令。AIBO也有“学习并成熟”的能力,通过使用记忆棒,机器人狗可以学习和发展。AIBO于2006年停产。
【21世纪00年代】
2000年,麻省理工学院的辛西娅·布雷泽尔发明了一种能够识别和模拟情绪的机器人Kismet。
2000年,本田的ASIMO机器人是一个人工智能的仿人机器人,它大约4英尺3英寸高。ASIMO能够像人一样快速行走。这个机器人可以在餐厅为顾客送托盘,与人手牵着手一起行走,识别物体,解释手势,辨别声音。
2005年,Android是一个人形机器人,与人类有着相似的地方,其设计看起来像日本女性,它的气动执行器允许它们有多达“47个关节点”或者身体的部件,使动作看起来自然。
2005年,波士顿动力狗,或称“BigDog(大狗)”,是波士顿动力公司与福斯特米勒(FosterMiller)、喷气推进实验室和哈佛大学合作创建的一款四足机器。
它被设计成一种军用负重机器人野兽,其身体上有50个传感器。BigDog不使用轮子,而是使用四条腿进行运动,从而使它可以在难以通行的复杂地形移动穿越。
BigDog被称为“世界上最雄心勃勃的腿式机器人”,它可以携带150公斤负重,以时速6.4公里/小时的速度,与士兵一起、在35度的斜坡上穿越崎岖的地形。
【21世纪10年代】
2011年,IBM“沃森”(Watson)计算机系统,能够回答以自然语言提出的问题,2月16日在美国最受欢迎的智力竞猜电视节目《危险边缘》中,击败该节目历史上两位最成功的选手肯-詹宁斯和布拉德-鲁特,夺得100万美元大奖,成为《危险边缘》节目新的王者。“沃森”电脑存储了海量的数据,而且拥有一套逻辑推理程序,可以推理出它认为最正确的答案。
2014年6月7日是图灵逝世60周年纪念日。这一天在英国皇家学会举行的“2014图灵测试”大会上,模拟13岁乌克兰男孩的聊天程序“尤金·古斯特曼”(EugeneGoostman)首次“通过”了图灵测试。
英国皇家学会的测试规则是,在一系列时长为5分钟的键盘对话中,某台计算机被误认为是人类的比例超过30%,那么这台计算机就被认为通过了图灵测试(其中,30%是图灵对2000年时的机器思考能力的一个预测)。尤金的成绩是在总计150场对话中,骗过了30个评委里的10个,即尤金被误认为是人类的比例达到了33%。
2015年,在加州大学伯克利分校的一个实验室里,人形机器人Brett教会自己做儿童拼图游戏,如把钉子塞进不同形状的洞里。Brett机器人利用基于神经网络深度学习算法,以试错方式主动学习。
例如,对于组装玩具,机器人会不停尝试,直至它清楚组装的原理。理论上,这机器人不需要再依赖人工更新,而是给足够时间让它学习就可以了。
2016年,波士顿动力公司发布SpotMini机器人。它是一种小型的四条腿机器人,它重25公斤(如果有一个机械臂,它重30公斤)。这款全电动机器人相当灵活,即使踩到香蕉皮摔倒了,或在人类踢或拉它时,能够自己迅速爬起来。该型号的机器人就像是宠物一样,能够实现多种功能,除了能像普通动物一样活动之外,SpotMini有着长长的机械臂,可以为主人端茶倒水。
2016年3月9日至15日,在韩国首尔进行的计算机与人类之间的围棋比赛,谷歌DeepMind的AlphaGo以总比分4比1,战胜围棋九段棋手李世石。
2017年4月,Google旗下的自动驾驶公司Waymo让美国亚利桑那州凤凰城的居民普通乘客试乘其自动驾驶汽车。此刻,世界上有数百辆自主车在公路上行驶,它们都是实验性的。
自动驾驶技术解放双手,也会更加安全和更加节油。计算机不会喝醉酒,不会打瞌睡。自动驾驶算法通过计算何时加速、刹车、转向,预测巡航控制可以自行判断下一阶段的道路状况,决定最经济的行驶方式。
2017年,日本东京大学展示了一款名叫Kengoro的机器人,画面相当带感。Kengoro使用116个拉动电缆的执行器移动,做俯卧撑、仰卧起坐,甚至是背部伸展运动。运动多了Kengoro也会产生热量,为了散热,研究人员为其配备了一个水冷系统,除了能帮助Kengoro散热外,还能实现类似人类的“流汗”生理反应。
2017年,美国新创公司MayfieldRobotics推出外观设计简洁、模样呆萌可爱的智能家用机器人“Kuri”,在居家生活中扮演智能助手与好伙伴的角色。
Kuri为语音控制智能机器人助手,内建四组麦克风设备与声音侦测技术,能精确辨识声音来源并回应指令。Kuri能自由转动头部查看四周,圆圆的双眼甚至会眨、会眯成弯月形状,就像是在微笑一样。Kuri能以Wi-Fi无线网络或蓝牙链接操控家中电器设备,并透过内建双音响播放音乐、发出音效与人们互动。
2017年10月,由汉森机器人公司(HansonRobotics)制造的机器人索菲亚(Sophia)获得沙特阿拉伯公民身份,成为第一个获得国家公民身份的机器人。
次月,联合国开发署将“创新大赛冠军”颁发给索菲亚。索菲亚的人工智能是基于云的,可以进行深入的学习,她可以识别和复制各种各样的人类面部表情。
2017年12月,Alphabet旗下人工智能部门DeepMind发布AlphaZero,它可以自学国际象棋、日本将棋和中国围棋,并且项项都能击败世界冠军。AlphaZero是一种机器学习算法。AlphaZero通过与自己对弈并根据经验更新神经网络,从而发现了国际象棋的原理,并迅速成为史上最好的棋手。
2018年1月22日,位于西雅图的首个无人零售店AmazonGo向公众开放(2018年9月,AmazonGo无人商店纽约新店开张)。无人超市的购物流程非常简单。无需结账,无需排队。
一旦顾客进门后,人工智能系统就开始跟踪顾客和顾客拿起的一切,并将顾客所购买的一切商品记录在其账户上。计算机视觉系统主要由安装在天花板上的摄像头组成,拍摄的图像随后被传入至系统中,系统识别是哪位顾客拿起了什么商品,并加入到其App的购物车中。
2018年,工程师和机器人在特斯拉工厂楼层。特斯拉汽车制造工厂号称拥有全球最智能的全自动化生产车间,共有冲压生产线、车身中心、烤漆中心和组装中心四大制造环节。在车间内根本看不到人的身影,从原材料加工到成品组装,整个生产流程都由机器人完成。机器人由计算机系统控制,按照设定好的程序运作。机器人与机器人之间流水化运营、无缝对接。
2018年,OpenAI研究人员使用强化模型的系统,通过反复试验来让机器人Dactyl能够用精精确抓住和操纵物体,教自己用手指翻转玩魔方。Dactyl具有“灵巧”手,这是一只五指共有24个自由度的机器人手,安装在铝制框架上以操纵物体。同时,两组摄像机-运动捕捉摄像机和RGB摄像机-作为系统的眼睛,可以跟踪物体的旋转和方向。
2019年,麻省理工学院新推出的cheetah(猎豹)机器人,弹性十足,脚部轻盈,可与体操运动员媲美。四条腿的有力,还可以在不平坦的地形上小跑,速度大约是普通人步行速度的两倍。
它的体重只有20磅——比感恩节火鸡轻——它的四肢是不会被推倒的:当它被踢到地上时,它的手肘能像功夫一样快速摆动,很快恢复正常。也许最令人印象深刻的是它能够从站姿进行360度的后空翻。
返回搜狐,查看更多
追觅科技:中国“人形机器人”新势力
2023年3月28日,追觅科技在上海召开新品发布会。发布会上,追觅科技推出了两款机器人产品——通用人形机器人和仿生四足机器狗EameOne二代。
四足+人形追觅机器人新品快速迭代
近年,追觅科技在智能清洁领域快速发展,跻身行业头部梯队,实际上是追觅机器人技术复利的结果。
基于广义机器人核心技术,追觅科技的机器人产品保持着快速创新迭代的节奏。此次发布两款机器人新品之前,追觅科技在2021年下半年、2023年初就分别推出过仿生四足机器狗EameOne和工业级四足机器人。
本次推出的仿生四足机器狗EameOne二代是2021年EameOne的升级版。EameOne的诞生标志着追觅科技拥有了自主研发及生产制造机器人的能力。以EameOne为起点,追觅创新机器人研究院主攻机器人高性能大扭矩电机关节、机械臂等通用机器人核心技术,并持续探索多样化应用场景下,机器人的不同形态。
相比上代,EameOne二代升级到了15个自由度,是目前行业内拥有自由度最多的四足机器人产品,实现了真正意义上的全身仿生运动控制。
得益于搭载了12组高性能伺服电机、21TOPS澎湃算力及多种传感器,EameOne二代可实现语音、视觉、触觉等多模人机交互,能够完成爬坡、上楼梯、跨越障碍、后空翻、跳舞等高难度动作,并精准判断多种地形,适应复杂环境。
同时,EameOne二代增加了四足机器人行业不多见的部位——“头部”,提升了交互能力,能够与人进行更多实时互动行为,可以更好地应用于娱乐、情感陪伴及科研教育等场景。
同时,基于在家庭服务领域积累的经验和技术,追觅科技希望面向未来,打造下一代更高效替代人力的机器人产品。追觅科技创新机器人研究院负责人喻超认为:通用人形机器人未来可能会是目前很多家用产品的终极进阶版。为此,追觅科技用不到一年的时间研发推出了通用人形机器人。
据介绍,该款通用人形机器人实现了高度仿生,身高178cm,体重56kg,全身共44个自由度,其中单腿还有完整的6自由度,可以完成单腿站立。交互方面则配备了深度相机,可以完成室内3维环境的建模,同时集成了AI大型语言模型,具备高质量的对话沟通能力。
追觅1.0到2.0:让机器人技术服务家庭与社会
从创立之初,追觅科技把自己定位为一家广义机器人公司,在电机、智能算法等方向持续投入资源与人力。
追觅科技认为,高性能伺服电机就像是机器人的“心脏”,提供强劲的动力,智能算法就像是机器人的“大脑”,让机器人有更智能化的思维。
目前,追觅已经攻克曾被国外企业“卡脖子”的高速马达核心技术,成为行业内全球⾸家高速马达转速突破18万转/分钟的企业,同时将技术储备至20万转/分钟,是国内少数拥有⾃研⾃产⾼速数字⻢达能⼒的科技公司。
此外,追觅科技目前也具有机器人核心执行器件伺服电机的自主研发及设计能力。四足机器狗EameOne二代搭载的自研伺服电机,内含60多个零件,集成了电机、驱动器、减速器及双编码器,最大输出力矩可达32Nm,最大转速220RPM,具备快速响应能力,力矩带宽>1kHz,能够实现对机器人关节力度和精度的精准控制。
算法方面,追觅突破SLAM、ToF激光雷达、结构光等算法核心技术,增强了场景识别和语义理解能力。同时,得益于追觅在扫地机器人上拥有丰富的目标检测与识别、多传感器感知融合处理策略、导航定位及地图管理与应用经验,包括地图语义理解自动分割、航点导航等技术,在四足以及人形机器人研发过程中,可以实现技术复用。
“未来十年是广义机器人最好的时代,追觅将会持续探索机器人技术的不同形态与应用场景。”喻超表示,从智能清洁到广义机器人生态,追觅机器人技术发展会有多个阶段。
专注智能清洁领域的追觅1.0时代,追觅希望让机器人技术走入每个家庭,解放人们的双手,省下大家做家务的时间,拥抱生活中的热爱。而追觅2.0时代,追觅希望将机器人技术与产业相结合,应用到农业、医疗、交通等行业,开辟机器人技术服务新疆界,做能促进生产力提升十倍百倍的事,逐步朝着广义机器人生态演进,让机器人更加深度地服务家庭和社会。