AI会让机器人更聪明吗
AI和机器人的关系一直是个绝妙的话题,具身AI实际上一直是人工智能领域研究的前沿方向之一,它的终极目标就是创造一个像人一样的机器人。这一愿景的终极实现或许还要花费很久时间,然而从去年开始,生成式AI的突破进展让人们看到了机器人进化的新方向。当大模型能力与机器人场景结合起来会发生什么?我们离人工智能机器人的未来有多远?撇开浪漫的想象,想要切实回答这些问题,我们需要与机器人领域真正一线的从业者们进行深度对话与交流。这正是品玩未来科技力联合头部投资机构险峰K2VC共同举办以《AI浪潮下机器人领域的新机遇》为题的国内大模型产业生态研讨沙龙的原因。我们邀请到国内工业机器人领域的头部参与者、一线投资专家和学界领军,一起分析、探讨和拆解关于人工智能罗曼蒂克愿景背后的具体问题:AI对机器人进化有什么推动作用?我们目前处于机器人发展的什么阶段?机器人大模型训练数据该如何收集?大模型对人机交互的改变是什么?以及最关键的,我们距离更智能的机器人还有多远,这中间还需要克服什么样的困难呢?下面是这些关键决策人们的回答。杨健勃|可以科技创始人&CEO当整个情感交互模型转到深度学习的时候,就可以做到从10秒为周期的交互模态转到百毫秒级的交互机制。云端会有情感交互大模型,但是在边缘端,目前还没有专门针对transfomer芯片产生。杨健勃分享了可以科技出品的名为Loona的智能陪伴机器人,或者叫智能小宠物。它里面已经蕴含了基于深度学习的情感交互模型,机器人某种程度上可以自主决策,自主推理出目前要表达的动作、效果,以及和用户的互动反馈,模型中包含了近400种不同的语音指令,互动的动作和表达则有近1500种,几乎可以感知人所有模态的交互。但由于在边缘侧尚未出现可以高效运行大模型的芯片,目前的技术方案是通过实体机器人收集多模态人机双向主动交互的数据,然后在云端训练机器人交互模型,在未来,杨健勃希望可以把这种基于大模型的智能决策推广到用户侧的使用过程中。邵天兰|梅卡曼德创始人&CEO现在还处于早期技术探索期,技术路线还没有开始收敛。大模型最重要的能力是根据常识处理异常,高层次抽象任务和主动感知。梅卡曼德成立六年,已经是国内首屈一指的工业机器人解决方案提供商,邵天兰在分享中给出了几个自己的判断。首先是目前大模型还处于技术探索期,它的路线还没有开始收敛。无论是算法、算力还是数据,本身都还在快速的发展过程中。邵天兰举了个例子,2012年时一个5亿参数的模型就非常大了,需要跑半个小时,而现在标准的CPU可以用不到一秒的时间完成。过去五年,3D视觉、AI、算力和传感器都有非常快速的发展,5年前看今天做的东西就好像科幻一样。邵天兰认为技术带来的确定性是非常强的,很多人会高估1年后的发展水平,但却低估5年后的。“一年内带来的改变没有什么确定性可言,但五年就有很强的确定性了,在十年的尺度上看,技术确定性几乎是显而易见的。”其次,机器人和AI结合的成功产品形态还没有出现,但可能也就会在近几年内出现。机器人将能处理更复杂、更模糊的任务,大模型会在机器人过去能力的基础上解决更多的问题,这不是一个互相替代,而是互相补充,进一步全面扩展能力的过程。第三,泛自动化领域还有非常大的空间,但用户的需求是非标准化的,这意味着机器人需要具有高柔性。大模型引领着这种技术方向。最后,大模型是非常重大的机会,但它要求的研发链条和资金量是非常巨大的,和过去的创业将不再相同。弭宝瞳|北京矩视智能科技有限公司CEO在工业视觉领域,由于对准确度要求非常苛刻,所以基于目前大模型的准确度,还无法实现端到端的识别,但大模型已经可以作用在开发小模型的各个环节里,极大降低了模型开发成本,比如基于Diffusion的样本生成,降低收集样本的成本,基于prompt的辅助标注,降低图像标注成本。弭宝瞳认为大模型在工业视觉领域最终的落地是成为一款非常简单的工具直接面对开发端、面向开发者,让所有人可以非常方便地开发各自行业里的小应用。这将对整个行业有颠覆性作用。另外从数据层面,中国的工业产业链积累也为大模型在中国的落地发展提供了有利支撑。占据全球制造三分之一的中国工业拥有着完备全产业链条,有各种场景和环境为大模型提供训练所有的大数据。圆桌金句大模型通用泛化能力对机器人能力带来什么影响?李宇浩|麦岩智能创始人&CEO我感觉至少5年内还是很难出现大规模的人形机器人的产品形态应用。但大模型真的是在我们非常绝望,根本找不到方法的时候突然出现的,以GPT为代表的新的AI浪潮必定会对机器人产生革命性的推动。曾祥永|云迹科技AI技术负责人机器人要结合大模型,首先要融入到这个行业的垂直大模型中。谢思为|BV百度风投投资人我相信大模型+机器人有可能诞生通用的机器人范式。董豪|北京大学助理教授、研究员我个人感觉,通用机器人的出现会在自动驾驶完全普及之后,因为它的技术路线是相通的。大模型会对机器人与人的交互方式产生什么样的影响?许华旸|史河机器人创始人&CEO我们做的清洁机器人场景还是比较特殊的,它主要针对船舶和楼宇。因为楼、船有复杂结构,短期看不到机器人全自主作业的可能。目前看最适合的交互方式是遥控器,未来可能会是AR+手势控制。李宇浩|麦岩智能创始人&CEO在结构化交互到完全非结构化自然语言交互中间有一个基于场景的自然语言交互,其实这跟理想汽车学的,智舱环境下理想已经能够提供一个非常接近准自然语言的交互了。谢思为|BV百度风投投资人我认为有两个分类:一类是跟人交互,另外一类是跟环境交互。前者比如小度机器人,比如基于情感需求的配料等。而跟环境的交互还是会落地到不同的场景中去。董豪|北京大学助理教授、研究员从我看来,交互方式越简单越好,最好是没有交互,直接实现意图识别。机器人领域数据收集难、生成难,如何更好地让数据服务与AI?董豪|北京大学助理教授、研究员数据采集成本很高,而且往往有局限性。换一个型号的机器人,数据可能都不能用了。目前学术界认为最直接的方法是先利用虚拟环境让模型学一个策略,然后用虚拟环境中学到的成功策略继续在真实环境里训练。这样数据采集流程的ROI会特别好,因为不用人工采集,整套过程是机器人自己完成的,而虚拟环境的背景、物体材质形状都可以随便生成,成本很低。许华旸|史河机器人创始人&CEO我觉得数据分几块,包括环境数据,机器人的运动数据,还有作业对象的数据。董老师说在仿真环境中先自主产生大量数据,利用这些数据做监督式的学习,这样数据来源就变得非常简单了。前段靠仿真,中段靠人的干预来评估和修正,这样能在保证ROI的基础上充分采集和利用好数据。大模型会给机器人带来什么样的问题?许华旸|史河机器人创始人&CEO边缘计算最后一定是通过小模型实现,因为大模型的响应延迟太长。至于安全性方面的问题,我们会采取最简单、最可靠的机械或电气等方式来保证,而不会依赖于算法。李宇浩|麦岩智能创始人&CEO大模型部署在端侧这在3年内不可能的,现在大家都是端+云的模式,这样就会有一个信号的问题,丢了信号就变成只有端侧智能的产品了,哪怕是信号延迟也会严重影响产品体验。曾祥永|云迹科技AI技术负责人一致性问题非常重要,在我们商用场景一定强调的是输出的准确性、一致性,不能脱离预期生成很随意的答案。数据安全也非常重要,我的数据是不是都要上到云上大模型上?上去之后数据安全吗?我们最近考虑基于开源中小模型,叠加行业数据,打造我们自己的垂直领域模型。董豪|北京大学助理教授、研究员如果把语言模型跟机器人做结合,对齐问题不解决的话是会出现很严重的后果的。在自然语言大模型里现在就有人研究对齐问题,这是个研究热点。但在机器人领域现在大家还没有开始研究这块。大模型会让机器人公司的竞争壁垒发生怎样的变化?谢思为|BV百度风投投资人相关公司的核心竞争力可能存在于在细分场景下,收集小模型和动作的数据库的能力,长远来讲,评估一家大模型+机器人公司的指标之一就是看它是否具备突破新场景的能力。董豪|北京大学助理教授、研究员从长远来看主要是技术通用性,如果从技术来看,一个好的技术应该是可以适用于任何场景。曾祥永|云迹科技AI技术负责人如果进入到RaaS(机器人即服务)阶段,那么就在两个层面上存在壁垒。一个是把机器人本体做得稳定、可靠、执行成功率足够高,成本也能做到充分控制。再一个是能够真正做到规模化服务。许华旸|史河机器人创始人&CEO除了做好产品研发的基本功、制造业的基本功、品牌营销的基本功,还要建立好行业内的场景、任务、工艺等数据壁垒,并基于这些数据搭建专用的小模型。这些数据可以帮助公司很好地建立门槛。李宇浩|麦岩智能创始人&CEO机器人公司一定要基于对垂直场景的深入理解。我认为,绝大多数机器人的形态一定不会是人形。尽管通用人形机器人是个很好的生意。人形机器人:从科幻走向现实
安装新浪财经客户端第一时间接收最全面的市场资讯→【下载地址】
人类不喜欢洗碗,所以发明了洗碗机,通过智能电器解决了餐具清洗需求。人类不喜欢拖地,所以发明了扫地机器人,解决了居住环境地面清洁需求。当人类有了新的需求,就有了新的发明。当劳动力人口下降,需要谁来帮助人类延续文明的生存和繁衍呢?人形机器人,智能终端的下一程根据联合国《世界人口展望》,世界人口数量在2022年11月达到80亿,2086年达到顶峰104亿,而世界人口增速以每30年减少50%的速度急剧下滑,其中具有劳动能力的65岁以下人口2022-2050年复合增速0.4%。老龄化的时代来临,如果希望65岁以下人口数量在2022-2050年复合增速达到1%,需要增加23亿“人”。随着人口老龄化进程、人工成本持续攀升、生育率降低等现实问题日益严峻,“人”从哪里来?为了解决未来人口劳动力短缺问题,机器人被人类寄予厚望。过去几十年间,机器人经历了从工业到消费的发展,从工业机器人走向服务机器人。要知道,机器人如今已经是人类生活不可或缺的组成部分,在家里的扫地机器人、割草机器人,在酒店和饭店的送餐机器人,在医院手术台的手术机器人,机器人的服务半径正在一点点扩宽人类生活场景。“将来,一台家用机器人可能比一辆汽车还便宜。也许在未来不到十年的时间里,人们就可以给父母买一个机器人作为生日礼物……借助机器人的力量,我们将创造一个商品和服务极度充裕的时代……或许,未来唯一存在的稀缺,是我们作为人类来创造我们自己”,马斯克对机器人未来前景的看好,透露了智能时代的新趋势。纵观人类的智能化进程,如今PC电脑、智能手机已经成为我们工作生活不可或缺的工具;当前全球智能汽车正在加速渗透中,被视为本世纪继互联网、移动互联网时代之后第三次智能化浪潮。机器人是人工智能与智能制造的交汇,基于不同应用场景共有四重迭代,可以分为工业机器人、协作机器人、服务机器人和人形机器人。在人工智能浪潮下更精密、更聪明的机器人正在被加速研发出来。从产业链的视角来看,人形机器人产业链上游包括原材料及核心部件(价值占比高),中游为系统集成及本体制造,下游为细分应用场景(ToB&ToC),如教育、物流及移动、康养及巡检等。上游核心部件除减速器、伺服电机、控制器、传感器外,增加了体现算力水平的芯片。随着机器人感知、决策、控制、交互能力升级,软件系统与配套技术支持在产业链中占比加大。嘉实基金优势成长基金经理孟夏认为,机器人或将成为终极智能终端,机器人有望成为人类宇宙探索的全能伙伴,共建人类社会全新形态。机器人领域也将成为全球科技巨头必争之地。而每一代智能终端硬件升级与广泛应用,或将带动软件+服务空间10倍增长,每年带来100万亿元的市场远景。海外某智能汽车“巨头”已经将智能终端的视角延申到人形机器人新的“战场”。从2021年首次公布人形机器人项目,到2022年展现原型机,再到2023年5月,Optimus可以实现多种精细控制、独立导航等功能,已经实现了独立行走、搬运物体、洒水等复杂动作,机器人将被用于替代普通人完成危险或者无聊的重复工作。人形机器人产业正从前沿走向现实,产业化加速迭代。根据艾瑞咨询,2022年中国智能机器人市场规模为76亿元,预计2027年市场规模将达到536亿元,2022-2027年CAGR有望达到47.9%。而马斯克认为,如果人形机器人和人的比例在2比1左右,那么人们对机器人的需求量可能是100亿至200亿个,远超电动车的数量。智能机器人市场规模数据来源:艾瑞咨询,中泰证券曙光乍现,星辰大海人形机器人正在成为继智能汽车之后下一个风口。通过先进制造和智能制造的工业化流程“缔造”出来的“人”,融合了高端制造、AI智能、生物技术等诸多新技术,将实现工业、商业和家庭全面应用场景覆盖,将重新定义人类的生活图景,人形机器人正在成为人类的终极梦想。从人体的身形外观“照葫芦画瓢”出来的机器人,要具有硬件支撑人体,不仅要求人的身体外观,还要有在大脑层面具备部分与人或生物相似的:感知、规划、执行、交互、协同智能能力。回归第一性原理出发,人形机器人的五官、大脑、关节和肉体的不同部位分别对应不同的控制性系统,分别为感知层、决策层、运控层、执行层,从而实现未来人形机器人更灵活、更多样、更仿生、更亲密的目标。运动控制系统是人形机器人的核心。最新一代Optimus人形机器全身共有40个运动执行单元,脖子、胳膊、手、腿、躯干累计搭载40个机电传动器;手部装载12个机电执行器,可执行精密的人类手工作业,从而替代更为复杂的人类劳动。如果说人类区别于其他生物的核心在于大脑的发达程度,那么支撑人形机器人的核心就在于算法能力,它所生产的机器人恰恰与自动驾驶汽车同源,底层技术都是算力。比如,核心身体构造“眼睛”的感知来自于8个Autopilot摄像头作为视觉感知传感器,采集图像数据形成数据库。而Optimus的“大脑”处理采取超级计算机系统Dojo,通过AI大数据进行神经网络训练。由25个芯片组成一个训练单元,而目前Dojo组成的机柜集群包含120个训练单元,相当于240个成年人的大脑算力。人形机器人具有超越人类大脑的超大能量。不难想象,在AI和智能制造,以及全科技的多维技术武装下,未来的机器人具有一定的自主思考能力也不再是科幻的场景,随着算法和AI技术的成熟迭代,相信电影《流浪地球》中“丫丫”的数字生命将更完整、更智慧。精彩内容永不错过。2023和百万基民在新浪财经定投基金,一键购买抓住更好投资机遇海量资讯、精准解读,尽在新浪财经APP机器人VIP课程推荐加载中...APP专享直播上一页下一页1/10热门推荐收起新浪财经公众号24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
相关新闻加载中点击加载更多