新一代人工智能具有五大特点人工智能是否真正具有人的意识形态特征

发表时间：2023-07-03 20:48:20

新一代人工智能具有五大特点

科学技术部副部长李萌（刘健摄）

7月21日，国务院新闻办公室举行国务院政策例行吹风会，重点介绍《新一代人工智能发展规划》（以下简称《规划》）的编制情况。科技部副部长李萌在回答记者提问时表示，经过60多年的演进，人工智能出现了一些新特点，包括《规划》当中讲到“它呈现出深度学习、跨界融合、人机协同、群智开放和自主智能的新特点”。新一代的人工智能主要是大数据基础上的人工智能。

李萌指出，人工智能具有以下五个特点：一是从人工知识表达到大数据驱动的知识学习技术。二是从分类型处理的多媒体数据转向跨媒体的认知、学习、推理，这里讲的“媒体”不是新闻媒体，而是界面或者环境。三是从追求智能机器到高水平的人机、脑机相互协同和融合。四是从聚焦个体智能到基于互联网和大数据的群体智能，它可以把很多人的智能集聚融合起来变成群体智能。五是从拟人化的机器人转向更加广阔的智能自主系统，比如智能工厂、智能无人机系统等。

据了解，国际普遍认为人工智能有三类“弱人工智能、强人工智能还有超级人工智能”。弱人工智能就是利用现有智能化技术，来改善我们经济社会发展所需要的一些技术条件和发展功能。强人工智能阶段非常接近于人的智能，这需要脑科学的突破，国际上普遍认为这个阶段要到2050年前后才能实现。超级人工智能是脑科学和类脑智能有极大发展后，人工智能就成为一个超强的智能系统。从技术发展看，从脑科学突破角度发展人工智能，现在还有局限性。《规划》中的新一代人工智能，是建立在大数据基础上的，受脑科学启发的类脑智能机理综合起来的理论、技术、方法形成的智能系统。

跟以往相比，新一代人工智能不但以更高水平接近人的智能形态存在，而且以提高人的智力能力为主要目标来融入人们的日常生活。比如跨媒体智能、大数据智能、自主智能系统等。在越来越多的一些专门领域，人工智能的博弈、识别、控制、预测甚至超过人脑的能力，比如人脸识别技术。新一代人工智能技术正在引发链式突破，推动经济社会从数字化、网络化向智能化加速跃进。

人工智能的终极形态——具身智能浪潮来袭

0分享至

就在昨天，7月在上海举行的“2023世界人工智能大会”新闻发布会上，上海市经信委主任吴金城表示，今年世界人工智能大会将聚焦具身智能，布局智能机器人先进技术。

人工智能的终极形态到底是什么？在这一波AI浪潮来临之前，没有人能回答这个问题，但是现在可以了，答案就是——具身智能（EmbodiedIntelligence）。可能大家对这个概念都不了解，甚至没听说过，在ITFWorld2023半导体大会上，英伟达CEO黄仁勋表示，人工智能的下一个浪潮就是具身智能。AIGC的“智能”表现在能够进行上下文理解和情景感知，输出文字、图像、声音，而具身智能能够在物理世界中进行操作和感知，输出各种机械动作。通过对物理环境的感知和实操，具身智能可以获得更全面的信息和数据，进一步提高对环境的理解和决策能力。那今天咱们就用这篇文章来和大家聊一下，什么是具身智能，以及它未来的前景和投资机会。

首先，我们还是先来了解具身智能的相关概念，具身智能是一种能够拥有自主决策能力和行动能力的机器智能，它可以像人一样去感受，感知和理解环境给予他的信息以及反馈，并且通过自我学习去完成相对应的适应性行为。整个一系列的行为具体划分可以划分为感知、传输、决策、执行。具身智能依靠接收后的物理反馈、物理输出的特性，大概率会成为继AIGC之后的又一个现象级的AI应用。具身智能不仅能够成为通信、计算以及存储的新载体，还可以将边缘算力需求拔升到一个新的高度，最强悍的是，具身智能的“核心大脑”不仅要处理视觉信息、生成提示词，更要负责输出指令来执行机械动作，而且整个的反应速度甚至要堪比人类神经。

再说的直白一点，“知行合一”是具身智能的完美诠释，这是人类很难做到的。根据技术的逐步实现，“知”是建立在“行”之上的，也就是说只有通过身临其境才能去完整的理解某个场景或者某种行为。比如有个厨房，其具有烹饪，烘焙等行为特征，这类行为是基于人的身体设计的，因此真正理解厨房的场景，就是要能够直接通过开启各类相应的设施，比如开火，插电，倒入食材等行为任务去验证。同理，机器人通过理解场景，能够实现以上行为才能代表它真正理解了该场景。因为从本质上，物体和场景的类别大多是由具体功能和具体任务来定义的，整体来说，“我能用来干什么，那它是什么”，比如锤子不能叫木棍，锤子有它独特的行为属性。所以PIE自然就成了最适合具身智能的解决方案，PIE可分为三个模块—具身感知（Perception）、具身想象（Imagination）和具身执行（Execution）。具象感知本质上就是增加交互，挖掘信息、定义具象的过程。要么通过全感知去实现，即建立一个大规模全面的数据库，包括了现实世界生活里的各种知识和信息以及跟如何去处理的动作要点，然后通过具身交互感知，即各种内容交互的感觉带来的全新感知，结合通用定理和已有数据库不断的学习和修正误差从而得到正确的动作结果。具象想象是指自动具身任务模拟，仿真引擎构建，这个仿真引擎可以支撑支持多种物体形态，当研究人员把物体的数据输入进去，模型会在仿真引擎中进行对应的自主操作。具身执行就好理解了，即多传感器一起合作，自主意识执行，并减小误差，研究人员通过构建一个元操作库，调用各种元操作来解决执行的问题。

毫无疑问如此具有想象空间的产业，各种科技大佬们都会加入进来争相布局，黄仁勋在解释具身智能时说，它是一个能理解、推理、并与物理世界互动的智能系统。同时，他也介绍了英伟达的多模态具身智能系统NvidiaVIMA，其能在视觉文本提示的指导下，去执行复杂的任务、获取各类概念并主动学习、理解边界效应、甚至模拟物理学。而其他AI研究巨头也纷纷布局具身智能。谷歌和柏林工业大学AI研究团队推出了最大视觉语言模型——PaLM-E该模型具有5620亿个参数，集成了可控制机器人的各类视觉和语言的使用能力，将真实世界的连续传感器模态直接纳入进语言模型，从而建立接收到的信息和自主感知之间的联系。微软也正计划将ChatGPT的能力扩展到机器人领域，使得能用语言文字全面的控制机器人，并获得更好的反馈，目前实验已经能够通过给ChatGPT的对话框输入指令，让其控制机器人在房间中找到“特定厨具”、“有糖和红色标志的武平”等。微软研究人员表示，研究的目标是看ChatGPT是否能超越生成文本的范畴，对现实世界状况进行推理，从而帮助机器人“完成任务”。阿里则采用和微软相似的路径，正在实验将千问大模型直接接入了工业机器人。千问大模型的推出就是实现应用场景的第一步。其中，千问大模型接入了工业机器人，工程师可以通过钉钉对话框向机器人发出相应的指令，然后千问大模型在后台自动编写了一组代码发给机器人，机器人开始识别周边环境，自动完成移动并做出与指示相匹配的动作，来满足工程师的要求。毫无疑问，在通用的信息传递工具里的对话框输入一句人类语言即可指挥机器人工作，这将为工业机器人的开发和应用带来革命性的变化，其背后意味着大模型为工业机器人的开发打开了新的大门。UCBerkeley、波兰华沙大学联合谷歌机器人团队发表论文《LM-Nav：具有大型预训练语言、视觉和动作模型的机器人导航系统》，该模型结合了三种预训练模型，从而无需用户注释即可执行自然语言指令。其中，大语言模型（LLM）用于完成自然语言处理的任务；视觉和语言模型（VLM）将图像和文本信息进行关联，即用户指令和机器人视觉感知的外部环境进行关联；视觉导航模型（VNM）用于从其观察到的信息中直接进行导航，将图像和将要执行的任务按时间进行关联。

那对于具身智能的市场，现在诸多的预测已然出现，就在前段时间召开的特斯拉股东大会上，一直被人们重点关注的人形机器人Optimus，其效能已经有了全面的提升，在自主感知方面，Optimus的环境感知能力和相应的存储记忆能力在不断进步，看路记路可谓是一气呵成，在自主学习方面，Optimus可参照人类的肢体动作，去进行操控模仿，马斯克表示，未来Optimus的数量可能将达到100亿以上。回看国内的话，据《制造业人才发展规划指南》，至2025年我国制造业将有3,000万的人才缺口，占全球缺口的主要份额。假设人形机器人售价为37万元，且2026-2030年在制造领域人形机器人对人工的新增渗透率相同。预计人形机器人对人工的累计替代率分别为9%、11%时，2030年新增渗透率分别为1.8%、2.2%，创造的市场规模分别为1,998、2,442亿元。在后续的进化过程中，人形机器人或可逐步替代人类完成较复杂的家务，加上价格下降的因素，此时不局限于高端消费者，有更多家庭愿意在家中添置人形机器人。以此阶段机器人价格为25万元为前提，机构预测在较悲观、中性、较乐观的三种情境下，家庭场景创造的市场规模或许能分别达到1.47万、1.88万、2.3万亿元，加上工业、商业服务场景总合市场规模或将分别达到1.9万、2.55万、3.16万亿元。

综上所述，对于具身智能领域，前景是相当美好的，钢铁侠系列电影里的贾维斯出现在现实生活当中的可能性也越来越大，或许每个人都拥有自己的机器人的日子不会远了。相关投资机会可以关注的公司有：中科创达，科大讯飞，海康威视，虹软科技等。港股方面可以关注：商汤-W。

相关风险提示：技术研发不达预期，相关政策风险，人伦道德风险等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.

/阅读下一篇/返回网易首页下载网易新闻客户端

新一代人工智能具有五大特点 人工智能是否真正具有人的意识形态特征