人工智能如何“向善”
一段时间以来,以ChatGPT为代表的人工智能大模型搅动了全球人工智能技术发展的浪潮。从写代码到讲故事,从撰写文章到自动制作数据表格……人工智能正在给人类的工作、学习、生活带来诸多变化。
我们距离“无所不能”的通用人工智能还有多远?人工智能的发展带来哪些安全隐患和挑战?近日召开的2023北京智源大会上,来自全球的人工智能专家学者围绕相关话题展开探讨。
通用人工智能路途尚远
“想象一下,未来10年,通用人工智能(AGI)几乎在每一个领域都超过人类的专业知识,最终可能超过所有大型公司的总体生产力,这将提高人们的生活水平。”OpenAI首席执行官山姆·阿尔特曼展现了一幅人工智能的未来图景。
所谓AGI,是指能够像人类一样在各种领域进行智能任务的人工智能系统。这与目前人工智能应用只聚焦于特定任务或领域(如图像识别、语音识别、自然语言处理等)不同,对人工智能技术提出了更高要求。
“通用人工智能可以比人类更好、更快地学习和执行任务,包括人类无法处理的任务。由于机器在速度、内存、通信和带宽方面的巨大优势,未来通用人工智能几乎在所有领域都将远超人类的能力。”美国加州大学伯克利分校计算机科学教授斯图尔特·罗素说。
尽管人工智能已经有了“超越”人类的“时间表”,但在很多专家看来,目前的人工智能距离AGI还有不小的距离。
罗素认为,当下火热的大语言模型并不“理解世界”,只是通用人工智能的一块“拼图”——“我们并不了解如何将它与其他部分连接起来,甚至还有一些缺失的拼图还没有找到。”
北京智源人工智能研究院院长黄铁军指出,要实现通用人工智能,有3条技术路线:第一是大模型,通过海量高质量数据,让人工智能具备智能涌现能力;第二是具身智能,通过强化学习方法,训练出具身模型;第三是类脑智能,让机器达到或类似于人脑能力。
对于人工智能的发展,图灵奖得主、纽约大学教授杨立昆提出了“世界模型”的概念——人工智能系统可以通过这一模型理解世界的运转方式,并以最优化、成本最小的方式来行动。
加强安全治理领域国际合作
根据普华永道会计师事务所预测,到2030年,人工智能将创造15.7万亿美元的经济价值。人工智能为经济发展提供了重要机遇,但也引发了安全性方面的担忧和争议。
图灵奖得主、多伦多大学教授杰弗里·辛顿认为,目前的人工智能已经可以通过学习,掌握“欺骗”人类的方式。“一旦人工智能具备了‘欺骗’的能力,就有了‘控制’人类的能力。这样的超级智能可能会比预想中发生得更快。”
在通用人工智能时代到来之前,人工智能的安全风险主要来自于“人”。“我们不应该假设机器是公正的,因为机器可能会试图改变人类的行为。更准确地说,是机器的所有者想要改变其他人的行为。”图灵奖得主、中国科学院院士姚期智说,当前人工智能的发展处于重要窗口期,各国应共同合作,搭建人工智能的治理结构。
随着人工智能的本事越来越大,人工智能的“对齐”问题浮上水面。所谓“对齐”,即人工智能系统的目标要和人类的价值观与利益“对齐”,保持一致。
如何让人工智能与人类“对齐”?阿尔特曼认为,人们应当负责任地将人工智能应用到世界中,重视和管理好安全风险。他建议在人工智能技术研发过程中建立平等、统一的国际规范和标准,并通过国际合作,以可验证的方式建立人工智能系统安全开发的信任体系。
黄铁军认为,人工智能虽然会产生预料之外的新能力,但这并不意味着人类无法对人工智能进行管理。“如何管理人工智能这样一个创造性极强的系统,社会学、历史学等学科都能提供很好的借鉴意义。”
今年2月,中国在《全球安全倡议概念文件》中提出加强人工智能等新兴科技领域国际安全治理,预防和管控潜在安全风险。在此次智源大会上,专家学者积极评价中国在推动人工智能国际治理上的贡献。
阿尔特曼说,中国在人工智能领域拥有大量优秀的人才和产品系统,在人工智能的安全方面应发挥关键作用。
麻省理工学院人工智能与基础交互研究中心教授马克斯·泰格马克表示,中国在塑造全球人工智能议程上的能力日益增长,可以在人工智能安全治理领域发挥领导作用。
推动大模型共建共享
当下,全球人工智能领域的科技竞赛日趋白热化。2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,全国已发布了79个参数在10亿规模以上的人工智能大模型。
从全球来看,中国和美国已发布的大模型数量超过全球总数的80%。中国自2020年起进入大模型快速发展期,在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群,涌现出多个具有行业影响力的预训练大模型。
在此次大会上,全面开源的智源“悟道3.0”系列大模型及算法正式发布。据了解,“悟道3.0”涵盖了一系列领先成果,包括“悟道·天鹰”(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台,“悟道·视界”视觉大模型系列以及一系列多模态模型成果等。
黄铁军认为,人工智能大模型有3个特点:一是规模大;二是有“涌现性”,即能够产生预料之外的新能力;三是通用性,不限于解决专门问题或者专门领域。他表示,大模型不是任何一家机构或者一家公司垄断的技术,应当共建共享,推出一套智力社会所需的基础的算法体系。
更多精彩内容,请下载科普中国客户端。
返回人民网科普频道
(责编:李慧博、杨鸿光)分享让更多人看到
人工智能如何“向善”
一段时间以来,以ChatGPT为代表的人工智能大模型搅动了全球人工智能技术发展的浪潮。从写代码到讲故事,从撰写文章到自动制作数据表格……人工智能正在给人类的工作、学习、生活带来诸多变化。
我们距离“无所不能”的通用人工智能还有多远?人工智能的发展带来哪些安全隐患和挑战?近日召开的2023北京智源大会上,来自全球的人工智能专家学者围绕相关话题展开探讨。
通用人工智能路途尚远
“想象一下,未来10年,通用人工智能(AGI)几乎在每一个领域都超过人类的专业知识,最终可能超过所有大型公司的总体生产力,这将提高人们的生活水平。”OpenAI首席执行官山姆·阿尔特曼展现了一幅人工智能的未来图景。
所谓AGI,是指能够像人类一样在各种领域进行智能任务的人工智能系统。这与目前人工智能应用只聚焦于特定任务或领域(如图像识别、语音识别、自然语言处理等)不同,对人工智能技术提出了更高要求。
“通用人工智能可以比人类更好、更快地学习和执行任务,包括人类无法处理的任务。由于机器在速度、内存、通信和带宽方面的巨大优势,未来通用人工智能几乎在所有领域都将远超人类的能力。”美国加州大学伯克利分校计算机科学教授斯图尔特·罗素说。
尽管人工智能已经有了“超越”人类的“时间表”,但在很多专家看来,目前的人工智能距离AGI还有不小的距离。
罗素认为,当下火热的大语言模型并不“理解世界”,只是通用人工智能的一块“拼图”——“我们并不了解如何将它与其他部分连接起来,甚至还有一些缺失的拼图还没有找到。”
北京智源人工智能研究院院长黄铁军指出,要实现通用人工智能,有3条技术路线:第一是大模型,通过海量高质量数据,让人工智能具备智能涌现能力;第二是具身智能,通过强化学习方法,训练出具身模型;第三是类脑智能,让机器达到或类似于人脑能力。
对于人工智能的发展,图灵奖得主、纽约大学教授杨立昆提出了“世界模型”的概念——人工智能系统可以通过这一模型理解世界的运转方式,并以最优化、成本最小的方式来行动。
加强安全治理领域国际合作
根据普华永道会计师事务所预测,到2030年,人工智能将创造15.7万亿美元的经济价值。人工智能为经济发展提供了重要机遇,但也引发了安全性方面的担忧和争议。
图灵奖得主、多伦多大学教授杰弗里·辛顿认为,目前的人工智能已经可以通过学习,掌握“欺骗”人类的方式。“一旦人工智能具备了‘欺骗’的能力,就有了‘控制’人类的能力。这样的超级智能可能会比预想中发生得更快。”
在通用人工智能时代到来之前,人工智能的安全风险主要来自于“人”。“我们不应该假设机器是公正的,因为机器可能会试图改变人类的行为。更准确地说,是机器的所有者想要改变其他人的行为。”图灵奖得主、中国科学院院士姚期智说,当前人工智能的发展处于重要窗口期,各国应共同合作,搭建人工智能的治理结构。
随着人工智能的本事越来越大,人工智能的“对齐”问题浮上水面。所谓“对齐”,即人工智能系统的目标要和人类的价值观与利益“对齐”,保持一致。
如何让人工智能与人类“对齐”?阿尔特曼认为,人们应当负责任地将人工智能应用到世界中,重视和管理好安全风险。他建议在人工智能技术研发过程中建立平等、统一的国际规范和标准,并通过国际合作,以可验证的方式建立人工智能系统安全开发的信任体系。
黄铁军认为,人工智能虽然会产生预料之外的新能力,但这并不意味着人类无法对人工智能进行管理。“如何管理人工智能这样一个创造性极强的系统,社会学、历史学等学科都能提供很好的借鉴意义。”
今年2月,中国在《全球安全倡议概念文件》中提出加强人工智能等新兴科技领域国际安全治理,预防和管控潜在安全风险。在此次智源大会上,专家学者积极评价中国在推动人工智能国际治理上的贡献。
阿尔特曼说,中国在人工智能领域拥有大量优秀的人才和产品系统,在人工智能的安全方面应发挥关键作用。
麻省理工学院人工智能与基础交互研究中心教授马克斯·泰格马克表示,中国在塑造全球人工智能议程上的能力日益增长,可以在人工智能安全治理领域发挥领导作用。
推动大模型共建共享
当下,全球人工智能领域的科技竞赛日趋白热化。2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,全国已发布了79个参数在10亿规模以上的人工智能大模型。
从全球来看,中国和美国已发布的大模型数量超过全球总数的80%。中国自2020年起进入大模型快速发展期,在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群,涌现出多个具有行业影响力的预训练大模型。
在此次大会上,全面开源的智源“悟道3.0”系列大模型及算法正式发布。据了解,“悟道3.0”涵盖了一系列领先成果,包括“悟道·天鹰”(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台,“悟道·视界”视觉大模型系列以及一系列多模态模型成果等。
黄铁军认为,人工智能大模型有3个特点:一是规模大;二是有“涌现性”,即能够产生预料之外的新能力;三是通用性,不限于解决专门问题或者专门领域。他表示,大模型不是任何一家机构或者一家公司垄断的技术,应当共建共享,推出一套智力社会所需的基础的算法体系。
(实习生张伟纳对本文亦有贡献)
(责编:杨光宇、牛镛)关注公众号:人民网财经分享让更多人看到
AGI通用人工智能:开启空间计算时代,元宇宙唯一主生产力
通用人工智能AGI(ArtificialGeneralIntelligence),亦被称为强AI。AGI指的是在任何你可以想象的人类的专业领域内,具备相当于人类智慧程度的AI,一个AGI可以执行任何人类可以完成的智力任务,甚至可以说AGI是一种在大多数具有经济价值的工作上超越人类的系统,其中包括近期大热概念AIGC(人工智能生成内容),现今AI生成的文本、图片、影音频等等在某种程度上已经超越了部分由人力创造的内容。
元宇宙的概念众说纷纭,广义的元宇宙(Metaverse)指的是一个虚拟的现实世界,由数字化的环境和虚拟实体组成,可以与现实世界进行交互和融合。它包罗万象,可以通过各种设备(如智能手机、计算机、VR/AR头戴设备)来访问和体验。狭义的元宇宙则指的是特定平台或系统下的虚拟空间,如Facebook的HorizonWorkrooms、Roblox、Fortnite等。这些平台提供了一种集成了社交、娱乐、商业和创造力的虚拟环境,用户可以在其中与其他人互动、探索虚拟世界、参与游戏或创建内容。
虽然AGI目前来看和元宇宙一样,都是一个发展中的概念,但我认为,元宇宙体验的升级必将依靠AGI才能做得到。现如今市面上的所谓“元宇宙”只不过是一个片面的虚拟空间,从场景人物建模到虚拟人智能化等等做得都不够到位,看起来甚至有些滑稽可笑。但即便如此,这样一个虚拟世界的打造仍需投入大量成本,而这显然成为了影响元宇宙构建的关键因素。是AGI让我看到了广义元宇宙愿景实现的可能。
01空间计算时代与元宇宙的差异及共性
近日,苹果在其年度全球开发者大会上发布了混合现实产品VisionPro。这款产品被认为是苹果公司对于虚拟现实(VR)和增强现实(AR)技术的重要突破,被寄予了很高的期望。事实上,这的的确确是一款惊艳的产品,在发布会上,库克避而不谈“AI”“元宇宙”等大热概念,而是说“如同Mac将我们带入个人计算时代,iPhone将我们带入移动计算时代,AppleVisionPro将带我们进入空间计算时代。”
“空间计算时代”,这个“空间”自然是指现实空间。很显然,这明显是要与“元宇宙推广大使”扎克伯格的allin的虚拟空间(及狭义元宇宙)区分开来。
这或许是出于对市场和消费者的考量,苹果可能认为元宇宙这个词已经被过度使用或滥用,导致其真正的含义变得模糊不清,因此更倾向于使用其他术语或概念来描述他们的产品和愿景;也或许是认为人们过度沉浸在虚拟世界中一定程度必将削弱与真实世界的联系和体验,这与他们的品牌理念不合。
当然,对于苹果刚刚发布的MR(混合现实)头显VisionPro,扎克伯格是这样评价的:“这可能是未来计算的愿景,但这不是我想要的。”扎克伯格坚持Meta将致力于创建人工智能模型,与竞争对手相比,这些模型可供更多人使用,并最终符合他的元宇宙计划。
总之,无论是“空间计算时代”还是“元宇宙”,每个公司都有其独特的价值观和战略选择,这赋予了消费者更多选择的空间。然而作为一名元宇宙以及AI行业的从业人员,我认为虽然苹果避免直接将自己与元宇宙联系在一起,但其卓越的技术生态系统、前沿的增强现实技术与元宇宙存在着契合之处。
二者共同追求将虚拟和现实世界融合,为用户创造更加沉浸式、个性化和连接性强的数字体验。这种契合使得增强现实技术成为构建元宇宙的重要工具之一,为用户打开了通往数字化未来的大门。也就是说“空间计算”和广义的“元宇宙”某种程度上殊途同归——实现物理世界和数字世界的更好融合。
02AGI实现物理世界和数字世界的更好融合
在追求物理世界和数字世界的更好融合这个过程中,必将应用到AGI去提升融合效率。还是以刚刚提到的苹果VisionPro为例,从体验者的口中可以窥见这款眼镜的优缺点。优点自然是苹果延续了一贯的高标准黑科技,注重用户体验感等,比如,头显外部搭载“Eyesight”透视功能,通过扫描面部生成虚拟与现实交界中的3D化身;配备了12颗摄像头、5个传感器以及6个麦克风,使得空间定位更为精准等。当然也存在机器自重过重、体验空间局限、智能化程度有待提高等问题。
从其中我关注到的是,想提升这类增强现实设备的使用感受,最终实现空间计算时代,离不开AGI的帮助,也就是说,无论是在元宇宙中还是苹果推崇的空间计算时代里,凭借着纯粹的人力,根本支撑不起元宇宙中用户们的内容需求。
想要物理世界和数字世界的更好融合首先就要解决五感(视觉、听觉、嗅觉、味觉、触觉)等方面的真实性,无论是视觉内容、元宇宙智能数字人(或许也可以说是空间计算时代智能NPC)等都需要由AI作为主力去进行创造。
在视觉内容方面,在生活中,3D视觉是人类的本能,但是3D需要的设备、环境、技术等等的专业程度比之2D数据成几何级翻倍,单单依靠个人进行元宇宙3D场景的构建、人物的建模将会是巨大的工作量。依靠AI相关技术例如卷积神经网络的训练可以很好的提升3D人物场搭建效率。
同时,AI也可以为元宇宙提升互动体验,例如提升智能数字人交互能力,可以应用到一些AI技术,例如自然语言处理(NLP),使计算机能够与用户进行自然的对话和交互;强化学习(RL)训练智能体在环境中做出决策和行动,更好地培养虚拟角色或代理人,使其具有自主决策和智能行为,增强用户与虚拟环境的互动体验。类似数绽科技这样的公司就在和多个上市公司一起合作,打造逼真的AI互动角色。
03更多AI技术的发展与崛起
随着AIGC的出现,计算机可以通过学习和模仿人类的创造力,自动生成各种丰富多样的内容,AI可以带来更智能化的互动体验、供个性化的元宇宙体验以及智能化的帮助和支持。只有应用到AI的智能化、学习能力以及工作效率才能使得元宇宙成为一个充满智能、包罗万象的虚拟空间。
AI很多相关的技术都可以初步帮助我们达成上述愿景。我最近在阅读一些AI书籍就关注到了LangChain技术。自ChatGPT发布以来,大型语言模型(LLM)广受欢迎。很多人没有足够的资金和计算资源从头开始训练自己的大语言模型,所以使用预训练的大语言模型成为了很多人的选择。
LangChain是一个开源Python库,支持人们使用它来构建LLM支持的应用程序。它提供了工具、组件和接口,以简化与大型语言模型(LLM)和聊天模型的交互,并管理这些组件的连接。此外,LangChain还可以集成额外的资源,如API和数据库,以增强应用程序的功能。这样拥有编写代码能力的人们就可以开发属于自己的程序,包括自然语言处理、对话系统、智能助手等,十分高效灵活。这样的AI驱动产品越来越多,让更多包括公司掌握开发自己的GPT的能力。
在元宇宙中,LangChain就可以利用自己的组件比如PromptTemplatesandValues(提示模板和值)将用户输入和其他动态信息转换为适合语言模型的格式,可以作为输入传递给语言模型进行处理和生成智能组件化的回应;利用ChatMessageHistory(聊天消息历史)记住先前的聊天交互数据,并将其传递回模型,以维护上下文并提高模型对对话的理解。
除了AI驱动产品,如今文字生成视频的体验工具也步入了公众视野,StableDiffusion和《瞬息全宇宙》背后技术公司Runway出品的AI视频编辑工具Gen2近日开放了免费试用渠道。Gen1和Gen2的发展是人工智能领域的一大进步,尤其在视频生成领域。Gen1通过引入时间层和联合训练图像和视频数据,成功将潜扩散模型扩展到视频生成领域。这使得Gen1能够生成细粒度可控的视频,并能对参考图像进行定制。此外,引入的全新引导方法也为生成结果的时间一致性提供了精确的控制。
Gen2进一步扩展了功能,直接实现了文本+参考图像生成视频、静态图片转视频、视频风格迁移等7大功能。这意味着用户可以更加灵活地利用Gen2进行视频创作和编辑。无论是根据文本和参考图像生成视频,还是将静态图片转化为动态视频,或者进行视频风格迁移,Gen2提供了更多的创作可能性和个性化选项。
总之,AI行业的发展日新月异,我在这一波波浪潮之中无数次坚定了自己的看法:无论是在元宇宙中还是苹果推崇的空间计算时代里,AGI将会提升空间计算时代(元宇宙)的体验感,其中AIGC将会是主要的生产力。AI就是虚拟以及真实的未来。
本文作者李逸群,人工智能科技公司CEO,关于通用人工智能、人工智能生成工具、应用模型训练等AI前沿领域。系福布斯中国撰稿人,发表观点仅代表个人。