中国信通院联合京东探索研究院发布《人工智能生成内容(AIGC)白皮书》
数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程。在当前数字世界和物理世界加速融合的大背景下,人工智能生成内容(ArtificialIntelligenceGeneratedContent,简称AIGC)正在悄然引导着一场深刻的变革,重塑甚至颠覆数字内容的生产方式和消费模式,将极大地丰富人们的数字生活,是未来全面迈向数字文明新时代不可或缺的支撑力量。
2022年9月1-3日,世界人工智能大会于上海举办。作为世界人工智能大会的主题论坛之一,探索·产业元宇宙论坛于9月2日在徐汇区西岸艺术中心召开。会上,中国信息通信研究院联合京东探索研究院共同发布《人工智能生成内容(AIGC)白皮书(2022年)》。
白皮书跟踪梳理了人工智能生成内容的发展演进,重点从技术、应用、治理等维度对人工智能生成内容进行了分析,并从政府、行业、企业、社会等层面,给出了我国发展和治理人工智能生成内容(AIGC)的建议。
白皮书主要内容/核心观点
1.白皮书对人工智能生成内容(AIGC)的概念与内涵进行了多层次的深刻理解与清晰明确的分析定义。白皮书围绕人工智能生成内容(AIGC)的历史沿革、兴起背景、技术能力、应用价值等维度进行了横向与纵向的思考与整理,明确了技术与应用的边界与组成,为未来的行业发展提供方向参考。
2.白皮书对人工智能生成内容(AIGC)当前技术发展和能力体系做出全面梳理,认为深度神经网络技术在大模型和多模态两个方向上的持续突破,推动AIGC技术演化出孪生、编辑、创作三大前沿能力。作为人工智能技术和产业应用的要素之一,探讨人工智能生成内容(AIGC)技术体系的构成和发展对制定领域内标准、达成国际共识、建立全球生态、争取更加广泛的开发者和应用场景具备十分重要的意义。白皮书所提炼的AIGC技术能力体系,既涵盖了相关技术的最新进展和未来发展方向,也囊括了助力AIGC应用创新和产品落地的三大核心能力。
人工智能生成内容(AIGC)的三大前沿能力
3.白皮书整理总结了人工智能生成内容(AIGC)行业应用现状,提出人工智能生成内容(AIGC)率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,并正加速与各行各业的结合。人工智能生成内容(AIGC)作为数字内容创作的重要升级,在数字内容愈发繁荣、数实融合大势所趋的背景下,正在发展成与各类行业深度融合的横向结合体,其相关应用正加速渗透到经济社会的方方面面。白皮书重点分析了人工智能生成内容(AIGC)在传媒、电商、影视等行业和场景的应用情况,探讨了以虚拟数字人等为代表的新业态和新应用。
人工智能生成内容(AIGC)应用视图
4.本白皮书对我国人工智能生成内容发展中所存在的问题进行了客观分析,即人工智能生成内容(AIGC)的关键技术、企业管理和政策监管尚未完善,并提出建议对策。人工智能生成内容(AIGC)在迸发巨大应用潜力的同时,可能存在的风险也不容忽视,围绕公平、责任、安全的争议日益增多,引发了一系列亟待解决的问题。白皮书从技术算法、企业管理、政策监管等视角,梳理了人工智能生成内容(AIGC)所暴露出的版权纠纷、虚假信息传播等各种问题,并从政府、行业、企业、社会等层面,给出了人工智能生成内容(AIGC)发展和治理建议。
(辛文)
免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。【责任编辑:钟经文】人工智能生成内容(AIGC)总览记录(认知篇)!!!
文章目录一、AIGC引入1.1AIGC定义1.2AIGC历史沿革(了解)1.3AIGC技术演进二、AIGC大模型2.1视觉大模型提升AIGC感知能力2.2语言大模型增强AIGC认知能力2.3多模态大模型升级AIGC内容创作能力三、人工智能生成内容的应用场景3.1AIGC+传媒:人机协同生产,推动媒体融合3.2AIGC+电商:推进虚实交融,营造沉浸体验3.3AIGC+影视:拓展创作空间,提升作品质量3.4AIGC+娱乐:扩展辐射边界,获得发展动能3.5AIGC+其他:推进数实融合,加快产业升级附A.AIGC&Metaverse&DigitalTwinA.0AIGCA.1元宇宙(Metaverse)A.2数字孪生(DigitalTwin)一、AIGC引入1.1AIGC定义qquadAIGC又称生成式AI(GenerativeAI)或人工智能生成内容,是继专业生产内容、用户生产内容之后的新型内容创作方式,可以在对话、故事、图像、视频和音乐制作等方面,打造新的数字内容生成与交互形式。
与所有人工智能技术一样,AIGC的能力由机器学习模型提供,这些模型是基于大量数据进行预先训练的大模型,通常被称为基础模型(FoundationModels)。如今以基础模型为驱动的AIGC应用迭代速度呈现指数级发展,从由StableDiffusion文生图模型驱动的AI作画应用,再到以大语言模型(LLM)驱动的智能聊天机器人,深度学习模型不断完善、开源预训练基础模型的推动以及大模型探索商业化的可能,都在成为这场人工智能颠覆性革命的主要驱动力。摘自:https://aws.amazon.com/cn/campaigns/aigc/
PGC、UGC和AIGC是与内容生成相关的术语,它们的概念和区别如下:
PGC(Professional-generatedContent,专业生产内容):PGC是由专业创作者或专业团队制作和生成的内容,这些创作者具备专业的技能和知识,在特定领域有丰富的经验。PGC的特点是高质量、精心制作、专业性强,传统的媒体机构、电影制片厂、电视台等通常是PGC的主要生产者,PGC的例子包括电影、电视剧、新闻报道、专业摄影作品等。
UGC(User-generatedContent,用户生成内容):UGC是由用户自主产生和共享的内容,用户可以通过社交媒体平台、博客、论坛等自由发布和传播他们自己创作的内容。UGC的特点是多样性、大量性和即时性,它可以包括照片、视频、博文、评论等形式的内容。UGC的好处是能够促进用户参与和互动,丰富了内容的来源和多样性。
AIGC(ArtificialIntelligenceGeneratedContent):AIGC是由人工智能生成内容,即通过机器学习、自然语言处理、计算机视觉等技术,人工智能能够自动地创作和生成各种形式的内容,如文章、音乐、图像等。AIGC的优点是可以快速生成大量的内容,并且可以适应个性化需求。然而,AIGC也存在一些挑战,如保护知识产权、确保生成内容的质量和真实性。
1.2AIGC历史沿革(了解)早期萌芽阶段(20世纪50年代至90年代中期)qquad受限于当时的科技水平,AIGC仅限于小范围实验。
1957年,莱杰伦·希勒(LejarenHiller)和伦纳德·艾萨克森(LeonardIsaacson)通过将计算机程序中的控制变量换成音符完成了历史上第一只支由计算机创作的音乐作品―—弦乐四重奏《依利亚克组曲(IlliacSuite)》。1966年,约瑟夫·魏岑鲍姆(JosephWeizenbaum)和肯尼斯·科尔比(KennethColby)共同开发了世界第一款可人机对话的机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组完成交互任务。80年代中期,IBM基于隐形马尔科夫链模型(HiddenMarkovModel,HMM)创造了语音控制打字机“坦戈拉(Tangora)”,能够处理约20000个单词。沉淀积累阶段(20世纪90年代中期至21世纪10年代中期)qquad人工智能发展由于以下原因取得了显著的进步:
深度学习算法取得重大突破图形处理器(GraphicsProcessingUnit,GPU)、张量处理器(TensorProcessingUnit,TPU)等算力设备性能不断提升互联网使数据规模快速膨胀并为各类人工智能算法提供了海量训练数据qquadAIGC也从实验性向实用性逐渐转变:
qquad2012年,微软公开展示了一个全自动同声传译系统,基于深层神经网络(DeepNeuralNetwork,DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。
快速发展阶段(21世纪10年代中期至今)qquad自2014年起,随着以生成式对抗网络(GenerativeAdversarialNetwork,GAN)为代表的深度学习算法的提出和迭代更新,AIGC迎来了新时代,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。
2017,微软小冰创作世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》2018,英伟达发布的StyleGAN可以自动生成图片,目前第四代模型StyleGAN-XL生成的高分辨率图片人眼难以分辨真假2019,DeepMind发布了DVD-GAN用以生成连续视频2021,OpenAI发布的DALL-E及次年发布的升级版本DALL-E-2可用于文本与图像的交互生成内容来源:中国信息通信研究院和京东探索研究院人工智能生成内容(AIGC)白皮书
1.3AIGC技术演进传统基于模板或规则的前深度学习阶段qquad早期的AIGC技术主要依据事先指定的模板或者规则,进行简单的内容制作与输出,与灵活且真实的内容生成有较大的差距。该时期的人工智能算法并不具备强大的学习能力,而是大多依赖于预先定义的统计模型或专家系统执行特定的任务。通过巧妙地规则设计,早期AIGC技术可以完成简单线条、文本和旋律的生成。但是由于缺乏对客观世界的深入感知和对人类语言文字等知识的认知能力,早期的AIGC技术普遍面临所生成的内容空洞、刻板、文不对题等问题。参考人类的内容创作过程,研究人员们提出,理想的AIGC算法需要具备对数据内容的学习能力,在理解数据的基础上进行知识与分布的学习,最终实现高质量的内容创作。
深度神经网络快速发展的深度学习阶段qquad深度神经网络在学习范式(人工智能的学习范式是指人工智能模型从数据中进行学习的方法)和网络结构上的不断迭代极大的提升了人工智能算法的学习能力,从而推动了AIGC技术的快速发展。
qquad从早期的玻尔兹曼机,多层感知机,卷积神经网络,到深度残差网络和Transformer大模型,网络结构进化带来了深度学习模型参数量从几万到数千亿跃升,模型层数也从开始的个位数逐步发展到成百上千。深度学习模型规模上的量变引起了AIGC技术能力的质变,在新型网络结构的加持下,相关算法开始能生成超高清晰度的视频,高质量的文本段落和优美灵动的乐曲旋律。
来源:中国信息通信研究院和京东探索研究院人工智能生成内容(AIGC)白皮书
二、AIGC大模型qquad超级深度学习近年来的快速发展带来了深度神经网络技术在大模型和多模态两个方向上的不断突破,并为AIGC技术能力的升级提供了强力的支撑和全新的可能性。研究界在大规模深度网络、多模态人工智能方面的探索表明大模型具备易扩展性,能够实现跨模态的知识沉淀,以大模型为基础模型,通过大模型小型化技术使得人工智能在小数据集场景下也能具备优秀的理解、生成和泛化能力,具有超大规模、超多参数量的多模态大型神经网络将引领AIGC技术升级正在成为学界、产业界共识。
2.1视觉大模型提升AIGC感知能力视觉数据及其感知以图像、视频为代表的视觉数据是互联网时代信息的主要载体之一,这些视觉信息时刻记录着物理世界的状态,并在不断传播和再创作的过程中,反映人的想法、观念和价值主张。赋以人工智能模型感知并理解这些海量的视觉数据的能力,是实现人工智能生成数字内容、数字孪生的基础;感知能力的提升,是实现生成视觉内容语义明确、内涵丰富、效果逼真的前提。视觉Transformer(VisionTransformer,ViT)qquad以视觉Transformer(ViT,一种神经网络模型)为代表的新型神经网络,因其优异的性能、模型的易扩展性、计算的高并行性,正在成为视觉领域的基础网络架构,并且逐渐发展出来十亿甚至百亿参数规模的模型。在过去的2-3年间,视觉感知和理解技术正迎来突飞猛进的发展。
qquad基于Transformer衍生出来的一系列网络结构,例如SwinTransformer、ViTAETransformer。通过将人类先验知识引入网络结构设计,使得这些模型具有了更快的收敛速度、更低的计算代价、更多的特征尺度、更强的泛化能力,从而能更好地学习和编码海量数据中蕴含的知识。这些新型的大模型架构,通过无监督预训练和微调学习的范式,在图像分类、目标检测、语义分割、姿态估计、图像编辑以及遥感图像解译等多个感知任务上取得了相比于过去精心设计的多种算法模型更加优异的性能和表现,有望成为基础视觉模型,显著提升场景感知能力,助力AIGC领域的发展。
2.2语言大模型增强AIGC认知能力qquad作为人类文明的重要记录方式,语言和文字记录了人类社会的历史变迁、科学技术和知识文化等。利用人工智能技术对海量语言、文本数据进行信息挖掘和内容理解是AIGC技术的关键一环。一方面,语言模型的训练和学习是进行文本生成的核心基础;另一方面,学习并理解人类语言将大幅丰富数字内容的生产能力,创新、丰富数字内容的生产方式,例如构建低门槛创作工具,使用户通过语言描述就能完成例如语言定位、语言编辑等高阶编辑操作。
qquad对于传统自然语言处理技术的普遍问题,基于语言的大模型技术可以充分利用海量无标注文本进行预训练,从而赋予文本大模型在小数据集、零数据集场景下的理解和生成能力。基于大规模预训练的语言模型不仅能够在情感分析、语音识别、信息抽取、阅读理解等文本理解场景中表现出色,而且同样适用于图片描述生成、广告生成、书稿生成、对话生成等文本生成场景。这些复杂的功能往往只需要通过简单的无标注文本数据收集,训练部署一个通用的大规模预训练模型即可实现。例如,谷歌和OpenAI分别提出的大规模预训练模型BERT和GPT,在诸多自然语言理解和生成任务上取得了突破性的性能提升,验证了大模型在零资源、小样本、中低资源场景的优越性。
2.3多模态大模型升级AIGC内容创作能力qquad在日常生活中,视觉和语言是最常见且重要的两种模态,上述的视觉大模型可以构建出人工智能更加强大的环境感知能力,而语言大模型则可以学习到人类文明的抽象概念以及认知的能力。然而AIGC技术如果只能生成单―模态的内容,那么AIGC的应用场景将极为有限、不足以推动内容生产方式的革新。
qquad多模态大模型的出现,则让融合性创新成为可能,极大丰富了AIGC技术可应用的广度。对于包含多个模态的信息,多模态大模型则致力于处理不同模态、不同来源、不同任务的数据和信息,从而满足AIGC场景下新的创作需求和应用场景。
qquad多模态大模型拥有两种能力,一个是寻找到不同模态数据之间的对应关系,例如将一段文本和与之对应的图片联系起来;另一个是实现不同模态数据间的相互转化与生成,比如根据一张图片生成对应的语言描述。为了寻找到不同模态数据之间的对应关系,多模态大模型将不同模态的原始数据映射到统一或相似语义空间当中,从而实现不同模态的信号之间的相互理解与对齐,这一能力最常见的例子就是互联网中使用文字搜索与之相关图片的图文搜索引擎。在此基础上,多模态大模型可以进一步实现不同模态数据间的相互转化与生成,这一能力是进行AIGC原生创作的关键。
qquad对于人工智能而言,能够高质量的完成多模态数据的对齐、转换和生成任务意味着模型对物理世界具备了极为深刻的理解。从某种程度而言,基于多模态大模型的AIGC是人工智能算法迈向通用人工智能的重要一步。
来源:中国信息通信研究院和京东探索研究院人工智能生成内容(AIGC)白皮书
三、人工智能生成内容的应用场景3.1AIGC+传媒:人机协同生产,推动媒体融合采编实现采访录音语音转写,提升传媒工作者的工作体验:借助语音识别技术将录音语音转写成文字,有效压缩稿件生产过程中录音整理方面的重复工作,进一步保障了新闻的时效性。实现智能新闻写作,提升新闻资讯的时效:基于算法自动编写新闻,将部分劳动性的采编工作自动化,帮助媒体更快、更准、更智能化地生产内容。实现智能视频剪辑,提升视频内容的价值:通过使用视频字幕生成、视频锦集、视频拆条、视频超分等视频智能化剪辑工具,高效节省人力时间成本,最大化版权内容价值。传播实现AI合成主播(新闻播报、多语种播报、手语播报):AIGC应用主要集中于以AI合成主播为核心的新闻播报等领域;AI合成主播开创了新闻领域实时语音及人物动画合成的先河,只需要输入所需要播发的文本内容,计算机就会生成相应的AI合成主播播报的新闻视频,并确保视频中人物音频和表情、唇动保持自然一致,展现与真人主播无异的信息传达效果。3.2AIGC+电商:推进虚实交融,营造沉浸体验AIGC打造虚拟主播,赋能直播带货虚拟主播优势:
虚拟主播能够填补真人主播的直播间隙,使直播间能不停轮播,既为用户提供更灵活的观看时间和更方便的购物体验,也为合作商家创造更大的生意增量虚拟化的品牌主播更能加速店铺或品牌年轻化进程,拉近与新消费人群的距离,塑造元宇宙时代的店铺形象,未来可通过延展应用到元宇宙中更多元的虚拟场景,实现多圈层传播。虚拟主播人设更稳定可控,在头部主播有限并且可能“人设崩塌”的情况下,虚拟主播人设、言行等由品牌方掌握,比真人明星的可控性、安全性更强。AIGC生成商品3D模型用于商品展示和虚拟试用,提升线上购物体验3.3AIGC+影视:拓展创作空间,提升作品质量AIGC实现剧本创作AIGC为剧本创作提供新思路,通过对海量剧本数据进行分析归纳,并按照预设风格快速生产剧本,创作者再进行筛选和二次加工,以此激发创作者的灵感,开阔创作思路,缩短创作周期。AIGC扩展创作空间角色向:通过人工智能合成人脸、声音等相关内容,实现“数字复活”已故演员、替换“劣迹艺人”、多语言译制片音画同步、演员角色年龄的跨越、高难度动作合成等,减少由于演员自身局限对影视作品的影响。场景向:通过人工智能合成虚拟物理场景,将无法实拍或成本过高的场景生成出来,大大拓宽了影视作品想象力的边界,给观众带来更优质的视觉效果和听觉体验。AIGC赋能影视剪辑,升级后期制作实现对影视图像进行修复、还原,提升影像资料的清晰度,保障影视作品的画面质量实现影视预告片生成实现影视内容从2D向3D自动转制3.4AIGC+娱乐:扩展辐射边界,获得发展动能实现趣味性图像或音视频生成,激发用户参与热情在图像视频方面,以AI换脸为代表的AIGC应用极大满足用户猎奇的需求,成为破圈利器,如FaceAPP、ZAO、Avatarify。打造虚拟偶像,释放IP价值实现与用户共创合成歌曲,加深粉丝粘性通过AI合成音视频动画,支撑虚拟偶像在更多元的场景进行内容变现开发C端用户数字化身,布局消费元宇宙3.5AIGC+其他:推进数实融合,加快产业升级AIGC+教育:赋予教育材料新AIGC+医疗:赋能诊疗全过程AIGC+工业:提升产业效率和价值融入计算机辅助设计CAD,极大缩短工程设计周期:AIGC支持自动化工程设计中重复的、耗时的和低层次的任务;AIGC支持生成衍生设计,为工程师或设计师提供灵感;AIGC支持在设计中引入变化,实现动态模拟。加速数字孪生系统的构建:通过将基于物理环境形成的数字几何图形,快速转化为实时参数化的3D建模数据,高效创建现实世界中工厂、工业设备和生产线等的数字孪生系统。…来源:中国信息通信研究院和京东探索研究院人工智能生成内容(AIGC)白皮书
附A.AIGC&Metaverse&DigitalTwinAIGC、元宇宙和数字孪生都是与数字技术和虚拟世界相关的概念,它们共同构建了一个数字化、互联和虚拟的未来空间。
A.0AIGCqquadAIGC可以为元宇宙提供自动生成的内容,丰富和扩展元宇宙的内容库。
A.1元宇宙(Metaverse)qquad元宇宙是虚拟世界中的一个全息、交互和多维度的数字空间,它由人工智能、虚拟现实、增强现实等技术构建而成。元宇宙允许用户在虚拟世界中进行沉浸式的交互和体验,与其他用户进行社交互动,创造和共享内容,并且可以与现实世界互相连接。元宇宙的理念是构建一个更加开放、互联和可持续发展的数字化空间,它可以应用于娱乐、教育、商业等多个领域。
qquad元宇宙可以是数字孪生的应用场景之一,通过数字孪生技术在虚拟世界中模拟、优化和操作实体和系统。
A.2数字孪生(DigitalTwin)qquad数字孪(luan)生是指现实世界中的实体、过程或系统通过数字化技术实时建模和仿真的虚拟映射,它是现实世界和数字世界的联系和桥梁。数字孪生可以用来监测、分析和优化实体或系统的性能,从而提供预测、决策和优化的依据。数字孪生有许多可以用领域,如工业生产、城市规划、医疗保健等。
qquad数字孪生可以为元宇宙提供现实世界中实体的虚拟映射,使元宇宙更加真实和逼真。
qquadIBM:什么是数字孪生?
实践篇toDo:AIGC+Coding
[中国信通院]:2023年人工智能生成内容(AIGC)白皮书
CAICT中国信通院京东探索研究院JDEXPLOREACADEMY焦智白皮书No.202212人工智能生成内容(AIGC)白皮书(2022年)中国信息通信研究院京东探索研究院2022年9月版权声明本白皮书版权属于中国信息通信研究院和京东探索研究院,并受法律保护。转载、摘编或利用其它方式使用本白皮书文学或者观点的,应注明“来源:中国信息通信研究院CAICT中国和京东探索研究院”。违反上述声明者,编者将追究其相关法律责任。前言习近平总书记曾指出,“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”。在当前数字世界和物理世界加速融合的大背景下,人工智能生成内容(ArtificialIntelligenceGeneratedContent,简称AIGC)正在悄然引导着一场深刻的变革,重塑甚至颠覆数字内容的生产方式和消费模式,将极大地丰富人们的数字生活,是未来全面迈向数字文明新时代不可或缺的支撑力量。本白皮书重点从AIGC技术、应用和治理等维度进行了阐述。在技术层面,梳理提出了AIGC技术体系,既涵盖了对现实世界各种内容的数字化呈现和增强,也包括了基于人工智能的自主内容创作。在应用层面,重点分析了AIGC在传媒、电商、影视等行业和场景的应用情况,探讨了以虚拟数字人,写作机器人等为代表的新业态和新应用。在治理层面,从政策监管、技术能力、企业应用等视角,分析了AIGC所暴露出的版权纠纷、虚假信息传播等各种问题。最后,从政府、行业、企业、社会等层面,给出了AIGC发展和治理建议。由于人工智能仍处于飞速发展阶段,我们对AIGC的认识还有待进一步深化,白皮书中存在不足之处,敬请大家批评指正。目录、人工智能生成内容的发展历程与概念(一)AIGC历史沿革(二)AIGC的概念与内涵二、人工智能生成内容的技术体系及其演进方向(一)AIGC技术升级步入深化阶段(二)AIGC大模型架构潜力凸显..10(三)AIGC技术演化出三大前沿能力.18三、人工智能生成内容的应用场景26(一)AIGC+传媒:人机协同生产,推动媒体融合..27(二)AIGC+电商:推进虚实交融,营造沉浸体验..29(三)AIGC+影视:拓展创作空间,提升作品质量32(四)AIGC+娱乐:扩展辐射边界,获得发展动能..35(五)AIGC+其他:推进数实融合,加快产业升级.37四、人工智能生成内容发展面临的问题.38五、发展建议与展望..43(一)发展建议.43(二)未来展望..48AI图目录图1AIGC发展历程图2AIGC多模态大模型生成结果图图3OpenAIAIGC多模态大模型DALLE2生成结果图.18CAICT中国信通图4AIGC的三大前沿能力.19图5AIGC应用视图............人工智能生成内容(AIGC)白皮书一、人工智能生成内容的发展历程与概念1950年,艾伦·图灵(AlanTuring)在其论文《计算机器与智能(ComputingMachineryandIntelligence)》中提出了著名的“图灵测试”,给出了判定机器是否具有“智能”的试验方法,即机器是否能够模仿人类的思维方式来“生成”内容继而与人交互。某种程度上来说,人工智能从那时起就被寄子了用于内容创造的期许。经过半个多世纪的发展,随着数据快速积累、算力性能提升和算法效力增强,今天的人工智能不仅能够与人类进行互动,还可以进行写作、编曲、绘画、视频制作等创意工作。2018年,人工智能生成的画作在佳士得拍卖行以43.25万美元成交,成为世界上首个出售的人工智能艺术品,引发各界关注。随着人工智能越来越多地被应用于内容创作,人工智能生成内容(ArtificialIntelligenceGeneratedContent,简称AIGC)的概念悄然兴起。(一)AIGC历史沿革结合人工智能的演进历程,AIGC的发展大致可以分为三个阶段,即:早期萌芽阶段(20世纪50年代至90年代中期)、沉淀积累阶段(20世纪90年代中期至21世纪10年代中期),以及快速发展阶段(21世纪10年代中期至今)。早期萌芽阶段(1950s-1990s),受限于当时的科技水平,AIGC仅限于小范围实验。1957年,莱杰伦·希勒(LejarenHiller)和伦纳人工智能生成内容(AIGC)白皮书德·艾萨克森(LeonardIsaacson)通过将计算机程序中的控制变量换成音符完成了历史上第一支由计算机创作的音乐作品一弦乐四重奏《依利亚克组曲(IlliacSuite)》。1966年,约瑟夫·魏岑鲍姆(JosephWeizenbaum)和肯尼斯·科尔比(KennethColby)共同开发了世界第一款可人机对话的机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组完成交互任务。80年代中期,IBM基于隐形马尔科夫链模型(HiddenMarkovModel,HMM)创造了语音控制打字机“坦戈拉(Tangora)”,能够处理约20000个单词。80年代末至90年代中,由于高昂的系统成本无法带来可观的商业变现,各国政府纷纷减少了在人工智能领域的投入,AIGC没有取得重大突破。沉淀积累阶段(1990s-2010s),AIGC从实验性向实用性逐渐转变。2006年,深度学习算法取得重大突破,同时期图形处理器(GraphicsProcessingUnit,GPU)、张量处理器(TensorProcessingUnitTPU)等算力设备性能不断提升,互联网使数据规模快速膨胀并为各类人工智能算法提供了海量训练数据,使人工智能发展取得了显著的进步。但是AIGC依然受限于算法瓶颈,无法较好地完成创作任务,应用仍然有限,效果有待提升。2007年,纽约大学人工智能研究员罗斯·古德温装配的人工智能系统通过对公路旅行中的一切所见所闻进行记录和感知,撰写出小说《1TheRoad》。作为世界第一部完全由人工智能创作的小说,其象征意义远大于实际意义,整体可读性不强拼写错误、辞藻空洞、缺乏逻辑等缺点明显。2012年,微软公开展示2人工智能生成内容(AIGC)白皮书了一个全自动同声传译系统,基于深层神经网络(DeepNeuralNetwork,DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。快速发展阶段(2010s-至今),自2014年起,随着以生成式对抗网络(GenerativeAdversarialNetwork,GAN)为代表的深度学习算法的提出和迭代更新,AIGC迎来了新时代,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。2017年,微软人工智能少女“小冰”推出了世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》。2018年,英伟达发布的StyleGAN模型可以自动生成图片,目前已升级到第四代模型StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假2019年,DeepMind发布了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景下表现突出。2021年,OpenAI推出了DALL-E并于一年后推出了升级版本DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。3人工智能生成内容(AIGC)白皮书AIGC的“m更费试”,也典型事件定机器思百舞有·“智2007年,世第一元全生2017年,款*小冰2019年,0e(阳光失了获深留)DDeepMin2012年,款照示含自通Tat2018年,英净达发市IBMStyleGAN相可以电动NVIDIA#TangoraAIGC发展特点爱隔于科技水率,AIGC仅限于小范围实验变,妥膜于算法感观,无法面流进行内容生成花产,双果汽新通真直至人类难以分销人工智能早期萌芽价段沉淀积累阶段快连发病阶投总体阶段(20世纪50年代至90年代中期)(20世纪90年代中期至21(21世纪10年代中期至今)世纪10年代中期)来源:中国信息通信研究院图1AIGC发展历程(二)AIGC的概念与内涵目前,对AIGC这一概念的界定,尚无统一规范的定义。国内产学研各界对于AIGC的理解是“继专业生成内容(ProfessionalGeneratedContent,PGC)和用户生成内容(UserGeneratedContent,UGC)之后,利用人工智能技术自动生成内容的新型生产方式”。在国际上对应的术语是“人工智能合成媒体(AI-generatedMedia或SyntheticMedia)"1,其定义是“通过人工智能算法对数据或媒体进行生产、操控和修改的统称”。综上所述,我们认为AIGC既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。本白皮书主要聚焦于AIGC含义维基百科:“人工智能合成媒体(AI-generatedMedia或SyntheticMedia)https:/len.wikipedia.org/wiki/Synthetic_media4人工智能生成内容(AIGC)白皮书中的技术部分。为了帮助不同领域的受众群体更好的理解AIGC,我们从发展背景、技术能力、应用价值三个方面对其概念进行深入剖析,从发展背景方面来看,AIGC的兴起源于深度学习技术的快速突破和日益增长的数字内容供给需求。一方面,技术进步驱动AIGC可用性不断增强。在人工智能发展初期,虽然对AIGC进行了一些初步尝试,但受限各种因素,相关算法多基于预先定义的规则或者模板还远远算不上是智能创作内容的程度。近年来,基于深度学习算法的AIGC技术快速送代,彻底打破了原先模板化、公式化、小范围的局限,可以快速、灵活地生成不同模态的数据内容。另一方面,海量需求牵引AIGC应用落地。随着数字经济与实体经济融合程度不断加深,以及Meta、微软、字节跳动等平台型巨头的数字化场景向元宇宙转型,人类对数学内容总量和丰富程度的整体需求不断提高。数学内容的生产取决于想象能力、制造能力和知识水平;传统内容生产手段受限于人力有限的制造能力,逐渐无法满足消费者对于数学内容的消费需求,供给侧产能瓶颈日益凸显。基于以上原因,AIGC在各行业中得到越来越广泛的应用,市场潜力逐渐显现。从技术能力方面来看,AIGC根据面向对象、实现功能的不同可分为三个层次。一是智能数字内容李生,其主要目标是建立现实世界到数字世界的映射,将现实世界中的物理属性(如物体的大小、纹理、颜色等)和社会属性(如主体行为、主体关系等)高效、可感知地进5人工智能生成内容(AIGC)白皮书行数学化。二是智能数字内容编辑,其主要自的是建立数学世界与现实世界的双向交互。在数字内容李生的基础上,从现实世界实现对虚拟数字世界中内容的控制和修改,同时利用数字世界高效率仿真和低成本试错的优势,为现实世界的应用提供快速送代能力。三是智能数字内容创作,其主要目标是让人工智能算法具备内容创作和自我演化的能力,形成的AIGC产品具备类似甚至超越人的创作能力。以上三个层面的能力共同构成AIGC的能力闭环从应用价值方面来看,AIGC将有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。一方面,AIGC能够以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本,高效率的方式满足海量个性化需求;同时能够创新内容生产的流程和范式,为更具想象力的内容、更加多样化的传播方式提供可能性,推动内容生产向更有创造力的方向发展。另一方面,AIGC能够通过支持数字内容与其他产业的多维互动、融合渗透从而孕育新业态新模式,打造经济发展新增长点,为千行百业发展提供新动能。此外,2021年以来,“元宇宙”呈现出超出想象的发展爆发力;作为数实融合的“终极”数字载体,元宇宙将具备持续性、实时性、可创造性等特征,也将通过AIGC加速复刻物理世界、进行无限内容创作,从而实现自发有机生长。人工智能生成内容(AIGC)白皮书二、人工智能生成内容的技术体系及其演进方向AIGC作为人工
2023年人工智能生成内容(AIGC)白皮书(附PPT)
原标题:2022年人工智能生成内容(AIGC)白皮书(附PPT)白皮书对人工智能生成内容(AIGC)的概念与内涵进行了多层次的深刻理解与清晰明确的分析定义。白皮书围绕人工智能生成内容(AIGC)的历史沿革、兴起背景、技术能力、应用价值等维度进行了横向与纵向的思考与整理,明确了技术与应用的边界与组成,为未来的行业发展提供方向参考。
白皮书对人工智能生成内容(AIGC)当前技术发展和能力体系做出全面梳理,认为深度神经网络技术在大模型和多模态两个方向上的持续突破,推动AIGC技术演化出孪生、编辑、创作三大前沿能力。白皮书所提炼的AIGC技术能力体系,既涵盖了相关技术的最新进展和未来发展方向,也囊括了助力AIGC应用创新和产品落地的三大核心能力。
报告下载:添加公·从·号【碳圈报告库】
白皮书整理总结了人工智能生成内容(AIGC)行业应用现状,提出人工智能生成内容(AIGC)率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,并正加速与各行各业的结合。白皮书重点分析了人工智能生成内容(AIGC)在传媒、电商、影视等行业和场景的应用情况,探讨了以虚拟数字人等为代表的新业态和新应用。
本白皮书对我国人工智能生成内容发展中所存在的问题进行了客观分析,即人工智能生成内容(AIGC)的关键技术、企业管理和政策监管尚未完善,并提出建议对策。白皮书从技术算法、企业管理、政策监管等视角,梳理了人工智能生成内容(AIGC)所暴露出的版权纠纷、虚假信息传播等各种问题,并从政府、行业、企业、社会等层面,给出了人工智能生成内容(AIGC)发展和治理建议。
展开全文返回搜狐,查看更多
责任编辑: