博舍

人工智能生成内容(AIGC)白皮书(2023年) 人工智能生成作品

人工智能生成内容(AIGC)白皮书(2023年)

一、人工智能生成内容的发展历程与概念

(一)AIGC历史沿革

(二)AIGC的概念与内涵

二、人工智能生成内容的技术体系及其演进方向

(一)AIGC技术升级步入深化阶段

(二)AIGC大模型架构潜力凸显

(三)AIGC技术演化出三大前沿能力

三、人工智能生成内容的应用场景

(一)AIGC+传媒:人机协同生产,推动媒体融合

(二)AIGC+电商:推进虚实交融,营造沉浸体验

(三)AIGC+影视:拓展创作空间,提升作品质量

(四)AIGC+娱乐:扩展辐射边界,获得发展动能

(五)AIGC+其他:推进数实融合,加快产业升级

四、人工智能生成内容发展面临的问题

五、发展建议与展望

(一)发展建议

(二)未来展望

生成人工智能研究为创作者提供引导式图像结构控制

 

新的研究正在提升人工智能的创造力,通过文本引导的图像编辑工具。这项研究提出了一种使用即插即用扩散特征(PnP-DF)的框架,可以指导真实和精确的图像生成。视觉内容创作者可以通过一个提示图像和几个描述性单词,将图像转换为视觉效果。

可靠而轻松地编辑和生成内容的能力有可能扩大艺术家、设计师和创作者的创作可能性。它还可以加强依赖动画、视觉设计和图像编辑的行业。

“最近的文本到图像生成模型标志着数字内容创作进入了一个新时代。然而,将它们应用于现实世界应用程序的主要挑战是缺乏用户可控性,这在很大程度上被限制为仅通过输入文本来指导生成。我们的工作是为用户提供对图像布局控制的首批方法之一,”NarekTumanyan说,魏茨曼科学研究所的主要作者和博士候选人。

最近在生成人工智能方面的突破为开发强大的文本到图像模型开辟了新的途径。然而,复杂性、模糊性和对自定义内容的需求限制了当前的渲染技术。

该研究介绍了一种使用PnPDFs的新方法,该方法改进了图像编辑和生成过程,使创作者能够更好地控制其最终产品。

研究人员从一个简单的问题开始:扩散模型是如何表示和捕捉图像的形状或轮廓的?该研究探索了图像在生成过程中的内部表征,并考察了这些表征如何编码形状和语义信息。

新方法控制生成的布局,而无需训练新的扩散模型或对其进行调整,而是通过理解空间信息是如何在预训练的文本到图像模型中编码的。在生成过程中,模型从引入的引导图像中提取扩散特征,并将其注入生成过程的每个步骤,从而对新图像的结构进行细粒度控制。

通过结合这些空间特征,扩散模型对新图像进行细化,以匹配制导结构。它迭代地执行这一操作,更新图像特征,直到它降落在最终图像上,该图像保留了指南图像布局,同时也匹配了文本提示。

作者写道:“这产生了一种简单有效的方法,将从制导图像中提取的特征直接注入到翻译图像的生成过程中,不需要训练或微调。”。

这种方法为更先进的受控生成和操作方法铺平了道路。

视频1。“文本驱动的图像到图像翻译的即插即用扩散特征”研究综述2023ConferenceonComputerVisionandPatternRecognition(CVPR)

研究人员利用cuDNN加速PyTorch框架,在NVIDIAA100GPU平台上开发和测试了PNP模型。据该团队称,GPU的大容量使他们能够专注于方法开发。研究人员获得A100的支持,是因为他们参与了NVIDIAAppliedResearchAcceleratorProgram。

该框架部署在A100上,在大约50秒内从引导图像和文本转换出新图像。

这个过程不仅有效而且可靠,可以准确地生成令人惊叹的图像。它还可以超越图像,翻译草图、绘图和动画,并可以修改照明、颜色和背景。

图1。该方法的样本结果保留了引导折纸图像的结构,同时匹配了目标提示的描述(来源:Tumanyan,Narek等人/CVPR2023年)

他们的方法也优于现有的文本到图像模型,在保留制导布局和偏离其外观之间实现了卓越的平衡。

图2:将该模型与P2P、DiffuseIT、具有三种不同噪声水平的SDedit以及VQ+CLIP模型进行比较的示例结果(资料来源:Tumanyan、Narek等人/CVPR2023年)

然而,该模型确实存在局限性。当编辑具有任意颜色的图像部分时,它不能很好地执行,因为模型不能从输入图像中提取语义信息。

研究人员目前正致力于将这种方法扩展到文本引导的视频编辑中。这项工作也被证明对其他利用扩散模型中图像内部表示分析能力的研究有价值。

例如,一项研究利用团队的研究见解来改进计算机视觉任务,如语义点对应。另一个重点是扩大文本到图像生成控制,包括对象的形状、位置和外观。

来自魏茨曼科学研究所的研究小组将在CVPR2023上发表这项作品,该作品也在GitHub上开源。

想要了解更多关于团队的信息,请访问项目页面。阅读研究报告Plug-and-PlayDiffusionFeaturesforText-DrivenImage-to-ImageTranslation。观看NVIDIA研究在CVPR2023上实现的人工智能突破。

 

科学网—生成式人工智能的艺术与科学

生成式人工智能的艺术与科学精选

已有1772次阅读2023-6-2106:02|系统分类:海外观察

生成式人工智能的艺术与科学

AI会不会终结艺术?许多人担心,AI能制作高质量的艺术作品散文和诗歌,会不导致这些行业的终结。本文对这个问题进行了很好的探讨,认为不会,但会对这些原来只属于人类的领域产生重大影响,导致新艺术形式的出现。

ArtandthescienceofgenerativeAI|Science

一类新工具的功能,俗称生成人工智能(AI),是一个备受争议的话题。迄今为止,一个突出的应用是为视觉艺术、概念艺术、音乐和文学以及视频和动画制作高质量的艺术媒体。例如,扩散模型可以合成高质量的图像(1),而大型语言模型(LLM)可以在广泛的上下文中产生听起来合理且令人印象深刻的散文和诗歌(2)。这些工具的生成能力可能会从根本上改变创作者制定想法并将其投入生产的创作过程。随着创造力被重新构想,社会的许多部门也可能被重新构想。了解生成式人工智能的影响,并围绕它做出政策决策,需要对文化、经济、法律、算法以及技术和创造力的相互作用进行新的跨学科科学探究。

乍一看,生成式人工智能工具似乎完全自动化了艺术生产――这种印象反映了过去传统主义者将新技术视为威胁“艺术本身”的例子。事实上,这些技术变革的时刻并不预示着“艺术的终结”,而是产生了更复杂的影响,重塑了创作者的角色和实践,并改变了当代媒体的美学(3)。例如,一些19世纪的艺术家将摄影的出现视为对绘画的威胁。然而,摄影并没有取代绘画,而是最终将其从现实主义中解放出来,引发了印象派和现代艺术运动。相比之下,肖像摄影确实在很大程度上取代了肖像画。同样,音乐制作的数字化(例如,数字采样和声音合成)被谴责为“音乐的终结”。相反,它改变了人们制作和听音乐的方式,并帮助催生了新的流派,包括嘻哈和鼓贝斯。像这些历史类比一样,生成人工智能并不是艺术消亡的预兆,而是一种具有自己独特能力的新媒介。作为人类创作者使用的一套工具,生成式人工智能的定位是颠覆创意产业及其他领域的许多部门――在短期内威胁到现有的工作和劳动模式,同时最终实现新的创造性劳动模式并重新配置媒体生态系统。

然而,与过去的颠覆不同,生成式人工智能依赖于人们的训练数据。这些模型通过从现有的艺术媒体中提取统计模式来“学习”生成艺术。这种对训练数据的依赖引发了新的问题,例如数据的来源、它如何影响输出以及如何确定作者身份。通过利用现有工作来自动化创作过程的各个方面,生成式人工智能挑战了作者身份、所有权、创意灵感、采样和混音的传统定义,从而使现有的媒体制作概念复杂化。因此,重要的是要考虑生成人工智能对美学和文化的影响、所有权和信用的法律问题、创意工作的未来以及对当代媒体生态系统的影响。在这些主题中,有一些关键的研究问题可以为这项技术的政策和有益用途提供信息(4)。

为了正确研究这些主题,首先有必要了解用于描述AI的语言如何影响对技术的看法。“人工智能”一词可能误导性地暗示这些系统表现出类似人类的意图、代理甚至自我意识。基于自然语言的界面现在伴随着生成AI模型,包括使用“I”代词的聊天界面,这可能会给用户一种类似人类的互动和代理感。这些看法可能会破坏创作者的信誉,他们的劳动是系统产出的基础(5),并在这些系统造成伤害时转移开发人员和决策者的责任(6)。未来的工作需要了解对生成过程的看法如何影响对产出和作者的态度。这可以促进设计披露生成过程并避免误导性解释的系统。

生成人工智能的特定功能反过来又产生了可能对艺术和文化产生长期影响的新美学。随着这些工具变得越来越普遍,它们的使用变得司空见惯(就像一个世纪前的摄影一样),它们输出的美学将如何影响艺术输出仍然是一个悬而未决的问题。生成式人工智能的低进入门槛可以通过扩大参与艺术实践的创作者群体来增加艺术产出的整体多样性(好比今天人人都会拍照,将来人人都是艺术家?)。与此同时,嵌入在训练数据中的审美和文化规范和偏见可能会被捕获、反映甚至放大,从而减少多样性(7)。人工智能生成的内容也可能为未来的模型提供信息,创造一个自我参照的美学飞轮,可以延续人工智能驱动的文化规范。未来的研究应探索量化和增加产出多样性的方法,并研究生成人工智能工具如何影响美学和美学多样性。

社交媒体平台的不透明、参与度最大化的推荐算法可以通过产生耸人听闻和可分享内容的反馈循环(8)进一步加强审美规范。随着算法和内容创建者试图最大限度地提高参与度,这可能会进一步使内容同质化。然而,一些初步实验(9)表明,在某些情况下,在策划人工智能生成的内容时纳入参与度指标可以使内容多样化。推荐算法放大了哪些风格,以及这种优先级如何影响创作者制作和分享的内容类型,仍然是一个悬而未决的问题。未来的工作必须探索由生成模型、推荐算法和社交媒体平台之间的相互作用形成的复杂、动态的系统,以及它们对美学和概念多样性的影响。

生成式人工智能依靠训练数据来自动化创作的各个方面,这引发了有关作者身份的法律和道德挑战,因此应该促使对这些系统的性质进行技术研究。版权法必须平衡创作者、生成性人工智能工具用户和整个社会的利益。如果不直接复制受保护的作品,法律可以将培训数据的使用视为非侵权;如果培训涉及基础数据的实质性转换,则合理使用;仅当创作者提供明确许可时才允许;或受法定强制许可的约束,允许将数据用于培训,前提是创作者获得报酬。大部分版权法依赖于司法解释,因此目前尚不清楚收集第三方数据用于培训或模仿艺术家的风格是否会侵犯版权。法律和技术问题交织在一起:模型是直接从训练数据中复制元素,还是产生全新的作品?即使模特不直接从现有作品中复制,也不清楚是否以及如何保护艺术家的个人风格。什么机制可以保护和补偿那些作品被用于培训的艺术家,甚至允许他们选择退出,同时仍然允许使用生成人工智能模型做出新的文化贡献?回答这些问题并确定版权法应如何处理训练数据需要大量的技术研究来开发和理解人工智能系统,社会科学研究以了解对相似性的看法,以及将现有先例应用于新技术的法律研究。当然,这些观点仅代表美国的法律观点。

一个独特的法律问题涉及谁可以声称对模型输出的所有权。回答这个问题需要了解系统用户与其他利益相关者(例如系统的开发人员和训练数据的创建者)的创造性贡献。人工智能开发人员可以通过使用条款主张对输出的所有权。相比之下,如果系统的用户以有意义的创造性方式参与其中(例如,该过程不是完全自动化的,或者没有模仿特定作品),那么他们可能被视为默认版权所有者。但是,用户的创造性影响力必须有多大才能让他们声称拥有所有权?这些问题涉及研究使用基于人工智能的工具的创作过程,如果用户获得更直接的控制,可能会变得更加复杂。

无论法律结果如何,生成式人工智能工具都可能改变创造性的工作和就业。流行的经济理论[即技能偏向技术变革(SBTC)]假设认知和创造性工作者面临的劳动力中断较少,因为创造力不容易被具体规则所束缚(即波兰尼悖论)(10)。然而,新工具引发了对作曲家、平面设计师和作家等创意职业的就业担忧。之所以出现这种冲突,是因为SBTC未能区分分析工作和创造性构思等认知活动。需要一个新的框架来描述创作过程的具体步骤,其中哪些步骤可能受到生成人工智能工具的影响,以及不同认知职业对工作场所要求和活动的影响(11)。

虽然这些工具可能会威胁到某些职业,但它们可以提高其他职业的生产力,并可能创造新的职业。例如,从历史上看,音乐自动化技术使更多的音乐家能够创作,即使收入倾斜(12)。生成式人工智能系统每分钟可以创建数百个输出,这可以通过快速构思加速创作过程。然而,这种加速也可能通过消除与白板相关的原型初始阶段来破坏创造力的各个方面。无论哪种情况,生产时间和成本都可能会下降。创意产品的生产可能会变得更有效率,从而以更少的工人获得相同数量的产出。反过来,对创造性工作的需求可能会增加。然而,创意产品的生产可能会变得更有效率,从而以更少的工人获得相同数量的产出。此外,许多使用传统工具(如插图或图库摄影)的雇佣职业可能会被取代。几个历史例子证实了这一点。最值得注意的是,工业革命使传统手工工艺品(例如陶瓷、纺织品和炼钢)的大规模生产成为可能,由非工匠的劳动;手工制品成为特色商品。同样,摄影取代了肖像画。音乐的数字化消除了学习物理操作乐器的限制,并使更多的贡献者能够进行更复杂的安排。这些工具可能会改变谁可以作为艺术家工作,在这种情况下,即使平均工资下降,艺术家的就业率也可能上升。

由于这些工具影响了创造性劳动,它们也给更广泛的媒体生态系统带来了潜在的下游危害。随着大规模生产媒体的成本和时间的减少,媒体生态系统可能通过创建合成媒体,特别是为索赔提供证明证据的媒体,容易受到人工智能生成的错误信息的影响(13)。这些生成逼真的合成媒体的新可能性可能会通过所谓的“骗子红利”(虚假内容通过破坏对真相的信任而使骗子受益)(14)破坏对真实捕获媒体的信任,并增加欺诈和未经同意的性图像的威胁。这就提出了重要的研究问题:平台干预,如跟踪来源和检测下游合成媒体,在治理和建立信任方面的作用是什么(15)?合成媒体的激增如何影响对真实媒体的信任,例如未经编辑的新闻照片?随着内容生产的增加,集体注意力可能会减少(16)。人工智能生成内容的爆炸式增长可能反过来阻碍社会在气候和民主等重要领域集体讨论和行动的能力。

每一种艺术媒介都反映和评论了其时代的问题,围绕当代人工智能生成艺术的辩论反映了当前围绕自动化、企业控制和注意力经济的问题。最终,我们通过艺术表达我们的人性,因此理解和塑造人工智能对创造性表达的影响是关于其对社会影响的更广泛问题的中心。对生成式人工智能的新研究应该为该技术的政策和有益用途提供信息,同时与关键的利益相关者,特别是艺术家和创意劳动者本身,他们中的许多人积极参与社会变革的前沿难题。

https://wap.sciencenet.cn/blog-41174-1392448.html上一篇:基础代谢率的真相收藏IP:117.135.15.*|热度|

浅析人工智能生成内容的保护路径

原标题:浅析人工智能生成内容的保护路径来源:中国知识产权报/中国知识产权资讯网

编者按:人工智能生成内容能否获得著作权保护,一直存在争议。本文作者认为,人工智能不宜被视为独立的作者或著作权人,但部分内容可以作为人工智能使用者的作品得到著作权法的保护。

随着人工智能技术的成熟,越来越多的行业开始将这项技术运用于商业生产中,如利用人工智能技术进行自动的图像、符号信息处理,进而产生有欣赏价值的绘画、文学内容等。那么,这些内容是否符合我国著作权法中对作品的定义?相关主体是否可以通过著作权法来进行保护?这些问题在司法实务界和理论学界均存有一定的争议。在笔者看来,分析这些问题应把握两个原则:第一,不能因为保护某些行业而采用功利主义来论断适用某项法律,即对人工智能投资者、使用者的保护不一定要通过著作权法的路径来实现;第二,在大陆法系中需要保障法律的稳定性,不能因出现新事物而轻易改变既有法律规则,因此不宜为人工智能创设新的民事主体类型。

功利主义分析的误区

作品的构成要件包括“属于智力成果”“具有独创性”“表达相对完整”等要素。笔者认为人工智能自动生成的内容难以符合第一个要件,即智力成果是由民法上的自然人或法人创作而产生。但是,从外在表现上看,人工智能生成内容有的难以和自然人或法人创作的作品相区分,如果有人把它当成自己的作品使用、寻求著作权法保护,能否得到支持?这就引发了人工智能生成内容是否应该获得著作权法保护的问题。部分学术和司法观点认为:人工智能生成内容从外在表现上难以与人类的作品区分开来,如果有人将其冒充为人类所创作的作品,事实上很难识别出来,因此区分是没有意义的。另外,如果不给予人工智能生成内容著作权保护,人工智能生成物的投资者就缺少对该内容的垄断性,这可能会损害其利益。基于上述理由,如果人工智能生成物外在表现上类似于人类的创作,那么该内容应该被认定为作品。但笔者认为这种推论存在一定逻辑缺陷,需要加以厘清。

思考人工智能生成内容是否应该获得著作权法保护,需要从两个层面思考问题:一是从本质主义的视角,人工智能生成内容是否满足作品的实质性要求;二是从功利主义角度,给予人工智能著作权有无必要。回答第一个问题,需要厘清我国法律对于作品的实质判断要件。其中,著作权法实施条例第三条所称的“创作”和人工智能生产过程是否等价?如果人工智能生成过程属于著作权法实施条例第三条所称的“创作”,那么人工智能生成物可以被认定为作品,但谁才是这一作品的作者和著作权人?这仍然是法律要解决的问题。从功利主义出发,则需要厘清人工智能生成内容是否值得保护。如果回答是肯定的,则需要研究应采取什么路径来进行保护。如果采取著作权法保护路径,该如何确定著作权归属?此时,无论从本质主义还是功利主义层面,都要解决人工智能的法律地位问题。

具体而言,人工智能生成内容的使用涉及人工智能研发者、人工智能使用者、生产内容使用者之间的利益平衡。例如,媒体斥资购买人工智能软件,使用人工智能生成新闻稿件或股市和金融市场快报,若其他媒体未经同意擅自使用该文稿,此类行为无疑会分流前者的受众,损害前者的商业利益。此时,如果将人工智能生成的新闻稿认定为作品,则前者的利益可以获得著作权法的保护。如果新闻稿的独创性较低,无法被认定为作品,还可以通过反不正当竞争法来保护前者的利益,因此,著作权法保护并非是唯一路径。功利主义分析常见的误区是:以保护人工智能使用者的利益来证明人工智能生成内容应当受著作权法保护,这在逻辑上是有缺陷的,两者不是必然的因果关系。

人工智能的法律属性

将人工智能生成内容认定为作品,还面临一个难以逾越的理论难题:人工智能生成的内容不是人类智力创作成果,不满足作品必须是由自然人或法人所创作、具有创造性这两个条件。为此,有人提出可以扩大受著作权法保护的主体的范围,将人工智能作为“赛博人”,即拟制的人加以保护,并且这方面有法人制度可供借鉴。然而,这种思路不仅会导致知识产权法的重大变化,而且也将影响民法有关主体的规定。

根据有关法律规定,法人和自然人一样,具有独立的民事权利能力和民事行为能力,法人以其独立的财产作为民事责任的承担。如果将“赛博人”拟制为新的民事主体,其权利由谁享有?义务和责任由谁负担?如果为其创设新的民事主体规制,那么法人制度的存在还有什么意义?显然,在可以预见的时期内,“赛博人”是无法自行负担其权利和义务的。但是“赛博人”产生的后果,需要由对应的自然人或法人来享受权益承担义务和责任,如此,为什么不采用类似动物致人损害、产品责任这样的传统民法制度来解决有关问题?

具体而言,在权利方面,将人工智能视为“无体物”,其生产的内容视为由“无体物”产生的“孳息”,由人工智能的投资者享有对于“孳息”的利益。责任方面,因人工智能进行的文本和数据挖掘、算法自动生成文字等内容,由此造成的民事责任、知识产权责任由财产的所有者、使用者承担无过错责任。因此,引入“赛博人”作为新的法律主体的必要性要画个大大的问号。更核心的问题是人工智能生成内容也不具备创造性,因为就目前的“弱人工智能”而言,其可以进行运算但是不会进行思考,遵循数理逻辑但不具备自然人或法人的理性。除此之外,人工智能更没有自然人非理性的情感机制。因此,人工智能不具备著作权法上作者的“人格”特质,其生成的内容也不具备创造性,而创造性是人类特有的能力,是人区别于物的根本属性之一。

“工具论”的合理性

人工智能不具备独立的民事主体资格,人工智能自动生成的内容不满足作品的“智力成果”要件,但是,这并不能排除人工智能生成内容可能受到著作权法的保护,只是著作权主体仍为自然人或法人,而该类人工智能生成内容是作为人利用技术辅助生成的作品加以保护的。创作作品是人的主体性的实现,是人的自由意志的运用,人可以直接创作作品,也可以借助一定的工具完成、甚至通过委托他人实现创作目的。就部分“弱人工智能”生成内容而言,本质上是创作者借助人工智能这一工具进行创作,而生成物是人意志发动的结果,是人的自由意志的实现,因而是人的意志的产物。人工智能生成内容的过程是运用一定的算法进行信息加工选择的过程,因此算法体现程序设计者的主体意志和选择,而程序的使用者某种程度上承认、接受了该算法,创作方向和人工智能设计方向有着高度的契合,这种对算法的接受也是使用者自由意志的选择。所以人工智能生成内容归根结底是人的自由意志的运用和实现。人工智能使用者运用人工智能生成的表达可以作为使用者的作品加以保护。

通过以上分析可得出初步的结论:人工智能不宜被视为独立的作者或著作权人,但部分内容可以作为人工智能使用者的作品得到著作权保护,也即有人参与创作的人工智能生成物可以被认定为作品。

从功利主义出发,论证人工智能生产内容应该以著作权法保护是有逻辑缺陷的。除此之外,部分观点反驳“工具论”的理由是:既然从内容本身无法分辨一项表达究竟出于人工智能还是自然人或法人,那么在司法实践中还有必要去进行分辨吗?但笔者认为,这实际上是一个证据的问题,应该从举证角度去考虑。即便一项表达事实上出自于人工智能,但由自然人对其进行署名并登记,那么如果无相反证据,法律应推定该表达属于人类智力成果,构成作品。以证据来推定事实是法律制度对现实生活的简化,追求法律的形式正义就需要接受应然层面和实然层面的一定脱节。

因此,在无法举证证明作品不是由人创作而是由人工智能生成的情况下,只能认定该表达构成作品,受到著作权法的保护。在总体上不对人工智能自动生成内容提供著作权保护的情形下,这将导致部分人工智能生成内容实际上可以冒充人类的创作而得到著作权保护,但并不能因此说明所有人工智能生成内容都可以作为作品受到保护,只要它形式上看起来类似人类的创作,这就好比某些假冒商标的商品无法被识别出来,不能因此主张所有的假冒该商标的商品都应该被认定为真品。(华东政法大学龙文懋龙明明)

(本文仅代表作者个人观点)

(编辑:窦一珂)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇