人工智能,妙笔生画
扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。
“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。
扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。
众多用户尝鲜,大量应用加速“画技”进化
汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。2022年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。
随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。
大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与2022年初相比,已经有很大进步。
不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。
但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”
防范潜在风险,守住法律和伦理底线
人工智能进入绘画领域,计算机会取代人类画师吗?
在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。
不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。
“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。
不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。
不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。
【原标题】接受指令后输出图像,数秒钟可生成一幅画人工智能,妙笔生画(网上中国)
来源|人民日报海外版
编辑|陈柱
责编|姚凯红
往期回顾返回搜狐,查看更多
李宗辉:论人工智能绘画中版权侵权的法律规制
像Aaron那样的早期智能绘画程序,大多是按照符号主义人工智能的理念设计的。符号主义人工智能认为,只要抽象出真实世界中那些对求解问题非常重要的特征,机器就能给出这个抽象世界足够的背景信息,并智能地思考简化了的人工世界中的对象及其关系,从而实现模拟真实世界的目的。Aaron的开发者科恩自己也承认,尽管Aaron可以生成不重复的、原创的甚至具有独特风格的画作,但它还不是创造性的程序。科恩本人作为画家的知识和经验在Aaron的迭代过程中发挥了主导作用。Aaron的运行、知识结构的完善以及画作的生成都发生在科恩预设的规则框架之内,是在规则的导向下进行判断、计算、推理和表征的过程。
近年来的绘画人工智能基本建立在神经网络的基础之上,主要得益于机器学习尤其是深度学习技术的显著进步。深度学习与已有方法最大的差异是能够自动地进行数据特征的学习。学习大量的数据,从中自动地找出数据。在深度学习中采用多层神经网络按层次表达数据特征。以人脸图像为例,“人脸”由“眼睛”“鼻子”等概念构成,“眼睛”“鼻子”进一步由“点”“线”等更低级的概念构成。通过层次表达特征,可以更灵活地表达各种各样的数据。深度学习的模型架构变得更加复杂,计算量和学习时间也有很大的增加。
二、人工智能绘画中的
版权侵权风险及其判断
(一)人工智能绘画中版权侵权的风险
我们在此讨论的人工智能绘画中的版权侵权风险,不是指人工智能作为计算机软件作品的侵权风险,而是指其在绘画行为过程中的侵权风险。这种风险大体上来源于两部分:一是供人工智能进行深度学习的海量数据集中包含有他人的版权作品,而人工智能对相关作品的利用行为构成了版权侵权;二是人工智能在某次具体绘画的过程中使用了他人的版权作品,其使用方式构成了版权侵权。我们可以从常见的人工智能绘画方式中对其潜藏的版权侵权风险作出具体说明。
图片滤镜是应用较为成熟的人工智能绘画方式,即通过智能软件帮助用户实现照片或图片的各种艺术效果。2016年,莫斯科的一家科技公司推出了全新的滤镜人工智能Prisma,很快就风靡全球。以神经网络算法为基础,Prisma通过对原始照片和用户想要实现之艺术风格的代表性画作进行分层,然后在各层图片上将两者不断进行叠加,最终生成一种具有相应艺术风格的作品。显然,图片滤镜所使用的照片和画作都可能是有版权的摄影和美术作品,人工智能在进行特征提取和风格糅合的过程中免不了对作品进行复制和改编,这种复制和改编行为即有侵权之虞。
基于笔触的临摹是人工智能绘画的另一种常见方式。前述“下一个伦勃朗”项目的人工智能即属此类。德国科学家也曾尝试用深度学习算法,让人工智能系统学习梵高、莫奈等世界著名画家的画风,创作出全新的“人工智能世界名画”。微软的另一款人工智能机器人小冰则通过学习400年间艺术史上236位绘画大师的画作而独立进行绘画,并化身为生于不同时期和不同国家的7个画家,举办了“或然世界”画展,展出了100多幅作品。2019年7月,在上海交通大学举办的国内首届人工智能互动艺术作品展中,AI-ART团队即现场展示了人工智能算法如何完成一幅临摹作品,即通过强化学习的一种全新架构,将被临摹的照片“转化”为一系列真实的笔触序列,与真人作画的方式相同,“一笔一笔”将被临摹的对象展现出来。由上可知,如果人工智能临摹或模仿的是特定画家仍在版权保护期内的作品,而非那些已经故去很久的画家作品,就必然会发生是否侵害版权的争议。
基于笔触的神经网络算法绘画不仅可以临摹已有作品的风格,而且可以独立地完成简笔画的勾勒。谷歌的AutoDraw就是这样一款可以将人们的随手涂鸦变成完整有趣简笔画的工具。AutoDraw的算法是一个绘制普通物体简笔画的生成性循环神经网络,旨在以与人类相似的方式训练机器概括抽象概念并绘画。其在一个手绘简笔画的数据集上训练模型,其中每张简笔画表示握笔动作的一个序列:往哪个方向移动,什么时候提笔以及停笔。此类人工智能绘画用作训练的简笔画数据集和每次绘画时用户输入的粗糙或不完整的简笔画,都可能是他人有版权的作品,未经许可的使用同样可能构成侵权。
微软小冰和其他一些人工智能还可以根据用户输入的文字完成绘画。小冰以文字作画的具体步骤包括:抽取意象→激发创作灵感→选择内容主题→尝试画面构图→起草线稿造型→底层颜色涂抹→画面层次深入→细节反复打磨。从中可以看出,文字在此只是起到激发灵感和赋予意象的作用,作为一种与美术完全不同的表达形式,人工智能绘画对所使用的文字作品一般不构成侵权,除非是用户为了说明该幅画作由哪一段文字转化而来,将该他人文字作品复制在人工智能所完成的画作上并对外公开展示、传播或发行。
(二)人工智能绘画中版权侵权的判断
首先,我们必须明确,“思想与表达二分法”作为版权法的基本原则在判断人工智能绘画是否构成侵权时,也具有指导性意义。这是因为,无论是早期符号主义人工智能依靠专家知识所预设的绘画规则,还是神经网络算法对绘画共性特征的抽取,对作为绘画对象之客观事物的概念界定,对一般绘画笔触序列的归纳总结,乃至对绘画的时代背景和文化价值的情感计算等,都属于美术作品的“思想”范畴,并不归任何作者私人所有。进一步来说,版权法也是鼓励这种对绘画创作规律的量化分析行为的,因为这样可以使更多的个人学习并掌握精湛的绘画技法,创作出更多具有美学价值的画作,繁荣艺术市场,促进文化进步,而这在具有较强大数据处理能力的人工智能出现之前,是可望而不可及的事情。
其次,判断人工智能绘画是否构成对他人版权作品复制权的侵害,也有一些具体的标准和方法可以依循。如果人工智能在图片滤镜绘画过程中只是机械地照搬、拼接和组合了他人的美术、摄影或图形作品,那么显而易见地构成侵权行为。早在2010年的一起美术作品侵权纠纷中,武汉市中级人民法院就指出,“被告通过计算机图形软件将原告人模图案进行剪接、粘贴,然后对各个部分进行机械拼凑,缺乏独创性,实质上是一种复制行为。”对于并非机械复制而需要进行“实质性相似”判断的情形,应当明确以具有一定艺术鉴赏能力的“相关公众”作为判断主体。相关公众就人工智能的画作与某一部作品是否构成实质性相似的判断适宜采用部分比对法,而就其与多部作品是否构成实质性相似的判断则应当采纳整体观感法。我们还可以运用计算机技术将人工智能画作与所要比对的作品进行像素分解,观察两者之间的相同与差异之处,作为判断是否构成实质性相似的参考因素。
值得注意的是,如若作品比对的结果是构成实质性相似,人工智能的“临摹”行为即应被认为构成复制侵权行为。尽管我国《著作权法》在2001年修正时明确将“临摹”从复制方式的列举中加以删除,但这仅仅表明,立法者认为并非所有的临摹都构成复制,却并不排除部分临摹仍可能构成复制这一事实。况且,人工智能作为机器在临摹的过程中并不像自然人那样付出的是个性化、差异化乃至创造性的劳动,而是一种精确量化再现的过程。换言之,两款以上的人工智能,或者同一款人工智能两次以上临摹一件作品,都能够生成与原作一模一样的作品,而两个以上的自然人,或者一个人对同一作品两次以上的临摹,既不能形成与原作相同的作品,临摹而成的作品彼此之间也会存在肉眼可见的差异。
再次,人工智能将摄影作品、图形作品、电影作品以及现有的美术作品转换、糅合成新美术作品的过程是否侵犯改编权,要结合合理使用的判断标准加以认定。根据判断合理使用的“三步检验法”,第一步是局限于特定的情形。在法定的合理使用具体情形中,人工智能在绘画中对现有视觉艺术作品的借用只可能与“适当引用”相关,即为介绍、评论某一作品或说明某一问题而在作品中适当引用他人的作品。人工智能在此情境下对现有视觉艺术作品的使用显然不是为了介绍和评论它们,所以只剩下“说明某一问题”这一种可能性。因此,只有当人工智能的这种作品使用行为,是为了说明其神经网络算法对不同类型视觉艺术作品之特征分解、抽取、赋值和计算的共通性,以及糅合成新作品的可能性、技术架构和机器学习策略时,其才符合法律所规定的特定情形。“三步检验法”的第二步是“不与作品的正常使用相冲突”。此处的作品正常使用,既包括经验意义上也包括规范意义上的使用,前者是作品通常的、典型的使用方式,后者则包括考虑技术和市场发展动态的可预期使用。从这个角度来讲,人工智能绘画中对其他作品的挪用很难通过检测,因为将照片、图片等进行智能处理后发布在社交网络上已经成为一种比较常见的作品使用方式,并正变得越来越受欢迎。“三步检验法”的第三步是“没有不合理地损害著作权人的合法利益”,强调的是对权利人利益影响的微小性,在“适当引用”情形下又直接与引用的适当性密切相关。人工智能在绘画中对他人版权作品的引用是否适当要考虑“量”和“质”两方面的限制,前者是指所引用的部分应限于原作和所完成新作的一定比例,后者是指所引用的部分不能是他人作品中最为传神、最具精髓、最体现独创性的部分。当然,损害是否控制在合理的范围内还与该使用方式与版权人使用方式之间,是否有市场替代性等因素相关。
最后,人工智能模仿特定的画家作画并假冒其署名,或者虽然没有直接署名但误导公众相信其画作是该特定画家的作品的,根据我国《著作权法》的规定,属于侵害作者署名权,并可能同时损害公共利益的侵权行为。人工智能为检验其绘画成果是否能够以假乱真,达到了与人类并驾齐驱的水平而进行“图灵测试”,这原本无可厚非。但在获得测试的结果之后,人工智能的开发者、使用者或者画作的展览者、出售者等应当及时地向公众揭示相应的画作系由人工智能完成这一事实。从经济上讲,这是为了防止有人恶意利用人工智能攀附知名画家的声誉获取非法利益,扰乱文化艺术市场的正当竞争秩序;从精神上讲,这是为了防止知名画家向社会传递其艺术思想和审美理解的视觉媒介被不当扭曲,以及人类智力创造的成果与机器生成的表达被混淆在一起。
三、人工智能绘画中版权侵权的体系化法律规制
(一)开发者算法设定的法律规制
绘画人工智能的开发者一般是人工智能绘制并对外展示其画作的最大受益者。开发者首先可以就其智能软件取得版权保护,即便是依据开源框架或平台研发、版权保护受到很大限制的绘画人工智能,开发者仍然可以借此占领客户、应用和数据资源,逐步建立新的产业格局和技术标准。纯粹以研究为旨趣的绘画人工智能开发者也成功引发了人们对其新技术及其艺术创造力的关注,提升了自己的学术声誉和社会价值,获得了一种无法直接以金钱衡量的利益。因此,基于获益与风险承担相一致的原则,绘画人工智能的开发者应当对人工智能的版权侵权行为负主要责任。
从技术上讲,开发者也是对绘画人工智能最具有发言权和控制力的主体。首先,开发者不得故意通过算法指使人工智能从事版权侵权行为,无论该行为属于商业性的营利行为还是单纯炫技的骇客行为。其次,开发者应不断加强绘画人工智能的透明性、可解释性、可靠性和可控性,在面对版权侵权质疑时能够通过对算法运行机理的解释证明“不是算法惹的祸”。最后,对于因人工智能的自动决策、自主行动特点而发生的超出开发者预见范围的版权侵权行为,开发者除了应当立即制止人工智能的侵权行为外,还应当及时对人工智能的算法漏洞加以修补。在不能很好修补算法漏洞的情况下,则应当暂时甚至永久停止该人工智能的发布。
在算法设定上预防版权侵权行为对开发者来说也具有一定的可行性。在符号主义论者看来,法律规则就是一个符号系统,它将规则和事实用文字/符号加以表述,并以一定的方法对符号进行处理,将事实区分为相关与无关,并进一步将相关事实进行合法/非法的编码处理。绘画人工智能的开发者可以将版权法上的独创性、复制、改编、合理使用、侵权行为等概念和规则融入到其算法中去,作为人工智能绘画时为或不为的参考标准。
在实践中,要求一款人工智能既能够学习、模仿甚至超越人类绘画的水平,又可以完全避免在此过程中发生版权侵权行为,似乎确实有些勉为其难,但开发者应在现有技术条件下尽最大努力。例如,库兹韦尔就在其“电脑诗人”RKCP中设计了防止剽窃他人作品的规则。
(二)训练者监督学习的法律规制
几乎所有的绘画人工智能都是在经过海量作品的学习和训练后才达到了较高的创作水平。从某种意义上讲,正是训练使人工智能一步步从绘画的门外汉变成初学者,直到具有专业水准。人工智能独立作画的过程实质上就是其训练效果的集中展示。因此,绘画人工智能的训练者对预防其版权侵权行为具有较强的影响力,在法律上就应当负有采取一定措施的义务。
所谓的人工智能训练主要是指监督学习,即利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射。人类训练者在监督学习中的作用主要在于样本选择和数据标注。表面上看,训练者可以只为绘画人工智能选择全部处于公有领域的作品作为学习的数据集,正如已知的很多人工智能选择伦勃朗、梵高、莫奈、塞尚等历史上美术大师的作品进行学习一样,但这也只能避免训练中所完成的每一幅画作没有版权侵权风险,却无法保证人工智能在被推向市场或者免费公开后,当输入的数据中包含有版权作品时,它不会侵权。并且,这种对训练数据集的时代限制会阻碍人工智能对当代绘画的分析、评估和学习,乃至形成不恰当的艺术偏见,远远悖离了我们研究和探索人工智能绘画的初衷。因此,对训练用的数据集进行科学合理的标注,并保持对人工智能监督学习结果的动态关注,及时与开发者沟通,进行强化学习策略的修正和完善,才是训练者帮助绘画人工智能减少版权侵权几率的最佳做法。更为具体地来说,在绘画人工智能分层提取训练数据集的特征时,可以根据其抽象程度进行“思想”“表达”的标注,运用逻辑回归的监督学习技术,在绘画人工智能每次生成的作品只涉及训练数据集的“思想”时予以奖励,而在其不当使用训练数据集的“表达”时予以惩罚。
训练者还可以借助神经网络算法让绘画人工智能学习海量的美术作品版权侵权案例,使人工智能在绘画过程中尽量避免发生与人类相似的侵权行为。
(三)使用者绘画操作的法律规制
使用者是直接利用绘画人工智能生成自己所需作品的人,其审美诉求、输入数据和操作指令等在很大程度上影响着人工智能所生成画作的具体表现形式,因此,使用者也有防止绘画人工智能版权侵权的注意义务。
使用者应当善意地将绘画人工智能作为辅助创作的工具,不得像文字作品的洗稿软件那样将其用来“洗画”,对众多视觉艺术作品中的独创性特征进行明显可被相关公众感知的碎片化撷取和重组,以创新为名,行剽窃之实,扭曲人们的审美世界,妨碍真正的艺术进步。这一点即便在用人工智能将文字转换为绘画的情形下也同样适用,例如,使用者不得简单向人工智能发出这样的指令:A画作的某某部分,B画作的某某部分,C画作的某某部分……使用者在选择单幅画作、图片或照片作为人工智能滤镜、加工,或者独立绘画的素材时,应当确保这些素材没有版权瑕疵,即要么是自己拥有版权的作品,要么是已经获得了权利人的相关授权。即便是在获得改编授权的情况下,使用者也不得指令人工智能对所使用的作品素材进行明显与其艺术思想、伦理导向相悖的歪曲和篡改,例如对红色革命题材的画作进行低俗趣味化的修改。
当使用者指令人工智能模仿著作财产权仍在保护期内的特定画家的风格绘画时,应就所生成的画作与该画家的作品进行实质性相似与否的比对,必要时还应当寻求专业鉴定部门的意见,以最大限度地排除版权侵权的风险,尤其是使用者准备将人工智能画作用于大规模的工业化产品之上或者公开发行传播时,就更应当如此。使用者当然也不得在人工智能画作上冒用所模仿画家的署名,或者进行这样的虚假宣传。
如果人工智能完全依据抽象概念独立创作完成的画作恰巧与他人的版权作品构成实质性相似,则使用者应对该独立创作的事实负有一定的证明义务。此外,使用者还应当保持与开发者就人工智能系统自动升级的网络联系,及时弥补可能发生版权侵权行为的“算法漏洞”。
四、结语
人工智能绘画开辟了用科技表现艺术的新时代,通过算法概括和总结了人类绘画的规律,并在与人类绘画的竞相勃发、融合转换中展示了计算智能的艺术表现力和丰富可能性,因而是值得继续深入研究和拓展的领域。但这种研究和拓展应当是在价值上以对人类绘画具有增益性的方式实现,而不能反过来侵害人类已有的视觉艺术表达成果,即不能实施版权侵权行为。就现阶段而言,人工智能还只是高级一点的绘画工具,对其版权侵权行为的法律规制应当着眼于其背后的开发者、训练者、使用者等相关人类主体,要求他们在技术上和行动上承担相应的注意义务,以及采取合理的预防措施。
原文刊载于《版权理论与实务》2022年第3期,原标题为《论人工智能绘画中版权侵权的法律规制》,注释从略。
基金项目:国家法治与法学理论研究项目“人工智能的知识产权法挑战与应对”(17SFB3033)。
“星标”、“转发”、“在看”,给小编加鸡腿哦!
投稿请联系shipa@shipa.org
NFT艺术品权益问题以及对知识产权保护的影响网络游戏直播领域反垄断规制初探(上)吴桂德:商业数据作为知识产权客体的考察与保护投资视角下知识产权尽调的新维度将他人“商业标识”设置为隐性关键词推广的反法规制探析网络游戏地图的版权保护路径你的演出,获得授权了吗?
促进域名保护制度对完善知识产权保护体系的重要意义诉讼方法论|律师营销的体面方式浅析专利诉讼中权利要求的解释规则省运会踢假球犯法吗?诉讼方法论│律师营销的痛点
商标申请总是被驳回,只因没做好这几点……
算法备案:关于30项备案算法的讨论假货“偏爱”直播间案析网络账号归属常见争议及实务建议诉讼方法论|知识产权律师的吸引力资本前面飞,技术后面追,元宇宙是泡沫还是未来?张鹏:中日外观设计保护制度比较——以图形用户界面的外观设计保护为中心你的演出,获得授权了吗?
诉讼方法论│律师营销的痛点
商标申请总是被驳回,只因没做好这几点……返回搜狐,查看更多