博舍

人工智能,如何妙笔“生”画 人工智能与绘画艺术

人工智能,如何妙笔“生”画

核心阅读

输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。

不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。

一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?

从文本到图像,人工智能绘画本质是计算

人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。

设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。

今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。

具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。

扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。

“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。

扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。

众多用户尝鲜,大量应用加速“画技”进化

汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。

随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。

大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。

不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。

但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”

防范潜在风险,守住法律和伦理底线

人工智能进入绘画领域,计算机会取代人类画师吗?

在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。

不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。

“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。

不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。

不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。

人工智能艺术:一场前所未有的新艺术创造

    【热点观察·当文艺创作遇上人工智能③】

    人工智能艺术在今天不仅是一种从主题、形式到技术都令人惊叹的前卫艺术类型,而且在日益扩大艺术的外延。面对人工智能对传统艺术的挑战,公众和学界都应保持理性和宽容。

    2018年注定是当代艺术史上标志性的一年。当年10月25日,由三个对艺术一无所知的程序员开发的“艺术作品”《爱德蒙·德·贝拉米肖像》(Edmond de Belamy)在纽约佳士得拍卖行,以5500美元起拍,最终以35万美元落槌,成了世界上第一件成功拍出的人工智能艺术品。这一事件引发了全球对于艺术本质问题的争论——人工智能的这一行为究竟算不算艺术创造?

技术让机器有了“艺术自觉”

    人工智能艺术的核心是计算机的“创造力”培养,其假定计算机作为艺术创作的主体——艺术家来加以构建。其基础是机器学习(Machine Learning, ML)。机器学习是使计算机具有智能的根本途径。早期的机器学习方法是神经网络(Neural Networks,NNs),通过模仿动物神经网络行为特征来进行分布式并行信息处理;而近期的深度学习(Deep Learning,DL)是多阶层结构神经网络结合大数据的逐层信息提取和筛选,使机器具备强大的表征学习能力,也使机器学习从技术范畴上升到“思想”范畴。此时,通过调用包含大量艺术专业知识和经验的专家系统,可以实现对机器艺术思维模式的培育,形成具有“艺术自觉”与“创造力”的人工智能“艺术家”。比如,美国罗格斯大学艺术与人工智能实验室(AAIL)研发的“生成对抗网络”(Generative Adversarial Network,GAN),即利用两个相互博弈的神经网络不断生产出截然不同的全新图像。

    人工智能的一个重要前提是大数据。借助云计算技术,由机器操控数据来进行结果判断和帮助决策,这叫模式识别。模式识别的本质是通过数据描述,使机器对事物或现象进行描述、辨认、分类和解释。如果我们以计算机“输入—运算—输出—结果”的生产方式来类比艺术的创作方法,则传统艺术的创作逻辑特征可表述为:视觉输入—人脑(人体)运算—工具输出—必然性结果。而人工智能艺术借助数据的输入可以产生更多具有刺激性和感染力的创造性结果,其逻辑特征可表述为:数据输入—程序(人工)运算—电子设备输出—随机性结果。因此,人工智能艺术以对数据库的调用与计算来塑造自身和世界。数据库像一个包含无限虚拟有机体的艺术基因库,机器操控它们来创造实物或“生命形态”。可以说,支撑人工智能艺术的是一种数据操控的美学。

“人人都是艺术家”成为可能

    人工智能艺术在今天不仅是一种从主题、形式到技术都令人惊叹的前卫艺术类型,而且在日益扩大艺术的外延。从艺术内部的形式与审美完善,到艺术外部的社会化、政治化触发,人工智能艺术导致艺术功能、艺术价值、艺术家身份认证、艺术评价体系等问题都要重新界定。

    毋庸置疑,人工智能技术极大地提升了艺术的想象力与创造力,丰富了艺术的形式与创作工具。由Google开发的AutoDraw即是利用AI算法对艺术家的草图的自动加工与制作,作曲家、诗人、画家等可依靠它来完成基本输出,然后进行扩展与完善。这极大地提高了艺术创作的效率,也意味着开拓出人机合作进行艺术创作的新路径。

    然而,人工智能艺术最令人遐想的还是未来的“赛博格”艺术家(Cyborg)。随着计算机技术的高速发展,艺术最终将走向人机交融的合成时代;未来,技术会更加自然地融入人们的日常生活且难以界定,异源嵌合体、生化电子人、人机合体生物等将把人类变成“超级艺术家”。

    艺术一直以其对审美能力和创造技巧的绝对控制而专门化与职业化,又因其在精神与文化领域的自律而神秘、矜持。后现代主义“人人都是艺术家”的主张或将打破这一垄断,艺术对生活的拥抱经由技术加持在今天已演变为“世界就是艺术家”。这表现为两个方面,一是艺术对世界的唤醒,二是艺术的生活化与娱乐化。具体言之,当代人工智能技术、生物技术和纳米技术这三大技术的进步,使人类得以实现与万物的相连和信息交换。人工智能艺术帮助我们扩展自己的生理、心理极限,这既是一种对世界的全新感知,也是世界对人类的诗意回应。传统意义上的艺术家由身份、经验和技巧所构筑的边界在人工智能时代逐步消融,人工智能艺术将帮助我们有趣地体验世界,使我们更易于享受到艺术化的生活。比如,微软开发的AI bot只需用户输入语言描述的关键词即可根据词意自动生成与之相匹配的图画;Prisma则是运用人工智能技术赋予普通照片不同艺术风格的网红APP……它们的共同特征是寻求更为大众化、平等化的艺术,使艺术于普通大众更具可消费性甚至免费共享。

对新事物应保持理性和宽容

    近代以来,艺术的本质一直被视为是基于情感与精神的自由创造,而复制的艺术、形式主义的艺术等都是精神创造缺位后的贬称。在很多传统艺术家看来,人工智能艺术基于专家系统支持而进行的数据归纳、综合被认为是缺乏演绎与创造,“机器作画总是缺少一些深层次的东西”。艺术史家杰姆斯·艾克因斯(James Elkins)直言:“(算法)不是根据社会环境、含义和表达目的来创作,而是根据艺术风格创作。”但《爱德蒙·德·贝拉米肖像》的成功很显然对这一创造缺位开了一个口子,更何况在科学家预想的人工智能第三个阶段,机器将拥有“自由意志、情感认知和自由活动能力”。这让人担忧,在人工智能的冲击下,“创造力”这一人类智慧的最后壁垒终将被突破。

    人工智能艺术还隐含了一场权力争夺战。诞生之初,人工智能是为了对人类智能进行延伸和扩展。通过对人类意识及其思维信息过程的模拟,让计算机拥有学习、推理、思考和规划的能力,从而使机器能替代人完成一些此前由人完成的复杂工作。然而,人工智能的发展已衍生出“过度依赖数据”的危机。对数据和算法的依赖开始形成一种权益的悄然转移。算法和数据开始接管大众媒介的权力,算法输出结果所依赖的数据,开始代替人类进行决策。建立在数据和算法基础上的人工智能艺术,因而也神奇地获得了某种权力。如果缺乏艺术自律,人工智能艺术将可能异化为一种数据崇拜和数据迷信。电脑公司、计算机及其背后的隐形势力,将借助人工智能艺术代理人们的思维、行为,进而控制资源、权益的分配。

    人类艺术行为的主体和对象都是人,艺术因其反思的品质而对人类社会来说弥足珍贵。可以说,艺术的社会属性决定了艺术是“属于人的艺术”,艺术家总是在赋予我们所看事物以有“意义”的解释,而这意义是对于人来说的意义。2018年,人工智能艺术工作室OUCHHH在法国巴黎艺术中心推出了一场名为“诗意AI”(Poetic AI)的展览。展览对2000多万行科学家所写的涉及改变人类历史的关于光、物理、时空的文献进行机器学习,随后经由人工智能算法转码后的文字和图像被投影在3300平方米的空间中,人们可在这一无限变幻的光线运动中忘我体验。这是一种刺激但危险的艺术,对意义和反思的放弃有可能让艺术失去存在的根基。超级智能系统可以每秒提供无数个想法和经验,但它们不一定具有与人类一致的艺术诉求与偏好。未来,当人工智能形成“人格”之后,一切我们习以为常的传统、认识、理念、常识或将不复存在,失控的将不仅是人类文明,也包括对人类艺术的取缔。

    上述关于人工智能艺术的讨论或志得意满,或未雨绸缪。但无论如何,人工智能艺术在现阶段仍在我们可控的范围内。面对人工智能艺术对传统艺术的不断挑战,公众和学界都应保持理性与宽容。在这样一个充斥着“机器即将全面替代并统治人类”传言的时代,我们仍然寄希望于人类艺术在未来可以继续行使改造世界、创造文明的职能。

    (作者:蔡新元,系华中科技大学设计学系教授、博导、艺术与科学研究中心主任)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇