人工智能艺术的“进化史”
到底是什么驱使人类开始创作艺术?这种原动力是否也会驱使人工智能去创作属于自己的艺术?在创作艺术的过程中人类获得了什么?如果人工智能也进行艺术创作,能否获得相似的回报?如果你对这些奇怪的问题感到好奇,不妨跟随本书作者一同去探寻答案。
艺术家拥有丰富的想象力和震撼心灵的能力,他们似乎拥有一种与生俱来的天赋,从一开始就能够创造一些不寻常的作品,这种创造力的天赋有没有可能量化后通过计算机算法来复现?而对于人工智能,人们惊叹于它的强大计算能力的同时,又对它幼稚的、条件反射般的反馈感到可笑。当然,要想搞清楚人类创造力和计算机人工智能算法之间的关系,首先要搞清楚两件事,一个是人类创造力是什么?另一个是计算机算法是什么?《天才与算法:人脑与AI的数学思维》一书即由此展开。
这是一本用通俗易懂的语言,由浅入深地将人工智能算法的历史和原理展示给读者的有趣读物。在介绍计算机科学算法的同时,试图反观和探索人类天马行空的创造力到底是什么、来自哪里。书中将人类的智能和计算机的算法、算力、数据进行对比研究,两者的相似与不同点一目了然。如果将人工智能艺术看作是人类创造的一个“新物种”,那么这本书就像是这个新物种的进化论。
随着人工智能技术的进化,计算机不但能够准确无误地推荐我们喜爱的商品或音乐、关注的新闻,还能利用摄像头进行准确的人脸识别、语音翻译,甚至在某些特定领域比专业的人类工作者更高效。而这样一个看似聪明机智的工具或者“伙伴”,是否具有和我们类似的智能?它也能够像人类的艺术家一样创造出打动人心的艺术作品吗?这本书从一个个历史案例中寻找蛛丝马迹,剖析人类试图赋予计算机智能和创造力的一次次大胆尝试。
书中分析介绍了2016年曾打败人类世界围棋冠军李世石的人工智能程序AlphaGo的进化历程,从学习人类棋局的“基础学习阶段”,到后来不再学习人类经验,而是从零开始自己试错对弈的“强化学习阶段”(AlphaZero),进化后的AlphaZero甚至只用了三天时间就实现并超越了人类将近3000年在围棋领域摸索和积累的经验,并以碾压性的100比0打败了那个曾经战胜李世石的版本(AlphaGo)。
可以说,这种从学习前人先验知识到忘记一切、自我摸索的蜕变是获得智能的关键。正如计算机人工智能之父图灵所说,“与其试图编写一个模仿成人大脑的程序,为何不尝试(拥有自我学习能力的)儿童大脑呢?”换句话说,如果机器想要获得属于自己的智能,也许要首先像AlphaZero一样学会自我学习和摸索才能够突破“前人”的局限,从只是知道表面结果到明白内在原理,举一反三。
而在艺术界恰好也有这样一位人类艺术家,他先从模仿古代大师的技法开始学习,到后来抛开一切,回到原点、返璞归真向原始人类学习,他就是艺术家毕加索,他说:“我在十几岁时画画就像个古典大师,但我花了一辈子去学习怎样像孩子那样画画。”也许毕加索正是意识到了模仿前人的局限性和儿童般学习能力的重要性。
换句话说,智能的本质也许就是一种从零开始试错、推演、学习并自我成长的机制,而不是鹦鹉学舌般模仿或记住别人推演出来的知识。当然,也许这种模仿和记住是最好的开始,类似于重走一遍前人的过程,但真正属于自己的智能恐怕还是要抹掉一切从源头重新建立。
书中还着重探讨了关于“什么是艺术”“人工智能能否创造艺术”的问题,作者列举了柏拉图、康德、托尔斯泰、维特根斯坦等人对人类艺术的定义。
作者认为:“艺术是人类自由意识的表达。计算机在拥有觉醒了的意识、灵智、思维之前,所创造的艺术总是来源于人类创作的意图。”
俄国文艺理论家车尔尼雪夫斯基曾说:“艺术来源于生活,但又高于生活。”他还说:“没有生活原型或者现象就没有艺术创作的源头和灵感。”
换言之,想要创作人类的艺术,首先要作为人类个体去体验生活,然后将这种感受抽象化,再用艺术的某种形式(例如绘画、音乐、雕塑、文学、舞蹈等)表达出来。而对于人工智能来说,首先它没有吃喝拉撒、没有爱恨情仇、没有喜怒哀乐,这样就没有了创作艺术的源头和灵感,就好比说没有“胃”这个器官的话,就很难理解“饿”是一种什么样的感觉。
但或许,计算机也拥有一种我们人类无法去理解和体会的“生活”。假如真的有,那么人工智能算法基于计算机“生活”而创作出来的艺术,能否算作计算机的艺术?
当然,这里我们要讨论一个新的问题,就是人工智能是否会在没有人驱使的前提下,自发地去创作艺术。
本书中讲述了一个非常有趣的问题,就是“人类是从什么时候开始自发地创造艺术的”。作者认为,“大约在10万年前,人类就有了对艺术品创作的热情。”大约4万年前在洞穴岩壁上进行绘画。要知道在那个年代,把宝贵的劳动力和时间花在不能直接解决温饱和生存问题的艺术创作上,似乎看起来不是那么理性。
到底是什么驱使人类开始创作艺术?这种原动力是否也会驱使人工智能去创作属于自己的艺术?在创作艺术的过程中人类获得了什么?如果人工智能也进行艺术创作,能否获得相似的回报?如果你对这些奇怪的问题感到好奇,不妨跟随本书作者一同去探寻答案。
书中还详细介绍了历史上运用计算机算法来进行艺术创作的案例,例如,1965年西门子公司在德国展出的计算机绘画作品、科恩的绘画数字助手“亚伦(AARON)”、西蒙的绘画程序“绘画傻瓜(ThePaintingFool)”、谷歌公司的“深梦(DeepDream)”等等,还有另外一些使用计算机算法进行音乐、文学等创作的案例。
随着人工智能技术的发展,越来越多的科学家运用人工智能来进行艺术创作,也有一些艺术家选择人工智能作为自己的艺术创作手段。人们开始思考和探索人工智能作为“艺术家”或“设计师”的可能性。
微软小冰作为数字艺术家开了画展、出版了个人诗集;具有浓厚中国风格的来自清华大学团队的“道子”人工智能系统不仅学会了齐白石画虾的风格,并和画家在电视节目中同台“献艺”,还作为人工智能设计师为丝绸产品设计图案,作为一个新的系列进入市场,引起了设计界的关注。
阿里巴巴公司的“鹿班系统”也在人类设计师忙不过来的时候担当起了设计广告条的任务,这些工作在以往似乎只有人类可以胜任,而今天人工智能也能够分担一些。
把一件复杂深奥的事物讲得简单通俗并不容易,这需要讲述者对这件事的来龙去脉非常了解,并且能够暂且将自己掌握的专业知识放在一边,站在外行的角度来重新一层一层地剥开包裹在事物本质外面的表象。而这本书的作者恰好做到了这一点,让读者对人工智能和人类创造力之间的关系有所了解并产生兴趣。
(作者单位:清华大学未来实验室)
编辑:李华山
未来可期|人工智能绘画:让每个人都成为艺术家
在过去的2022年,人工智能发展之快,有些超过了我们的想象。他们从处理信息过渡到了创造内容,这些内容和真人创造一样真实,难辨真伪。他们能完成撰写邮件、翻译、甚至写代码等任务(详见拙作《未来可期|ChatGPT到底厉害在哪?百科全书版聊天机器人已诞生》)。除了文字能力,他们的绘画能力也大幅提高,通过简单的效果预设,就可以生成一幅叹为观止的大师范绘画作品。
我想请澎湃科技“未来可期”专栏的各位读者,先看几幅我借助人工智能创作的画作。我分别使用了百度的AI艺术和创意辅助平台“文心一格”和西湖大学深度学习实验室研制的AI模型“盗梦师”。两者都是由用户输入一段简单的文字,即可快速获取智能生成的AI画作。操作非常简单,文本输入——>风格选择——>艺术家选择——>上传参考图——>尺寸选择——>分辨率选择——>数量选择,正所谓“AI一下,妙笔生画”。
第一幅画的主题词——城市:无锡;场景:太湖;时间:五百年后;画面:城市天际线。
人工智能模型“盗梦师”创作的绘画作品——五百年后无锡太湖的天际线。
人工智能平台“文心一格”绘制的五百年后无锡太湖的天际线。
第二幅画的主题词——城市:无锡;场景:城市运行管理中心;画面:从看见到预见;智慧城市。
人工智能模型“盗梦师”创作的绘画作品——无锡城市运行管理中心。
人工智能平台“文心一格”绘制无锡城市运行管理中心。
当我体验完AI绘画之后,我发现如今的人工智能生成内容(AIGC),已经进化到相当智能的程度,不再是此前简单的风格化滤镜。和Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比(有关概念可以参考本人拙文《未来可期|五个问答助你初步了解Web3.0》),AIGC正在成为新一种内容生产方式。
AIGC,即AIGenerateContent,是一种利用人工智能技术自动生成内容的技术。它可以根据一定的规则和模型,自动生成文本、图像、音频等多种类型的内容。伴随着人工智能技术特别是自然语言处理技术的不断发展,近几年AIGC在质量、多样性、准确性和用户体验等方面都得到了飞速发展。越来越多的软件代码、数据分析报告、产品设计图、甚至音乐歌曲都由人工智能产出,AIGC已经从理解内容,走向了自动生成内容,并在新闻报道、广告创意、影视剧本创作等领域探索规模应用。
高德纳(Gartner)公司将AIGC列为2022年五大影响力技术之一,并预测到2025年,生成性AI所创造的数据可占到所有已生产数据的10%,也就是说,你每看十个新闻、图片或短视频,其中有一个就来自AI。根据《GenerativeAI:ACreativeNewWorld》的分析,AIGC有潜力产生数万亿美元的经济价值。
2023年1月10日,百度CEO李彦宏在百度2022Create大会上,发出这样的断言,“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”
为此,你可以发现,这个春节,百度公司除了有类似“集五福”的“集好运”常规集卡活动外,还推出了一系列AIGC(人工智能自动生成内容)创新互动玩法,比如AI画头像”一起变兔兔”活动。你可以在百度APP自拍或者上传一张个人头像照片,人工智能将会捕捉你的五官比例和微表情,自动“等比”生成专属兔子版头像。很多用户都纷纷上传自己的兔子头像,让大家评论和本人的相似度有几分。
我们曾经以为,AI不会做有创意的工作,因为创意是人类最不可以取代的特质之一。在2018年,李开复讲述了人工智能有两件事情不能做:一件是有创意的事情,第二件是有温度的事情。有创意的事情,包括科学家,作家,艺术家,CEO等,在他看来,人工智能不擅长提出新概念。
不过,OpenAI创始人山姆·阿尔特曼(SamAltma)提出了相反的论断:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。”
我问了ChatGPT同样的一个问题:人工智能不会做有创意的工作,你对此有什么观点?请列举六条。
他的回答是:
1.AI可以在许多领域实现创意,例如音乐制作、艺术创作和广告制作等。
2.AI可以通过学习和模仿人类创意来产生新的创意。
3.AI可以通过生成对抗网络(GANs)等技术来创造新的图像、音频和文本等内容。
4.AI可以通过计算机视觉和自然语言处理等技术来理解和分析人类创意,从而产生新的灵感。
5.AI可以通过机器学习算法来优化和升级现有的产品和服务。
6.AI可以通过分析大量的数据来发现新的市场机会和商业模式。
ChatGPT关于“人工智能不会做有创意的工作”的见解。
所以,你千万不要想当然,人工智能只能从事低水平的重复性劳动。2021年10月9日,由德克·卡夫腾(DirkKaftan)担任指挥的波恩贝多芬管弦乐团,首次演奏贝多芬与人工智能共同谱写的第十交响曲。这部曲子本是贝多芬的遗作,1827年贝多芬逝世时,第十交响曲只有几张手稿留存,部分是简短未竟片段。但是,人工智能在学习了贝多芬过往所有的作曲数据后,续写了这部曲子。
读到这里,你也许会好奇,那么作为普通人的我,如何借助人工智画出一幅好画?
我先给大家说一则新闻吧。2022年8月,有一幅名叫《太空歌剧院》的画作,战胜了诸多竞争对手,拿到了美国科罗拉多州博览会美术竞赛一等奖。作者杰森·艾伦(JasonAllen)却说,自己是个游戏设计师,这幅画并不是他亲手画的,而是用AI绘画工具Midjourney生成的。杰森的办法是:他先是想到了一个有创意的提示词,然后花费了80个小时,900多次迭代,来慢慢调整这个提示文本,比如添加“堂皇”“奢华”这样的关键词,来优化整幅画的基调和氛围。
得知这个消息后,那些在真实世界创作的艺术家们忿忿不平。我们画画,是在一步步调色,机器人作画,却是在一步步调关键词。比赛主办方最后维持原判,理由是杰森本来参加的就是数字艺术类别比赛,比赛规则并没有限制使用人工智能工具,而他在提交作品时也表明使用了Midjourney工具。最重要的一点,创作灵感属于杰森,只是他选用的素材不是传统的画笔和颜料,而是庞大的图像数据库。
《太空歌剧院(ThéâtreD’opéraSpatial)》,作者:JasonM.AllenviaMidjourney
杰森后来在Midjourney讨论区中表示:“与其讨厌科技或应用它的人,我们不如承认它是一种强大的工具,并长久地运用它,这样我们才能向前迈进,而不是为此怨恨。”对啊,要借助人工智能画出一幅佳作,依然需要人类对艺术作品的感知力、鉴赏力、想象力和创造力。
首先,你要了解有哪些画派,以及他们的风格,比如印象派重展现光影的改变,野兽派笔法率直奔放,新艺术的风格偏有活力、波浪形、流动的线条现实主义等等。
其次,你要知道关键词。这好比使用百度搜索,有的人可以快速精准搜索到自己想要的内容,有的人却只搜到一堆没用信息。如果只是靠常人都知晓的朴素语言,往往会生成不伦不类的学生级别的习作。使用好的提示语,才能让人工智能生成更符合要求、更赏心悦目的作品。
第三,你要熟悉人工智能画画的基本原理。例如,高手就会每个关键词加引号、加冒号、加减数字来让AI更准确地理解问题。更高阶的技术人员会使用生成对抗网络(GAN),来训练一个生成器生成新的图像,通过与一个鉴别器的博弈来提高生成图像的质量。
所以,现在多了一项新生意——提示语工程(promptengineering),这也成了新的创业热点。美国旧金山初创公司PromptBase就推出了售价1.99美元一条提示语的服务,主要用于DALL-E2,ChatGPTGPT-3等人工智能模型。用户在该平台买卖提示词(Prompt),PromptBase则从卖家处抽成20%。平台上已上架不少提示词,内容范围包括新闻标题、运动队标志、卡通T恤设计、现代黑白版公司标识等等。
PromptBase平台上开展的提示词买卖业务。
如果你觉得这些都太麻烦,万能的淘宝可以更加直接而粗暴地解决问题,你只需要像我一样,在淘宝输入“MidjourneyAI绘画代做”,找到合适的买家,他们会直接把图做好了发给你,30元不到。
淘宝卖家的AI绘画代做业务。
曾经有一个高赞回答,显示出了人类对人工智能绘画的担忧:“我们正在目睹艺术的消亡。”可是,当我们每个人都可以善用技术,都成为艺术家的时候,为什么不可以说:我们正在目睹新一轮艺术的繁荣。如果它真的是一幅人见人爱,广为流传的作品,即使它是AIGC作品,又有何妨?
后记:本篇文章的部分图片和文字,由我和AI共同创作完成。
(作者胡逸,一个喜欢畅想未来的大数据工作者。“未来可期”是胡逸在澎湃科技开设的独家专栏。)