文学创作人工智能化的前瞻性分析
关键词:人工智能人工智能作为一门学科交叉的新兴学科,自诞生以来就以其技术革命的颠覆意义和实际应用范围的强势扩张而备受关注,并且取得了迅猛的发展。它通过模拟、延伸和扩展人的意识及思维,来使机器能够更加高效准确地胜任多场景程式化的工作,并逐渐在人类社会生活的各个领域尝试更多层面的拓展。人工智能似乎一直在试探由人工打造的智能究竟能够在多大的程度上取代传统的“人工”,而对于人工智能的需求、期待和恐慌也由此交织而生。
肇始于自然科学和社会科学交叉的人工智能,似乎是因为学科起源而对人文科学始终抱有一种敬畏的姿态和挑战的欲望。尤其当以清华大学自然语言处理与社会人文计算实验室打造的人工智能诗歌写作系统“九歌”为代表的诸多人工智能写诗系统的问世,文学创作人工智能化的未来和前景就更加令人好奇。
以“九歌”2.0版本的系统为例,此人工智能诗歌写作系统将人工智能诗词写作分为“绝句”“风格绝句”“藏头诗”“律诗”“集句诗”“词”六大类,每一类又下分“五言”、“七言”、词牌名等小分支。如在生成诗歌检索框内输入中国传统诗歌意象“明月”,在不同类别下可得下述诗词:
五言绝句:
明月照双鬓,孤灯夜雨床。
客怀何以遣,世事自堪伤。
“忆旧感喟”风格五言绝句:
明月满江楼,乾坤一钓舟。
滔滔沧海上,莽莽万山秋。
五言律诗:
白璧无纤翳,青灯见一轮。
高山流皎魄,寒水带澄春。
玉镜当楼暗,珠帘隔帐频。
不愁清夜永,何地有婵尘。
如梦令·明月
明月照人清泪,冷落一床秋思。偏到小楼西,夜夜绣帘垂地。无计,无计,愁锁眉峰十二。
梧桐影·明月
明月斜,河边渡。舟子笑声何处来,郎船恰似潇湘浦。
忆江南·明月
人去也,最好是江边。明月多情圆又缺,断云无意复遮天。风里一条弦。
综观上述六首诗词能够发现,“九歌”人工智能诗歌写作系统能够偶得“明月满江楼,乾坤一钓舟。滔滔沧海上,莽莽万山秋”这样的佳篇和“风里一条弦”这样的佳句。正如韩少功曾拿秦观的《金山晚眺》和IBM公司的“偶得”软件生成作品做对比时,“三十多位文学研究生,富有阅读经验和鉴赏能力的专才们,也多见犹疑不决抓耳挠腮”[1]。“九歌”人工智能诗歌写作系统生成的诗歌作品也往往能够“以假乱真”,让人难以辨别是不是“人”作;尤其是一些风格化的作品,它模仿具有标志性诗人风格的作品时信手拈来。但是“九歌”人工智能诗歌写作系统生成的作品也不乏一些略显牵强之句,偶尔会出现句与句之间为了满足意象与格律的要求而产生逻辑不连贯的现象。
“九歌”人工智能诗歌写作系统的官方介绍提到“该系统采用最新的深度学习技术,结合多个为诗歌生成专门设计的模型,基于超过80万首人类诗人创作的诗歌进行训练学习。区别于其他诗歌生成系统,九歌具有多模态输入、多体裁多风格、人机交互创作模式等特点”。基于系统的开发理念,在使用时也确实出现了以下几个明显的感受:
生成速度快。每首诗词的生成时间在3秒钟左右,即时便可获取与主题词相关的作品;即使是同一关键词的重复生成,也基本在这个时间区间之内。
格律严格规范。严格遵循诗词的字数、押韵、平仄、对仗等方面的要求,在这一点上“九歌”人工智能诗歌写作系统确实拥有了比人的创作更丰富的词汇库和更快捷的选取速度。
总体风格一致。不同类型的诗歌风格无较大出入;但有相当一部分诗词呈现出较强的个人风格,这或许是因为“九歌”人工智能诗歌写作系统作为人工智能系统,本身就擅长对同一诗人不同作品的相同风格归纳与分析。
诗词的艺术审美价值总体较高。具有一定的品读空间,但也具有较大的局限性;这或许是因为“九歌”人工智能诗歌写作系统的词汇库本身就来自古代众多诗人的作品,尤其在词的选用上可谓细致琢磨。诗词词汇、意象重复率较高;同一意象词汇识别和替换较为成熟,具有明显的排列组合意味。
比如在五言绝句板块重复生成以“明月”为主题关键词的作品,得到以下几首:
明月照双鬓,浮云暮雨祠。
湖山千古事,一一付新诗。
明月青天上,凉风细柳边。
客怀何处写,多病未归眠。
明月照双鬓,浮云暮雨祠。
此生何日了,犹得话襟期。
明月照孤城,徘徊动旅情。
乡心随去住,何处候春晴。
明月青天上,凉风古渡头。
乡心何处切,回首愧沙鸥。
在五言律诗板块得到以下几首:
皎洁秋天夜,流光照我庐。
寒侵衾簟冷,风入漏壶虚。
玉笛惊初断,金波洗欲馀。
幽怀正寂寞,更待一年书。
清光无一点,寒色照人眠。
不见婵娟女,能窥窈窕天。
可怜团玉指,相似捣金弦。
自是瑶台上,偏宜十二年。
白露生天表,黄云蔽广川。
秋来无限好,皎似此时妍。
万里连环水,微茫隔塞烟。
不须更买取,且复斗婵娟。
皎洁照长空,寒光满太宫。
无人知独露,有客问西风。
夜静天河碧,秋高树影红。
故园千万里,何处一悲翁。
皎洁清江水,澄光照客窗。
高秋生白露,远夜动黄厖。
桂魄迷寒渚,菱波下夕矼。
此时怀旧好,不觉雁声双。
由以上十首作品不难发现,“九歌”人工智能诗歌写作系统的排列组合特征显著,往往是不同词汇间的组合,甚至连句法结构的组合模式在不同作品之间也具有明显的相似特征。同时,“九歌”人工智能诗歌写作系统创作的诗词具有较高的程式化特征,这也正是因为绝句、律诗和词的规律性和规则性恰恰与人工智能所擅长的重复、组合、程序性等特点相吻合。对于人工智能而言,按照一定的编程程序选取固定词汇库里的元素进行有规律的排列组合,并不是一件难事;但是困难的却是如何在这种组合中体现出人文科学的思想性,这在目前看来却是有很大的挑战的。虽然在风格绝句中已经能够显现出较为一致的格式化,但是思想层面的彰显却要寄希望于不断排列组合的小概率偶然事件。正是因为人工智能需要海量的样本量才能从机器学习中习得规律再加以运用,所以它所创作出来的作品也都延承着旧文本库所标示的词汇、理念甚至是价值观。这对于需要时刻敏锐地感知当代生活的文学而言,无疑是产生了较大的滞后性和时差性。
对于诗词的创作尚且如此,映照到小说、剧本等不具有诗词如此显著规律特征的文学作品创作上更是存有巨大的难度。
当人工智能越来越广泛而深入地渗透进现代社会生活,这种由技术革新诱发的文化现象也在最具挑战性的人文科学领域暴露着倔强的野心。虽然在基于语义的自然分词等环节仍然存在着技术难关,诚然在诸多有规律可循的程式化工作中,人工智能确实意料之外地超越了“人”,但是对于文学创作这种个人意识性、思想性和伦理性极强的人文行为,人工智能能否带来更大的惊喜仍然处于未知。在这个背景下,文学创作人工智能化的必要性、需求性和思想性更值得商榷。
文学创作是否有必要人工智能化,其实往往成了一个容易被忽视的问题。在人工智能涉足文学创作的一瞬间,甚至在讨论人工智能能否代替人的创作之前,首先需要思考的是文学创作人工智能化的必要性究竟有多大。人工智能在转化为实际应用的过程中最突出的特点是快速、海量、准确,而这三个特点对于需要依靠沉淀出精品并且无固定标准的文学创作而言又是相悖的。文学创作引入人工智能,在目前看来并不能使文学创作得更“好”,反而有可能会对文学作品的思想境界、审美价值、伦理取向等方面产生冲击。文学创作的门槛并不是高不可攀,但却需要像钥匙对锁芯一样适配方能得其要领。但人工智能这把看似万能的钥匙在开启文学创作这扇门的时候,却总有一个齿槽别扭地吻合不上,转得动却打不开。如此而言,其实还是作为人学的文学并没有要实现人工智能化的必要性。尤其对于极具魅力和特性的汉语书写而言,其作为语言本身的复杂性和多变性就对使用过程提出了严峻的挑战,而中国文学的独特审美情趣和精神境界又对在这方面具有先天缺陷的人工智能坚决地表达了拒绝。所以当人工智能不能使文学创作变得更“好”的时候,它的必要性也就无足轻重。
但这却并不意味着文学创作不需要人工智能化。文学创作对于人工智能的需求性在当下主要体现在人工智能技术对于文学创作的辅助、参考作用上。正如“九歌”人工智能诗歌写作系统对于80万首人类诗人创作的诗歌进行了分类、整理和归纳,在某种程度上,它对于诗词创作是具有参考价值和比照意义的。目前来看它固然不能完全取代人的创作,但是却能为人的创作提供更为及时和丰富的启发与提示。甚至随着技术的不断发展,人工智能能够在更大的限度上弥补人的文学创作局限,而使文学实现在时代的多元变革中完成自身的“修整”与进步。所以对于文学创作而言,人工智能的更大用途是辅助,而不是替代。“未来人工智能辅助写作软件的发展方向主要有三个:一是不断提升参考样本推荐的智能化,为创作者提供实时样例作为写作参考或者灵感激发的触媒;二是不断解决超级长篇小说写作的‘记忆痛点’,开发具有智能分析和追踪创作者创作作品,对人设和情节做数据库处理,能形成超级及时在线人设和情节历史资料智能调取和提示功能;三是能通过逻辑合理性和历史合理性等运算,为作者提供大纲编写建议(故事策划)和人物性格设计建议。”[2]这或将是未来人工智能对文学创作做出的最可能也是最大的贡献。而作为一种不可忽视的文学现象,人工智能所进行的文学创作也许难以成为文学,但却能在对辅助和参照的需求意义上有进入文学史的可能。文学史不再单纯是“人”的文学史,也将出现机器的、人工智能的文学史。
也许随着技术的不断进步,人工智能能够在克服技术局限的背景下更深入地参与文学创作,但是对于文学创作过程中思想性的把握确实难以预判。与人工智能所擅长的程序化工作不同,文学的特点和魅力恰恰不在于重复和程式,而在于人类思想不断演进过程中与世界发生纷繁复杂的细微关系。“人工智能一旦作为社会系统被引入文学领域,文学作为人学在生态或进化意义上的价值便相对鲜明地获得显现。文学创作不只是个别诗人、小说家、散文家或剧作家的匠心独运,而且是人类精神生产的一个分支、创意产业的一个链条、知识产权的一种赋值。它并非只是作家个人闭门造车、搜索枯肠,而是通过交往实现的。”[3]这就如同亨利·詹姆斯在《小说的艺术》中把小说分为“有生活的小说”和“没有生活的小说”的分类法。“而机器人小冰绝无人类生命体验的温度波动,天然缺失需要倾诉的情感向度,《阳光失了玻璃窗》只是迭代计算的智能产物,匮乏直觉经验的诗歌意象,观念的意象替代隐喻的意象即是人工诗歌的抒情零度。”[4]谢雪梅在《文学的新危机——机器人文学的挑战与后人类时代文学新纪元》一文的第二部分“抒情性:情感的计算与抒情的零度”中也提到了人工智能作为机器在运算方面的擅长和在抒情方面的缺失。人工智能的前提是“人工”,它本身并不能主动并且敏感地感知社会生活中的迅速变化,而需要人工的前提设置。正如文学不是公式能够计算出来的,好的文学作品也没有一成不变的唯一准则,或者说文学之所以成为文学是因为人类个体的巨大差异性——尤其是思想和意识层面的多样——造就的感知、反映和改变社会的巨大能量,而非机器技术的,这就从学科的源头处产生了相悖的分歧。人工智能能够模仿人的机械性行为,但能在多大程度上模拟人的思想和意识行为不仅是人工智能与文学创作未来的看点,也是人工智能技术本身向纵深发展的关键一步。在这个意义上,文学创作人工智能化不仅回到了罗兰·巴特“作者之死”的问题上,甚至丰富了作者之“死”的新含义,延展出了人工智能是否给予了作者“重生”的新议题。
综上,人工智能在未来对文学创作的影响是值得期待的。在这个相遇过程中,人工智能如何在自我革新的进程中使文学成为更好的文学,将成为文学创作人工智能化必要性、需求性和思想性的最直接导向。
注释:
[1]韩少功:《当机器人成立作家协会》,《读书》2017年第6期。
[2]葛红兵:《人工智能写作:可能性及对人类文学生活的挑战》,《语文教学通讯》2020年第1期。
[3]黄鸣奋:《人工智能与文学创作的对接、渗透与比较》,《社会科学战线》2018年第11期。
[4]谢雪梅:《文学的新危机——机器人文学的挑战与后人类时代文学新纪元》,《学术论坛》2018年第2期。
人工智能真的能“创作”文学作品
近段时间,人工智能“续写”名著的现象受到舆论聚焦。在人工智能的“作品”中,“林黛玉大战孙悟空”之类“脑洞大开”的情节纷纷亮相,大大超出了一般人的预料。面对《聊斋志异》里的经典故事,人工智能竟然创作出了“蒲松龄笔下的狼袭击了多个城市却无人能敌”的现代式情节。一时间,围绕着人工智能的“创作能力”,产生了不少讨论。许多人不禁想问:人工智能在创作领域能否取代人类?有朝一日,我们看到的文字作品会不会被人工智能“包揽”。
其实,这已经不是人工智能第一次在世人面前展现“创作能力”。前几年一度流行的“AI写诗”,便曾赚足舆论的目光。当时,“AI小冰”的诗歌大获好评,其“创作水平”远超文化素养一般的普通人。但事实上,人工智能的“创作”基于强大的算法与数据储备,背后是严密的逻辑与计算,与人类的艺术创作有本质不同。当下的人工智能再“智能”,也不具有情感与思想,而文学创作区别于其他事物的一个重要标志,就是它是人类情感与思想的表达,必然带有强烈的主观色彩。
美国文学理论家艾布拉姆斯在《镜与灯》中指出:文学是凝聚着个体体验的、沟通着人际情感交流的语言艺术。钱谷融先生也提出过“文学是人学”。说到底,文学创作是一种精神活动,真正有价值的文学作品都具有极强的个人思想与情感表达力,人工智能仅凭数据计算,并不足以使其获得这一能力。
中国古人讲:“文章憎命达。”作者特殊的人生经历,造就了许多独特的文学作品。如果没有个体与国家的苦难,杜甫很难写出“感时花溅泪,恨别鸟惊心”这样的千古名句。同理,《红楼梦》这样伟大的作品也饱含了作者的血泪。情感的抒发、改造与升华,造就了动人心魄的佳作。这些与人紧密相关的东西,很难在人工智能身上得到体现。
从这一点来说,当下的人工智能,就算写出来的作品再“像样”,也无法取代人类进行真正的文学创作。其最高的上限,也只不过是精巧的“模拟创作”――这些成果看起来像文学作品,但本质上是并不是真正的创作。
当然,如果我们放宽对“创作”的定义,还是应当承认:人工智能的写作,在很多领域有不小的价值,甚至可以取代一部分人类的工作。此前,有人提出可以在媒体领域引入人工智能,辅助新闻写作。而中国地震台网的人工智能写作机器人,已经可以在短短几秒钟的时间里,发布最新的地震消息。仅就速度而言,动作再快的媒体人也不可能比人工智能更快。不过,即便是在新闻写作上,人工智能也无法彻底取代人类。对新闻价值的判断,对新闻事件的点评与解读,都是超出人工智能能力之外的事。
人工智能对人类工作的取代情况,需要针对具体情况加以分析。利用人工智能服务我们的生活,这个思路没有问题。但是,我们也不必过于夸大人工智能的创作能力。即便有一天,科学进步到了人工智能可以代替人类开展几乎所有繁重劳动的地步,文学创作仍会是捍卫人类精神力量的宝贵园地。
当文艺创作遇上人工智能 机器人“薇薇”会创作诗歌
原标题:当文艺创作遇上人工智能人工智能(ArtificialIntelligence,缩写为AI)不仅出现在《终结者》之类的科幻电影之中,也开始走进我们的现实生活。比如,综艺节目《最强大脑》中,机器人“小度”在图像识别等方面完胜人类选手;谷歌旗下公司开发的人工智能程序AlphaGo战胜了围棋世界冠军。就连人类引以为傲的文艺创作,也开始遭遇人工智能的挑战。日前,就在《中国诗词大会》热播的时候,清华大学语音与语言实验中心(CSLT)作诗机器人“薇薇”通过了“图灵测试”(“图灵测试”是著名科学家图灵在1950年提出的一个观点,即将人与机器隔开后,如果有30%以上的机器行为被人误会为是“人”而不是“机器”所为,则机器应被视为拥有智能。)机器人“薇薇”创作的诗歌令社科院的唐诗专家无法分辨,有31%的作品被认为是人写的。此外,“机器人写小说”“电脑作曲”的报道也开始见诸报端。
文艺创作,是通过人脑进行的一种与情感、知觉、记忆与思维相关的复杂的精神活动,这本是人类的骄傲。人工智能何以能够攻进这一人类独有的领地?面临人工智能,人类传统的文艺创作又会面临怎样的挑战?
机器人“薇薇”开启数据库诗歌写作模式
运行程序来写作和程序本身一样古老。世界上第一台可运行程序的计算机运行的第一个程序,就是由科学家克里斯托弗·斯特雷奇(ChristopherStrachey)编写的情诗程序。该程序会抓取一些甜蜜的词汇,连缀成浪漫的爱情诗。比如“亲爱的,你是我深深的爱恋”之类。
机器人“薇薇”对于诗歌的理解,和它1948年的老祖宗相似。先来看看这首《春雪》:飞花轻洒雪欺红/雨后春风细柳工/一夜东君无限恨/不知何处觅青松。这首诗一看就是机器人笨拙的模仿,只有完全不懂诗的人会认为这是“诗人”写的。不说格律上的要求,就以词句推断,第一句说下雪,第二句又说下雨,到底是雪还是雨?三四句除了用了“东君”、“青松”之类常见的字眼外,内容不知所云,完全在混乱堆砌。
必须说,有的诗判断的难度要大一点,比如这一首《落花》:红湿胭艳逐零蓬/一片春风细雨濛/燕子不知无处去/东流犹有杜鹃声。这一首的甄别需要推敲,但只要稍加思考,“细雨濛”之类别扭的用法还是可以被识别出的。同时从诗歌的内在节奏看,这首诗不能说一定是机器人写的,但节奏比较糟糕,头两句带有二人转的韵律。
由这一类诗歌来分析,文学创作上,人工智能在模仿什么?人工智能的写作本质上是一种“数据库写作”,其对于文学的模仿高度依赖数据库,越是海量数据,越有助于人工智能的学习。比如,AlphaGo学习了三千万步的人类棋谱。“薇薇”这类写诗的人工智能程序,不知道学习过多少首古诗,估计是《全唐诗》五万首的几何倍数之上,故而可以在表面上,进行一些有模有样的模仿。
不仅是诗歌写作,人工智能在其他领域的写作,也都是“数据库”写作。几年前美联社、雅虎网、福布斯网就运用人工智能依托新闻模板生成体育类、财经类新闻稿。2008年,据说是机器人写的长篇小说《真爱》在俄罗斯出版,这本320页的小说电脑只写了三天——在有几千本文学名著作为数据库的基础之上。
对于科技入侵文学的忧虑一再浮现
不像围棋是有胜负关系的,在某种程度上可以被量化,诗歌所展现的语言的优美与丰富的人类内心世界,永远无法被量化、被标准化。人工智能在“阅读”上可以远远超出所有诗人,能够识别出哪些词是高频的,可以按照基本的诗歌规则组合出一首诗,但这种组合不是创作。
在这个意义上,无法区别的,是糟糕的作品与机器人写的作品。如果把杜甫的诗和机器人写的诗混在一起,肯定容易区分。
因此,就文学创作而言,人工智能未来有可能在编剧或网络文学方面有所突破,毕竟除了一小部分杰出的作品外,无论剧本创作还是网络文学,比较依赖标准化的情节模式与词语搭配。而文学作品的模式化程度越强,越有可能人工智能化。概括地说,人工智能对于文学创作的取代,目前所能展望到的最高成就,是取代通俗文学,有一天或许是电脑自己来打字,上传一部合格的网络文学作品到网站上。
拉长历史视野来看,每当技术变革有巨大突破时,对于科技入侵文学的忧虑就一再浮现。本雅明在1936年完成的《机械复制时代的艺术作品》一文中,就表达过摄影、电影出现后艺术作品“光韵”消亡的遗憾,而伴随着广播、电视、网络的出现,文学这门古老的艺术一次次被宣判死亡。我们不必对此悲观。文学理论大家钱谷融先生在20世纪50年代就提出过“文学是人学”,文学的复杂始终对应于人心的深邃,只要灵魂没有枯竭,文学这朵艺术之花会永开不败。
人性是永远无法替代的部分
在今天讨论人工智能与文艺的关系,笔者觉得真正担心的不是人工智能开始文艺创作,而是我们对于文艺的理解趋向人工智能化。某种程度上,值得当心的是反向人工智能,即人性的智能化,不是机器人变成了我们,而是我们变成了机器人。比如上文所引的机器人诗歌,如果有较好的诗歌修养并不难识别,但在各种伪托李白藏头诗的口水诗都可以在网络上流行的今天,笔者担心越来越多的人将无法判断一首机器人诗歌和一首好诗的差距。
毕竟,人工智能不是简单的“工具”,人工智能和现代社会有高度的同构性,本质上都是高度理性化的产物。以理性为核心逻辑的现代社会,将人性想象为“经济人”或“理性人”,趋利避害,以自身利益的最大化为目的;而人工智能所设定的“人”,可以看成是一个理性发达、情感淡漠的人,二者的人性想象有相似之处。
这种“理性人”与资本高速运转的时代相匹配,服务于利润的最大化。我们知道人工智能高速发展的背后,是资本的逻辑,比如机器人产业蔚然兴盛的一个主要原因,就是降低人力资本,富士康公司在2016年已经利用机器人将昆山工厂的工人人数从11万降低到6万。可以设想,假设机器人技术更为成熟,那么剩下的工人岗位也岌岌可危。如果从资本的视角出发,最理想的人就是流水线上的人,或者更直接地说,是流水线上的机器人。
这再一次回到英国学者查尔斯·珀西·斯诺在著名的《两种文化》中提出的“科学”与“人文”之争。今天的我们注视着人工智能,也许就是在注视着未来的自己,我们必须警惕科学对于人文的步步蚕食。目前好像是机器存在于人类的运转中,但也许换一个角度,人类不过是存在于机器的运转中,就像卓别林的电影《摩登时代》所揭示的那种状态。在人工智能的时代,也许我们可以更坚定地定义人性:什么是人性?人性是那永远无法被人工智能所替代的部分。
作者:上海社会科学院文学所助理研究员 刘春
(责编:张萌、张希)