人工智能诗歌写作平台
国际知名学者周海中先生曾经预言:“随着科技进步,人工智能(简称AI)时代即将到来;届时,人工智能技术将广泛应用到各学科领域,会产生意想不到的效果。”如今,越来越多的事实证明了他的这一预言。目前,人工智能技术已经应用到诗歌创作方面;在公开测评中,许多由机器诗人(即“智能写作机器人”)写的古诗几乎达到了人类诗人的水平。
古诗,即古体诗,泛指古代诗歌。从诗句的字数看,有所谓四言诗、五言诗和七言诗和杂言诗等形式;四言是四个字一句,五言是五个字一句,七言是七个字一句。唐代以后,称为近体诗,所以通常只分五言、七言两类。古诗是中华传统文化的重要组成部分,是中国古人文艺美学与人生情操之集大成。据悉,中国研制的“小度”“汪仔”“乐府”“薇薇”等,都是网络上红透了的机器诗人,它们通过人工智能这一高新技术会写古诗了。
机器诗人的系统通常由三个部分组成:一个节奏模型,一个韵式模型,以及一个确保语法正确的自然语言模型。其中,自然语言模型是最主要的部分,它采用三种处理模式解决深度学习问题:第一种通过评估单词的使用概率来选择每个单词,第二种检查每一行诗的节奏,第三种确保每一行诗都遵循韵律方案。通过这三个部分的有机组合,机器诗人就可以轻松地生成具有自我风格的古诗。
就目前而言,机器诗人在作品质量和水准上已经与人类诗人差距不大。不过,有专家认为,在节奏和韵律方面,机器诗人更胜一筹;在可读性与引起情感共鸣方面,人类诗人更胜一筹。我们常说:“熟读唐诗三百首,不会作诗亦会吟”;那么面对把所有中文古诗都牢记在“心”的人工智能技术,我们怎能不生敬畏之心。
前不久,中国清华大学语音与语言实验中心(CSLT)宣布,他们的机器诗人“薇薇”通过了“图灵测试”,通过“图灵测试”意味着人们无法通过语言对话分辨出人类和人工智能。据CSLT网站公布结果,“薇薇”创作的古诗中,有31%被认为是人写的。不过,在本次比赛中,“薇薇”创作古诗的水平还是未能超越人类诗人,双方的比分为2.72比3.20(满分5分)。
当今,人工智能会写诗,这已经不是什么新鲜事了。随着现代科技发展,尤其是强人工智能出现,不排除有一天机器诗人也能写出王维的“大漠孤烟直,长河落日圆”的可能。然而美则美矣,缺少灵魂。这点灵魂,就是情感。李白、杜甫、苏轼等的诗歌名垂千古,不是因为对仗如何工整,辞藻如何华丽,更重要的是诗歌背后的故事以及它所承载的情感。
此外,人类具有抽象思维能力,而现在的人工智能却没有。这种能力是人类独有的思维方式,是建立大量感性知识库之后才有的。人工智能能够将景致写的绝美,也能像模像样地写出感性的句子,但是不能将具象的东西抽象化。比如看到山,人工智能只能写山,但是苏轼却能写出“不识庐山真面目,只缘身在此山中”这类饱含哲思的诗句。
中国作协副主席、知名评论家李敬泽先生曾经说过:“当前我们在谈论AI写的诗好不好的时候,也忘了一个问题:未来人类是否愿意读AI的诗?”就像我们知道汽车、飞机跑得很快,但依然存在跑步运动一样,人类诗人写作也是源于一种内在认同,机器诗人写的可能很快很好,但却很难让人产生认同感。
人工智能已经开启古诗创作的新模式,但机器诗人在未来能否与人类诗人比肩犹未可知。其实机器诗人和人类诗人在古诗创作上各有优劣,重要的不是孰优孰劣,而是如何发挥人工智能在古诗创作中的作用,帮助我们提升创作品质和水准,让古诗创作如虎添翼,从而推进中华传统文化的传承与创新。
作者:黄芳博士新加坡国立大学文学暨社会科学院
诗歌与科技 ▏人工智能诗歌论
问题的关键在哪里?一个好的诗人必须具备分辨好坏的能力,也就是审美的能力,而这不仅关乎诗歌文本的特性,更关乎文本之外的体验。换言之,要理解诗的好处,不能仅通过文本本身——我们不妨参考苏轼在《书黄子思诗集后》中引用的司空图语:“梅止于酸,盐止于咸,饮食不可无盐梅,而其美常在咸酸之外。”[6]如果料理人自己没有敏感的舌头,那么我们很难设想他究竟如何理解“咸酸之外”的美味,更难设想他如何做出这样的美味。前举IBM推出的算法所创作的十四行诗几乎能以假乱真,这固然是一个可喜的进步,但我们也有理由假设,如果应试者是优秀的诗人,理当辨千剑而识器——就像好的古董商能凭微妙的感觉鉴别常人眼中的赝品一样。
当然,我们应对前景保持乐观,随着技术发展,人工神经网络将能精确模仿人类神经元的刺激——反应(stimulus–response)——让AI具备人类的情感,并非天方夜谭。但或许仍有新的问题需要解决:人类始终在理解他人的意图,诗歌的文本需要潜在的读者,AI是否具备产生这种“主体间性”(intersubjectivity)的可能?这关乎两个疑问:一,AI之间能否作为对等的主体进行交流?二,AI是否可能具有刺激理解意图产生的必要遮障?印度的吠檀多学派主张去除无明遮障,使个体小我重归于梵,从某种意义上说,AI一开始就达到了“我即梵”的境界,并无“遮障”和“小我”为患,而AI要创作诗歌,反而要学习人类这种“缺陷”——套用佛教的话,这是一种有意的“退转”(vaivartika)——或许诗歌正是对人类这一“缺陷”的补充。
二、人工智能创作诗歌的可理解性问题
HerbertPaulGrice的“会话隐含理论”(conversationalimplicaturetheory)认为,会话背后必有不随形式改变的明确含义。诗歌同样遵循类似的规则。诗人将某种意图埋藏于诗中,读者在阅读的过程中追索诗句背后的所指。“丸之走盘,横斜曲直,计于临时,不可尽知。其必可知者,是丸之不能出于盘也。”[7]诗人的意图如何,“不可尽知”——或许永远不会有读者能够准确把握——但诗人有意图却是“必可知”的事实。威廉·燕卜荪在《朦胧的七种类型》中写道:“诗人将两个陈述放在一起,似乎二者是相互联系的,而读者则被迫去考虑他们的联系,还得自己去设想诗文为什么选择了这些事实。他会设想出各种原因,并在脑中将它们排列起来。这是诗歌语言在运用方面的基本事实。”[8]一旦取消陈述之间相互联系的预设,读者理解的企图便会落空。换言之,没有作者意图的诗歌本质上是不可理解的,哪怕它们在字面上可以理解。
早在人类进入信息时代前,便有一个绝佳的例子说明这一点。二十世纪初,法国曾流行一种名为“精致的尸体”(exquisitecorps)的游戏——大致的流程是:参与者们在互不知晓的情况下,依次写下词语,然后组合成句。据说在某次游戏中,得到了“精致的尸体会喝下新的葡萄酒”(Lecadavreexquisboiralevinnouveau.)的“诗句”——这句“诗”确实意象诡丽,饶有波德莱尔的风味,“cadaver”一词在法语口语中又有“喝空的酒瓶”之义,一语双关,颇富妙趣,然而它是随机偶合的产物,而非某个诗人精心结撰的成果。我们固然可以说,诗的好坏在其本身,但这一问题仍牵涉到诗的经典定义——中文“诗”义在传世文献中最早见于《毛诗序》:“诗者,志之所之也。在心为志,发言为诗。”[9]而英语的“poem”一词源于希腊语的poema,意指“所造之物”——无论中国的“志之所之”还是希腊的“所造之物”,都强调了诗歌是某种意图的产物而非任意的组合。《孟子·万章上》:“故说诗者,不以文害辞,不以辞害志;以意逆志,是为得之。”[10]如果诗是任意的组合,那就无志可逆了。
目前的人工智能尚不具备自主意识,写出的“诗”仅仅是符号的集合,没有所指,没有隐喻,读者的一切追索将成徒劳,就像人工合成的语音,纵然模仿得惟妙惟肖,背后却无真情实感——我们在知道真相的情况下,恐怕很难为之感动。
人们有理由预期具备自我意识的“强人工智能”(strongAI)出现,届时这样的AI或许能创作出有意图的、真正的诗。它们究竟会是怎样的呢?现在预言为时尚早,但如果它们依然基于对人类诗歌的模仿,那就不禁让人想起那则著名的童话——小红帽听到了外婆的声音,打开门却看见了一头狼。
三、人工智能创作诗歌的创造性问题
诗歌不同于类型文学,可以提炼出某种模式大量复制。相反,诗歌强调独创性,强调“陈言之务去”,一首好诗的价值往往体现在前所未有上,一个好诗人的价值往往体现在独树一帜上。试将诗歌与围棋做一对比。围棋是人工智能擅长的领域,自从2016年阿尔法狗(AlphaGo)击败李世石,人类便失去了这一领域的王冠。阿尔法狗采用卷积神经网络(ConvolutionalNeuralNetworks),通过蒙特卡洛搜索树(MonteCarlotreesearch)进行决策优化,在模仿人类和自我对弈中提升棋力。2017年,Google推出阿尔法狗的进化版阿尔法元(AlphaGoZero)。阿尔法元使用残差网络(ResidualNetwork),不须学习人类旧谱,仅通过自我对弈训练棋力。它在与阿尔法狗的对弈中创造了100:0的压倒性战绩。无论是阿尔法狗还是阿尔法元,其原理都是对棋路的破解——无论棋路来自人类还是人工智能本身。这与诗歌不同。创造一流的诗歌,需要避免套路;换言之,围棋是在道路中寻找道路,诗歌是在道路外开辟道路。文首所举的两例AI“诗人”采用的途径却是对已有诗歌的模仿,这与真正优秀的诗作需要创新这一点显然背道而驰。另外,诗歌的创新未必意味着一空依傍。杰出的诗人多在继承前人优点的基础上别开生面,如何把握继承和创造之间的“微妙分寸”(nuance),对AI“诗人”来说是一个严峻的挑战。
围棋与诗歌面对的信息量也有巨大的差别。围棋是复杂的简单问题,诗歌是简单的复杂问题。围棋本身是一种抽象——棋子和棋盘上的交叉点是仅仅代表相对位置的几何点,不具有任何其他内涵。所以尽管围棋的计算量十分浩大,但全都发生在边界清楚、数量固定的规则层面,比无限且难以分割的现实容易计算得多。一言以蔽之,人工智能高速运算的优势正适合围棋这种规则清晰、计量标准统一的游戏。诗歌牵涉的层面则极为复杂。首先,诗歌由符号组成,但正如上文所示,“味在咸酸之外”,符号的指涉并不止于符号层面——它们通向并反馈现实,现实又随时间、标准、个体、情感的变化而变化,换言之,诗歌创作不但没有清晰的规则,甚至也缺乏稳定的规则(除了“格律”那样某类诗体所需的规则)。优秀的诗人之所以能够在这样的“混沌”(chaos)中游刃有余,依靠的是微妙的直觉,而就目前来看,人工智能尚无望达到这样的水准。除非人类掌握了某种“黑箱”(blackbox),能够自发性地模仿“复杂适应系统”(complexadaptivesystems)——我们可以推想“强人工智能”很有可能正是这种“黑箱”——否则以人类当前的信息处理能力,设计出真正意义上的人工智能“诗人”几乎是不可能的。
四、人工智能创作诗歌的必要性问题
诗歌并非生活的必须品,也不以量取胜,又无十分明确的评价标准,有没有必要花费巨大的代价开发人工智能写诗的能力?人类开发人工智能往往基于工具性的目的,而诗歌创作往往基于情感的寄托。这一问题或许可做如下类比:前者如保姆,后者如母亲,开发AI保姆有必要,开发AI母亲是否有必要?后者本身与人类的属性相嵌合:人们寄望于后者的主要不是工具价值,而是情感价值,所以对后者来说,人类的身份至关重要,绝非可有可无——一个具备保姆功能的AI能够代替保姆,一个具备母亲功能的AI则不可能代替母亲。
更重要的是,研究人工智能创作诗歌有什么好处呢?目前人工智能“诗人”尚处于模仿已有诗歌的阶段,对诗歌的开拓与发展来说并没有明显的助益。而对人工智能来说,能够在真正意义上创作诗歌的前提是主体意识、纯熟地理解和使用自然语言的能力和情感体验的能力。我们可以设想,一旦拥有主体意识、具备卓越的语言和情感能力的强人工智能出现,诗歌创作便是题中应有之义。“古诗云:‘谁能思不歌,谁能饥不食。’诗词者,物之不得其平而鸣者也。”[11]如果我们认可王国维的这一观点,那么诗歌本质上正是情感“不得其平”而生成的表达欲望。正如肉体会饥饿一样,这样的欲望是“不教而能”的,而一旦拥有这样的欲望,凭借语言能力和人工智能本身的存储和运算优势,AI距离创作真正的诗歌只有一步之遥,举足可至。换言之,写诗的能力附属于强人工智能,没有必要花费太大的代价单独开发。在强人工智能出现前一味关注这一能力,恐怕有事倍功半甚至无解的风险。
即便强人工智能开发成功,也如人类的期望写出了真正的诗歌,届时或许会有一个新的问题出现:强人工智能何以必须用人类能够欣赏的方式表达情感?人类固然在有意无意地以人的标准塑造人工智能,但人工智能终究是一种与人类不同的智慧体,它们真实的表达方式很有可能无法移情于人类,正如我们很难体会动物的心情(值得注意的是,相对于以无机物为载体的人工智能,人类与动物皆属有机物,关系更近),而如果在这样的情况下AI仍然采用符合人类预期的方式进行情感表达,那么在很大程度上这仍然是一种缺乏真正意图的模仿。换言之,创造符合人类审美的诗歌对AI未必有“必要性”。
五、人工智能创作诗歌的借鉴作用
上面列举了人工智能创作诗歌所面临的四个挑战,但现阶段人工智能的诗歌创作仍可提供一定的借鉴意义。它有助于人们重新思考诗歌的好坏和门槛。在缺乏参照的情况下,人类对自己的长处与短处往往是盲目的。再举围棋为例。在阿尔法狗出现前,人们常以为人工智能下棋的强项在依赖计算的微观搏杀部分,而在诉诸直觉的大局观上应该不如人类,因此人类的机会集中在布局阶段,需要精细计算的中盘和收官才是AI的擅场。阿尔法狗与李世石的实战颠覆了这一想象。被誉为“阿尔法狗之父”的DemisHassabis注意到,在狗李之战第二局的第37步,阿尔法狗没有按照人类行棋的惯例在右起的第三线或第四线落子,而出人意料地在第五线落子。此线离中部位置较近,意味着阿尔法狗在战略上更“重视”中部区域。这样的“胜负手”层出不穷,可见阿尔法狗大局观之高明。相反,在微观计算部分,却不乏恶手与俗手[12]。同理,以AI诗歌为镜,也能映照出人类诗歌的问题,促使人们分辨出诗歌中真正可贵的神理,改进创作的技巧,转移阅读的重点。比如,通过微软小冰创作的诗歌,人们会发现部分汉语现代诗歌意象堆垛、情感泛滥、比喻莫名其妙,小冰可以轻易模仿、批量生产。相对而言,当前的人工智能模仿旧体诗词较为困难。AI“诗人”所作旧体诗词虽然符合格律,但稍有古典修养的读者一眼可辨其伪。这是因为旧体诗词不仅在形式上有较为严格的限制,而且经过长时间的发展,形成了“默认”(default)的字法、句法、章法——虽说只要有法可学,人工智能模仿并非难事,但旧体诗词的法度多与具体情境结合,分寸殊难把握,当前的人工智能无法体察人情世故,几乎无从入手——对于熟悉旧体诗词文字气味的读者而言,很容易就能觉察正宗与否。新诗则不然,更多地追求语言的“疏离化”(defamiliarization),与基于经验的日常语言截然异趣。这增大了人类理解的难度,却降低了人工智能模仿的门槛。从这个意义上说,当下人工智能创作的诗歌或许能在一定程度上改变诗歌的评价标准——如上例就体现了旧体诗词相对于新诗的某种可能的优势。
六、人文学科需要做些什么?
人工智能的语言能力开发本质上是一个技术问题,主要牵涉到计算机学、神经学、语言学、逻辑学等非人文学科领域,但人工智能诗歌创作能力的开发则必须有人文学科参与其间。然而,当下该领域却较少见到人文学者的身影。这一方面是因为开发者将审美的重要性置于技术之下,另一方面也是因为当代人文学科体系以学理性的研究为主,把创作和鉴赏放在了次要的位置。事实上,就诗歌一道而言,审美是极为重要的。一件产品只要合格就可以用,一道菜肴即便无味也能果腹,然而复制平庸的诗歌几乎没有意义。换言之,一首诗的价值首先在于它的好。对于诗歌来说,重要的是审美性而非实用性。这就需要人文学者的介入。遗憾的是,人文缺席严重制约了AI诗歌创作的发展。以前文所举微软小冰为例,其诗集《阳光失了玻璃窗》遭到了诗歌界的负面评价,如诗人于坚说:“(小冰的诗作)冷酷、无心,修辞的空转,东一句西一句随意组合,意象缺乏内在逻辑,软语浮词,令人生厌的油腔滑调,原材料来自平庸之句。这个软件对诗的理解是电视台诗歌朗诵会的水平。这个软件设计不出灵性,设计不了‘诗成泣鬼神’。”[13]诗人欧阳江河则认为:“(小冰的作品)不是人话,没有人味。”“我当然认为,我们必须要承认人工智能,小冰也会继续发展下去。在十万个二流诗人里面,它可以排到30、50,但是这毫无意义。它永远成不了我们所说的原创性意义上的伟大诗人。伟大的诗人一定针对的是文明意义上的东西。而这种东西绝不是学学已有的大诗人的句子,写出一些漂亮的、优美的句子就能达到的。”[14]这些酷评固然有当前技术限制的原因,但也有“原材料来自平庸之句”这样的设计者造成的缺憾,而“软语浮词,令人生厌的油腔滑调”更是明显的人为后果。欧阳江河所说“伟大的诗人一定针对的是文明意义上的东西。而这种东西绝不是学学已有的大诗人的句子,写出一些漂亮的、优美的句子就能达到的”,揭示了诗歌必须注入比文学技巧更广阔、更宏伟的人文内涵。即便回到基本的文学技巧层面,当前对人工智能诗歌开发中体现的人文水平也是远远不够的。例如,不加择别地提供大量诗歌作为AI的学习和训练资料,而忽视了各种风格之间的潜在矛盾。一般而言,人类学习诗歌总是从某个风格入手——古人所谓“专攻一家”——某些开发者让人工智能囫囵吞枣,自然难企高境。理想的情况是,具备创作和鉴赏经验的文学研究者与技术人员合作,根据人工智能的特性和认知科学的成果,精心制定循序渐进的学习步骤。深度学习(deeplearning)的发展使得人工智能有可能模拟人类大脑皮层的活动,进而以一种类似于人类的方式学习和思考,那么人类的教育方式或许仍可经过一定的改造应用于人工智能。
七、结语
人工智能的发展是大势所趋,据统计,截止2019年6月,仅上海一地就有人工智能核心企业1000余家[15]。我们甚至可以说,人工智能不仅是一个行业,而且是所有行业的未来。本文讨论的仅是它无数可能具备的技能中的一种——诗歌创作。这一技能有一定特殊性,因为诗歌是人类最独特的精神产物之一。2019年4月,笔者应邀参加了贵阳孔学堂举办的关于人工智能能否进行诗歌创作的辩论,作为反方,对人工智能创作诗歌的可能性做出了质疑。然而,笔者更愿意相信,人工智能的可能性是无限的。这一信念建立在一个简单的假设上:人工智能能够在极短的时间内走完人类漫长的进化历程,如阿尔法狗从2014年开始研发,不到两年就打败了人类最优秀的棋手之一,而阿尔法元仅训练三天就完胜阿尔法狗。可以毫不夸张地设想,如果AI能够在一天内从无到有,赶上人类的水准,那么第二天它就有可能进化到人类望尘莫及的境界。我们现在的认识受锢于人类的大脑,而一旦技术奇点(technologicalsingularity)来临,AI进化出了更卓越的“大脑”,那么当下的“不可能”或将变成“可能”。这曾经只是一个科幻色彩浓郁的臆想,而现在成了一个日益临近的现实。
[3]“ScientiststrainedanAItowritepoetry,andnowit’sstandingtoe-to-toewithShakespeare”,BoyGeniusReport,2018-8-8,https://bgr.com/2018/08/08/poetry-ai-bot-shakespeare-human-research/?from=singlemessage&isappinstalled=0。
[4]【美】乔姆斯基:《句法结构》,第8页,黄长著等译,中国社会科学出版社1984年版。
[5]《苏轼文集》,第2552页,中华书局1986年版。
[6]《苏轼文集》,第2124页。
[7]杜牧:《樊川文集》,第152页,中华书局1979年版。
[8]【英】威廉·燕卜荪:《朦胧的七种类型》,第57页,周邦宪等译,中国美术学院出版社1996年版。
[9]《毛诗正义》,第6页,北京大学出版社1999年版。
[10]《孟子正义》,第638页,中华书局1987年版。
[11]《王国维全集》第1册,第497页,浙江教育出版社2009年版。
[12]“Themindinthemachine:DemisHassabisonartificialintelligence”,FinancialTimes,2017-4-21,https://www.ft.com/content/048f418c-2487-11e7-a34a-538b4cb30025。
[13]于坚:《一种可怕的美已经诞生》,载《南方周末》,2017-6-15。
[15]《上海已拥有人工智能核心企业1000余家初步建成中国人工智能发展领先地区》,凤凰财经,2019-6-18,https://finance.ifeng.com/c/7nbd11k0OP6。
(原载于《华南师范大学学报》2019年第5期)
END
返回搜狐,查看更多