AI生成内容的版权尚无明确界定
原标题:AI生成内容的版权尚无明确界定自OpenAI推出生成式大语言模型ChatGPT以来,国内外生成式人工智能层出不穷。其中最引人关注的问题之一,莫过于人工智能生成内容(AIGC)是否具有版权?
“著作权保护对象是作品。”6月16日,在湖北武汉召开的第二届版权产业创新与知识产权保护东湖论坛上,中国知识产权法学研究会副会长、中南财经政法大学教授曹新明表示,某些人工智能生成物并非《中华人民共和国著作权法》(以下简称著作权法)意义上的作品。
曹新明解释道,著作权法意义上的作品应满足以下四个条件:由人类创作,具有独创性,是蕴含一定思想内容的表达形式,且不属于法律法规、通用数表、公式等著作权法排除对象。目前AIGC有三种形式,分别是完全由人工智能独立创作、由自然人辅助创作、按照自然人输入的提示词生成。
曹新明说,上述三种形式中,只有一种是人类直接参与的,这种情况下AIGC才可能具有版权。“在剩下两种形式下,将AIGC界定为‘作品’是有问题的。”这是因为人工智能并没有独立的思想,并不能独立地进行“创作”,更遑论具有版权。
南开大学法学院副院长、竞争法研究中心主任陈兵表示,从目前各国的立法状况来看,日本、澳大利亚、英国、美国等国家均未赋予人工智能民事主体资格,因此也谈不上AIGC“具有版权”。
虽然法律对AIGC版权问题的界定尚不明确,但仍应警惕生成式人工智能使用过程中的侵权风险,中国在此方面已有相关案例。陈兵说,在这些案例中,法院通过对AIGC的生成过程进行判断,明确对生成物是否赋予利益。这需要具体问题具体分析,但有一点可以明确:人类对AIGC的简单形式选择并不足以构成著作权法上的独创性。
生成式人工智能涉及从数据抓取到内容生成的全过程。这个过程中,作为生成式人工智能最终产品的AIGC在版权归属上界定模糊,其训练过程中抓取的数据也会有侵权的风险。
“现在人工智能里面有几千亿的元素、数据,其中很多都是受版权保护的资料。这部分资料版权所有者的权利该怎么保护,目前尚不明确。”曹新明说。
陈兵认为,目前国家知识产权局和深圳、上海等地已经开始着手研究数据的确权工作,但具体如何确权还需实践给出答案。“版权的设立是为了鼓励更多创新。”他表示,若不对数据和AIGC进行确权,会导致生成式人工智能开发商喂养成本过高,从而抑制创新。但另一方面,由于大模型具有显著的聚集效应和马太效应,人工智能开发商在训练人工智能时又极易产生数据垄断风险。
针对上述问题,陈兵认为,要理性对待AIGC创新,探索AIGC应用边界,优化对数据爬取的制度设计,分类分级探索场景化和精细化的算法治理机制,夯实算法开发者、应用者相应法律责任。“对于数据垄断风险,要发挥政府对市场的敏捷监管、精准监管作用,推动企业‘开源’发展,并确立多元监管机制。”陈兵同时表示。
此外,曹新明提醒,生成式人工智能可能不止会侵犯版权。例如,未经他人允许使用人工智能模仿其声音、动作、姿势、手势,甚至使用人工智能“盗脸”,就侵犯了公民人格权。
“针对这些问题,可选择安装‘护栏技术’对人工智能予以约束,同时应避免大模型受到某些用户攻击。”曹新明表示。(实习记者裴宸纬本报记者吴纯新)
(责编:杨曦、吕骞)关注公众号:人民网财经分享让更多人看到
::王 迁:论人工智能生成的内容在著作权法中的定性
【中文关键词】独创性;人工智能;机器学习
【摘要】如果人工智能生成的内容在表现形式上不符合作品的构成要件,如计算机生成的无独创性数据库,当然不能作为作品受到保护。但如果人工智能生成的内容在表现形式与人类创作的作品类似,如机器人绘制的图画、写出的新闻报道或谱出的乐曲,则需要从其产生过程判断其是否构成作品。迄今为止这些内容都是应用算法、规则和模板的结果,不能体现创作者独特的个性,并不能被认定为作品。在不披露相关内容由人工智能生成时,该内容可能因具备作品的表现形式而实际受到了保护,但该现象是举证规则造成的,并不意味着著作权法因人工智能而改变。
【全文】
近来,随着计算机程序“阿尔法围棋(AlphaGo)”战胜人类顶级围棋高手,以及机器人绘画、写作和谱曲的出现,有关人工智能与著作权保护的问题受到关注。“人工智能”与基因工程和纳米科学并称为21世纪三大尖端技术之一,虽然“人工智能至今尚无统一的定义,要给人工智能下个准确的定义比较困难”{1}1-2,但一般认为它描述了计算机模拟人的某些思维过程和智能行为(如学习、思考、推理、规划等)的过程[1]。{2}2既然人工智能在表面上缩小了纯粹机械活动与人类思维之间的差距,利用人工智能生成的内容似乎就有了智力创作的痕迹。那么,对这些内容在著作权法中如何定性?它们能否作为著作权法意义上的作品受到保护?这一问题与著作权法的未来发展息息相关,实有深入研究的必要。
一、研究范围的确定:考察相关内容的表现形式
人工智能生成的内容是否应被认定为作品,当然是应当进行深入研究的问题。但是,并非所有由人工智能产生的内容都需要被纳入讨论范围,因为在许多情况下,对相关内容法律属性的判断与由人工智能产生的事实并无关系,运用著作权法的基本原理就可以获得圆满的解决。同时,对上述问题的讨论也必须有前后顺序之分,否则将使讨论丧失焦点和重点。
在对人工智能生成内容的定性进行研究之前,应当排除那些即使源于人类,也被公认为不可能构成作品的内容。因为人工智能只是生成相同内容的技术手段,围绕人工智能进行的著作权研究,应当针对人工智能带来的特殊问题——人工智能生成内容的过程是否属于创作行为,该内容是否构成作品。但这一特殊问题依赖于一个前提——人工智能生成的内容符合除“由人创作”之外的作品构成要件。如果相同的内容即使源于人类,也不可能构成作品,则对上述问题就丧失了研究的必要。
在澳大利亚发生的“Telstra公司诉电话号码出版公司案”中,原告因被告复制其编制的电话号码簿而起诉被告侵权。法院认为该电话号码簿不受澳大利亚《版权法》的保护,理由之一在于“它不是人类创作的结果,而是由计算机生成的”[2]。该案也被一些学者在研究人工智能生成内容的著作权问题时所引用[3]。
这样的讨论是缺乏价值的。如果源自人类的相同内容都不属于作品,则无论该内容是源自于动物还是人工智能,都不可能被认定为作品,此时仅需要讨论作品的范围是否应当扩充,或者是否应当在著作权法中增设邻接权,以保护此种不构成作品的内容,但显然与人工智能无关。只有当源自人类的相同内容属于作品时,才有必要讨论由人工智能生成的该内容能否被认定为作品。
在上文提及的“Telstra公司诉电话号码出版公司案”中,即使涉案的电话号码簿确实是利用人工智能生成的,但由于它仅是将所有电话号码按照用户姓名的字母顺序排列,即使由某人在不借助任何程序的情况下以纯手工方式编成,也不可能构成作品(汇编作品)[4],因此“人工智能”并非认定号码簿是否构成作品的因素,以此案讨论人工智能生成内容的著作权问题也缺乏合理性。与之相反的是,目前在网络中流行的一些美图软件利用“深度神经网络”的人工智能,可以将照片或图片变为印象派、野兽派等各种风格[5]。对于进行风格转换后的图片而言,如果人们并不知道它是美图软件生成的,而以为是人工绘制的,也就是该图片源于画家之手,则当然会认定它是美术作品,即基于原作品形成的演绎作品。因为从表现形式上看,它以原作品为基础,以新的色彩与线条形成了有别于原作品的艺术造型,体现了画家富有个性的独特选择与判断。对于此类内容,在明确了其由人工智能产生,而非源于画家之后,需要讨论其是否构成作品。
鉴于此,在研究人工智能生成的内容是否构成作品时,需要首先考虑的问题是:在相同内容源自于人类创作的情况下,该内容在表现形式上是否构成作品。所谓“在表现形式上构成”,是指仅从相关内容的外部表现形式判断它与人类作品是否相同,并不考虑该内容的形成过程是否符合独创性的要求(这是下一步考虑的问题)。如果相关内容是从无到有产生的,也就是被主张为完全原创的作品(而非演绎作品),则应当判断其表现形式是否符合著作权法对各类作品的定义。但是,对于采用了人工智能的绘画机器人绘制的肖像画或风景画而言[6],在形式上就属于“以线条、色彩或其他方式构成的审美意义的平面造型艺术”[7]。同样道理,由“新闻写作软件”生成的新闻报道,{3}以及由软件生成的音乐[8],在形式上具备著作权法对文字作品及音乐作品要求。此时就应将其纳入研究范围,进一步分析其是否构成作品。如果相关内容是基于原有作品产生,即被主张为演绎作品,则应当判断其表达与原作品是否已存在实质性差异。例如,智能软件将简谱自动转换成五线谱,是对同一音乐作品在记录方式上的变更,并没有产生新的音乐作品[9]。再如,利用人工智能的语音识别软件对口头表达的文字记录,以及文字处理软件对输入计算机的文字进行拼写和语法的校对和更正,无法形成与口头表达或原始文字存在实质性差异的表达。同样,绘画机器人利用人工智能对绘画进行精确临摹的成果,由于未能与原画作产生可被客观辨别的差异[10],只属于复制件[11]。但是,对于上文提及的应用人工智能的修图软件而言,由于在对照片或图片进行风格转换后,新图片与其原始状态相比已存在实质性差异,如果新图片是由人绘制的,则在形式上已属于演绎作品,此时需要将其纳入研究范围,以回答其是否构成作品等一系列后续问题。
二、研究路径的确定:考察相关内容的产生过程
对于由人工智能生成,在表现形式上与人类作品相同的内容而言,应当根据著作权法的原理判断其是否确实属于作品。如果相关内容仅在表现形式上与人类作品相同,但实际上并不能被认定为作品,则自然无需再考虑如何确定作者身份和著作权的归属。
(一)以相关内容的产生过程为切入点
笔者认为,在对上述内容是否确实构成作品进行判断时,应当在暂不考虑主体的前提下,从相关内容的产生过程为切入点,分析它们是否符合独创性的要求。此处之所以强调“暂不考虑主体因素”和以“相关内容的产生过程”作为切入点进行分析,是为了避免形成逻辑循环。根据传统的著作权理念,只有人才能创作作品。任何源于人之外的内容即使在形式上属于作品,该内容也不能被著作权法承认为作品并提供保护。对作品的认定原本需要考虑主体因素,但在讨论人工智能生成内容的定性时,如果一开始就纳入主体因素,势必会造成逻辑循环,即“因为主体不是人,所以相关内容不是作品;因为相关内容不是作品,所以它没有作者,无需认定作者和著作权归属”。而“暂不考虑主体因素”,并只考察“相关内容的产生过程”,就可以在“形式上与人类作品相同的内容”中,识别出那些不符合独创性要求的内容并将其排除出著作权保护的范围,这样一来,有可能被认定为作品的,只能是那些不仅在形式上与人类作品相同,而且产生过程符合独创性要求的内容。对此类内容,才需要进一步研究:是否应当突破作品必须源自于人的传统著作权理念,将其认定为作品,以及如何认定作者和确定著作权。按照上述方法,对人工智能所产生内容著作权问题的讨论既可以避免逻辑循环,也更加聚焦。
(二)人工智能生成的内容是应用算法、规则和模板的结果
从目前有关人工智能的各种报道和描述来看,至少在现阶段,人工智能生成的内容只是应用某种算法、规则和模板的结果,与为形成作品所需的智力创作相去甚远。以上文提及的修图软件为例,它可利用“深度神经网络”的人工智能,将照片或图片处理成印象派等各种绘画风格。如暂不考虑主体因素及处理过程,仅从结果来看,多数人都会以为是画家绘制而成。然而,该项人工智能对照片或图片的处理,与绘画者根据照片或图片创作同样风格画作的行为存在本质区别。
在艺术家眼中,就一张照片或图片而言,其影像或造型与印象派等风格的画作之间并不存在严格的一一对应关系。以同一照片或图片为基础,可以绘制出无数被称为印象派风格的画作。绘画者即使熟知印象派的画风,也了解将普通照片或图片绘制成印象派画作应当遵循的一般方法,绘制过程也为绘画者留下了发挥的空间。绘画者可以凭借自己对印象派的理解和感悟,在线条的位置、粗细和弯曲度方面作出选择,在造型、明暗、阴影和色彩等因素上进行判断和处理,以表达其独特的思想感情。由此产生的绘画具有个性化的特征:多名绘画者在具有相同专业水准的情况下,以同一照片或图片为基础,绘制成的印象派画作也会存在差异。即使对同一名绘画者而言,在绘制印象派画作之后,如果事隔几年后要求其再次将同一照片或图片绘制成印象派画作,除非其记忆力超群或将第一次绘出的印象派画作摆放在旁边,否则也很难绘制出与前一次画作几乎完全相同的画作。这正如文字作品的作者如果因电脑故障无法打开未作备份的电子文档而被迫重写,也往往会感到重写后的文字与原文有所不同,原文中的一些精彩表述再难重现。这也就是为什么作者们总是对丢失其手稿等作品唯一载体的行为深恶痛绝[12]。
上述现象正是“独创性”的体现——作品源于作者独立的、富有个性的创作,打上了其聪明才智的独特烙印,是作者精神与意识的产物。这就使著作权法意义上的创作有别于人们严格根据算法、规则和模板实施的行为,如使用密码本对文字进行加密或解密,在五线谱和简谱之间进行相互转换,使用微软图表软件(EXCEL)中的图表模板将数据转换成图表等。显然,这些行为都利用了智力成果——各种方法和计算公式,如密码系统的设计和破解,五线谱和简谱等记谱方法的发明,各种图表模板及与数据之间的转换程序,都需要投入智力劳动。但是,算法、规则和模板是否为智力成果,与应用算法、规则和模板的过程是否属于智力创作,产生的结果能否构成作品并无必然联系。如果将它们应用于原始材料之后,只要方法正确,无论由何人实施,获得的结果具有唯一性,就排除了实施者发挥聪明才智的可能性,导致相应的结果无法具有个性化的特征,从而不符合独创性的要求。例如,EXCEL中将统计数据转换为各类图表的代码化指令序列可作为计算机程序受到保护,但任何人使用该程序处理同一套统计数据,所能够获得的各类图表都是相同的,这些图表显然不能构成作品。
利用“深度神经网络”人工智能的修图软件对照片或图片进行风格处理时,本质上仍然是在实施一套优化后的算法,该算法使软件在分析了上千万张的图像后,通过图像的颜色、结构和纹理确定不同风格之间的对应关系,从而在较短的时间内实现图像处理。{4}。但是,无论这套算法多么复杂、先进和富有创意,也无论转换的规则是由程序员直接输入还是程序根据算法自动产生,采用该算法的修图软件一旦编制完成,使用不同的计算机应用该软件对相同的照片或图片进行风格转换,只要不是由于软件的缺陷而出现计算错误,所得到的结果不会有所不同。这就从根本上抹煞了处理过程的创作空间,排除了处理结果具有个性化特征的可能性。正如有技术专家所指出的,这种风格转换只是“让大众有了机器可以作画的错觉”。{5}
即使是形式上比风格转换更接近人类创作的“机器人作画”,也无法符合独创性的要求。德国机器人实验室研发的机器人为真人绘制素描的视频新闻曾引轰动一时,甚至引发了“美术学院教谁去?”的疑问[13]。但是,在美术学院的人体绘画课上,如果许多学生都以同一个人为模特进行绘画,每个人绘出的人物画会互不相同,各具特色,这反映了美术作品创作过程中的独特个性。而机器人之所以能绘制素描,无非是根据研发者预先确立的算法和编制的计算机程序,先用机器人自带的照相机对人脸进行拍摄,再提取其中的特征点,再将其矢量化为一些线段,最后将这些线段传给机器人的控制器,由末端执行器在纸上绘制肖像。{6}。由此可见,机器人素描的过程是高度程式化的,只要模特是同一人,在相同的照明条件下,在同一距离和位置上具有相同姿势和神态,被绘制出的素描肖像就别无二致。在有关机器人绘画的科技论文中,研究的对象是“人脸肖像轮廓提取算法”、“人脸肖像轮廓的细节处理算法”和“数据采集系统和机械控制系统设计”,{7}均为定量化分析,说明“机器人作画”本质上仍然属于执行既定流程和方法,并通过计算获得确定的结果,与体现个性化的智力创作存在根本区别。
“自动新闻写作”则是综合运用算法与模板的结果,其关键在于针对某一类型文章,如财经新闻、体育新闻等开发出针对原始数据进行分析的算法,再将其分类套入内置的各种模板。{8}以自动对美国职业篮球赛(NBA)进行直播报道的自动写作软件为例,虽然其生成的直播报道足以“以假乱真”,被球迷评价为由人工创作的比率高达90%[14],但它是基于开发者构建的球队“比分差函数”,运用由该函数的数据分片算法和数据合成算法,对数据进行分类,并填充到开发者事先预定的上百个模板中所产生的结果。“模板”是根据数据的类别以及历史NBA赛事的新闻报道制作的,类似于有固定格式、栏目和标题的表单,用于填入数据。如“以球队为报道对象”的模板包括“*队开局打出*比*的比分,取得了*分的优势”、“双方杀得焦灼,你来我往都有得分,比分为*比*”、“*奋力打出*的攻击波将分差缩小到个位数”等。“以球员个人为主要报道对象”的模板包括“在*球员的带领下,取得*分的领先优势”、“*队在*的带领下打出*比*的攻击波,一举将比分反超”、“双方打得相当胶着,*连投带罚接连得分,*也打得非常有活力”。{9}然,当软件根据函数和算法对原始信息进行筛选和计算后,将所得数据依对应关系填入模板之中,一篇新闻报道就形成了。它与前文所述的“机器人作画”一样,本质上仍然属于执行既定流程和方法的结果。
(三)人工智能的“学习”是确定规律的过程
具有“学习”能力是人工智能技术发展进步的标志。开发“阿尔法围棋”程序的“深度思维”公司首席执行官曾称该程序“拥有强大的自我学习能力……它是通过自我对局来优选最佳方法,这跟人类的思考方式一样”。{10}然而,人工智能所具有的“学习”能力并不意味着应用这种“学习”成果生成内容的过程是创作,以及生成的内容是作品。它只意味着与程序设计者预先确定可直接得出结果的固有规则(如简谱与五线谱之间的对应关系)不同,拥有人工智能的程序可以通过对大量数据的分析,自己找出事物之中更为具体、细致的规律。毫无疑问,这种“学习”能力在数据处理方面具有极大的优势,但它仍然属于应用特定算法获取最佳结果的过程,其作用在于从无数可能性中找到唯一或者极为有限的正确路径。因此一些人工智能的研究者将人工智能的“学习”描述为:将神经——中枢——大脑的工作原理设计成一个不断迭代、不断抽象的过程,以便得到最优数据特征表示的机器学习算法。{2}290-291例如,“阿尔法围棋”程序的人工智能体现在它具有由“策略网络”和“估值网络”构成的“深度神经网络”。这种“神经网络”实际上是由简单处理单元构成的大规模并行分布式处理器。{11}1其中“策略网络”通过对人类对弈大数据分析,“搜索出更像人类高手该落子的位置”,“估值网络”对备选的落子位置进行后续计算,“推演出胜率最高的走法”,{7}这是一种对从外界获取的信息进行的逐层加工的过程。{13}
同样,相关研究表明:计算机程序之所以能“作曲”,是应用了统计学中的马尔可夫链(一种未来状态的概率只取决于当前状态的数学模型)选择音调。根据对大量音乐作品中音调之间的搭配与和谐关系的分析,可以发现其中的规律,比如当前的音调是C,则下一个音调为G的概率为70%,为E的概率为15%,为F的概率为10%,为A的概率为5%,不同的概率由不同的马尔可夫链模型所决定。{14}这样,程序就可以通过三个步骤生成乐曲,首先是建立规则表和数学模型,然后是随机生成单个音符,最后是根据规则表和数学模型测试其和谐度,“通过不断重复生产和测试环节,越来越多有效音符被选择出来并组成了完整的乐曲”。{14}如果将程序这种反复试错,筛选合格组合的过程称为“自我学习”,则它仍然是依据算法进行的有规律的运算过程。虽然因其初始因素(如第一个单音符的生成)具有随机性,因此程序设计者也无法准确预测最后的结果,但在重复该运算过程并输入相同初始数据的情况下,同一程序得出的结果是有限的。这正是人工智能生成内容的本质特征——是计算而非创作。{11}398-389一篇文章在描述“机器作曲”时,其标题恰如其分地说明了一这点——《算出音乐来》。{14}
由此可见,具有“学习”能力的人工智能与以往机械式处理手段的不同,在于能够根据算法分析数据并找出最优策略,再采取该策略产生最佳结果,而不是仅仅应用算法直接获取结果。但是,对最优策略的确定仍然是基于算法产生的,而且策略本身属于方法,落入了思想的范畴,不可能作为作品受到著作权法的保护。算法和计算机程序设计者也许无法准确地预测计算机运行程序并分析数据后能得出怎样的最优策略,但不同的计算机运行同一程序,根据同一算法分析相同数据,得出的最优策略是相同的或有限的,而不同的计算机对相同的数据采取该最优策略,获取的结果也是相同的。换言之,对相同的原始材料,人工智能运用相同的策略进行处理,其结果具有高度的可重复性,这正说明对策略的应用不具备个性化的特征。与之形成鲜明对比的是,不同作者即使遵循同一创作理念、原则或规律,使用相同原始素材创作的作品也会在内容上五花八门。这是因为创作理念、原则或规律仅仅属于创作背景或外部限定,它无法决定作品的内容。有时,作者打破惯例,不按常规的创作还会产生更佳的艺术效果。正因为是作者独特的个性和情感,甚至是稍纵即逝的灵感,而不是创作理念、原则或规律驾驭着创作活动,如果作品内容较为复杂,甚至连作者本人在遗失作品的唯一载体之后,往往也难以重新创作出相同的内容。在提出著名的“图灵测试”的论文中,阿兰•图灵引述了杰弗里•杰斐逊(GeoffreyJefferson)教授对“机器会思考”的怀疑:
直至一部机器因思考和情感而不是通过随机排列符号而写出一首十四行诗或谱写一部协奏曲,我们才能认同机器等于同大脑[15]。
从上述分析中可以得出一个结论,目前的“人工智能”本质上是应用“人”的“智能”,其生成内容的过程并不涉及创作所需的“智能”,因此并不能成为受著作权法保护的作品。日本政府设立的“知识产权战略本部”在一份报告中指出“一般认为,人工智能自动生成的内容不属于著作权的客体”,其原因就在于“人工智能自动产生的创作物(类似作品的信息),并非(日本)《著作权法》第2条第1项规定的‘表现思想或者情感的作品’,也就根本不存在对其享有的著作权”[16]。澳大利亚司法部下设的“澳大利亚版权审议委员会”曾在有关计算机软件版权保护的报告草案中建议澳大利亚《版权法》增加“计算机生成的作品(computer-generatedwork)”的作品类别[17],但遭到了“澳大利亚版权委员会”的反对,理由之一正是此类内容无法达到独创性的要求[18]。“澳大利亚版权审议委员会”接受了该观点,在其发布的最终报告中,不再建议将诸如由报告撰写程序(类似于前文提及的自动新闻写作程序)生成的内容作为作品保护,而是建议创设邻接权的客体以提供保护,其用语也从“计算机生成的作品”改为“计算机生成的内容(com-puter-generatedmaterial)”[19]。
在最早对“计算机生成的作品”进行规定的英国《版权法》中,“计算机生成的作品”被认定义为“在该作品没有作者的情况下,由计算机生成的作品”[20]。该法第9条第3款规定:“对(由计算机生成的)作品的创作进行了必要安排的人”被视为“作者”[21]。然而,世界知识产权组织的报告对此指出:该规定看来是建立在一个假设之上,即计算机可以在没有任何人类创造性贡献的情况下“创作”文学艺术作品,但是否真正存在能够不借助任何人类创造性贡献而创作出“作品”的计算机“智能”,则是存疑的[22]。英国本国学者对此也持怀疑态度,认为“很难理解此种成果如何能够符合既有的独创性标准,特别是该标准要求作品应当是‘劳动、技巧或判断’的产物,更不用说符合欧盟有关要求作品是‘作者自己的智力创作成果’的要求了”[23]。同时,将该条适用于上文提及的机器人写作、作画和作曲等情形,也会遇到难以克服的障碍。试问谁对“由计算机生成的作品”的“创作”进行了必要安排?是相关计算机程序的编写者还是该机器人或程序的使用者?如果是前者,则其获得了对计算机程序和运行该程序生成结果的双重权利,属于重复获利,有失公平。如果是后者,则意味着只要选择了某机器人或运行了某一程序就可获得著作权[24],显然是不合理的。
迄今为止,也只有一个涉及计算机游戏的英国案例适用了上述条款。在该案中,原告起诉被告抄袭了自己的计算机游戏,并主张计算机运行过程中呈现的画面属于“计算机生成的作品”,而原告的程序员则应被视为该作品的作者。对此,英国法院认为:
组成(电子游戏画面)的各帧画面都是计算机生成的作品,为创作作品进行必要安排的工作是由琼斯(原告的股东兼程序员,笔者注)承担的,因为他设计了游戏各要素的外观,还设计了游戏的规则和逻辑,由此产生了游戏的每一帧画面,他还编写了计算机程序。在这种情况下我确信琼斯对作品的创作进行了必要的安排,应当根据(英国《版权法》)第9条第3款的规定被视为作者[25]。
显然,在该案法官的心目中,虽然程序员编写了计算机程序,也设计了游戏中人物、道具等各要素的画面,甚至是单幅的静止画面,但游戏在运行过程中形成的连续画面,并不是程序员直接创作的作品,而是“计算机生成的作品”,程序员并不是真正的作者[26],只能被“视为”作者。这样的判断实不足取,在游戏运行时,屏幕上显示的所有连续画面,都是计算机程序根据玩家的操作调用预先输入的各要素图像,并加以组合形成的。虽然连续画面的内容会随着不同玩家的不同选择有些区别,但不可能超越程序员对游戏进程的预先设立的各种要素的组合,因此当然属于由程序员等作者们创作的作品,计算机只是在技术意义上“生成”了它们[27]。我国和其他国家的司法实践也认为计算机游戏画面是人创作的作品,并未将其认定为“计算机生成的作品”[28]。如浦东新区法院就曾认定“游戏画面由游戏引擎按照既定规则调取开发商预先创作的游戏素材自动生成……(该)连续画面构成类电影作品,其著作权属于游戏开发商”[29],“网络游戏中连续活动画面因操作不同产生的不同的连续活动画面,其实质是因操作而产生的不同选择,并未超出游戏设置的画面,不是脱离游戏之外的创作”[30]。由此可见,英国《版权法》对所谓“计算机生成的作品”的定义和权利归属的规定,实不足为我国所仿效。
三、区分对人工智能生成内容的实然定性与应然定性
综上所述,对于人工智能生成的内容而言,即便在表现形式上与人类创作的作品几无差别,如机器人生成的人像素描和财经报道等,由于是应用算法、规则和模板的结果,其生成过程没有给人工智能留下发挥其“聪明才智”的空间,不具有个性特征,该内容并不符合独创性的要求,不能构成作品。
上文在讨论人工智能生成内容的定性时,暂时排除了主体的因素。并得出了此类内容不构成作品的结论。现在再考虑主体因素,也可以从不同的角度得出相同结论。著作权法的立法目的是鼓励作品的创作[31]。实现鼓励效果的途径,则是通过赋予作者复制权、发行权和信息网络传播权等一系列权利,使作者能够在法律上制止他人未经许可以复制、发行、信息网络传播等方式利用作品,确保他人在利用作品时经过作者许可并向作者支付报酬,从而使作者从创作中获得应有的回报,能够体面地生活,保持继续创作的动力,并为志在创作的年轻一代产生良好的示范效应。那么,谁能在这套精心设计且十分复杂的法律机制之中受到鼓励呢?当然只可能是人。郑成思教授对此指出:不论何种人持何种看法,在认定版权制度的本质是鼓励用头脑从事创作之人这一点上,意见是一致的。{15}31-32无论是动物还是机器,都不可能因著作权法保护作品而受到鼓励,从而产生创作的动力。正因为如此,“作品是作为有血有肉的自然人对于思想观念的表达;……由非人类‘创作’的东西不属于著作权法意义上的‘作品’”。{16}29我国《著作权法》第2条将享有著作权的主体限定为“中国公民、法人或者其他组织”和符合条件的“外国人、无国籍人”,印证了著作权法的立法目的。美国版权局要求被登记的作品“必须由人类创作”,并将“在没有任何源于人类作者的智力投入或参与的情况下,由机器以及随机或自动运行的纯粹机械过程生成”的成果排除出可登记范围[32],美国法院认定“猕猴自拍照”不构成作品[33],也鲜明地反映了这一立场。因此,人工智能生成的内容不构成作品,属于法律对其的应然定性。
然而,对于那些由人工智能生成的,但在表现形式上与人类创作的作品类似的内容而言,如果人工智能的操控者并未披露其真实的生成过程,相反,此人还在该内容上署名,对外表明自己是创作者,则由于署名有推定作者身份的法定效力[34],除非质疑者有相反证据证明该内容源自人工智能对算法、规则和模板的运用,则在实然状态下,该内容仍然会被认定为作品并受到著作权法的保护,人工智能的操控者也将被认定为作者并享有一系列著作人身权和著作财产权。日本“知识产权战略本部”在否定了所谓“人工智能创作物”能作为作品受现行日本《著作权法》保护的可能性之后,又认为“然而,人类的创作物和人工智能创作物在外观上通常难以区分。基于此,除去明显是人工智能创作物的情形,应当与人类的创作物进行相同的对待。……人工智能创作的音乐、小说等内容也应当受到著作权的保护”[35],这实际上是指出了有别于法律规定的实然状态。
这种情况的出现,说明人工智能给著作权保护增加了一些复杂性,但尚不足以对著作权制度形成真正的挑战,因为它本质上属于证据规则的范畴,在以往也并不罕见。著作权法对作品构成的相关规定并不会因此改变,也无需改变。在前文提及的“猕猴自拍照案”中,如果摄影师发布照片时声称是自己拍摄,由于现场并无他人,猕猴当然也不会开口反驳,这张猕猴露齿微笑的照片当然会被认定为是摄影师的作品,真相可能永远无人知晓。同样,诗人晚年将其早年不为人知的诗歌投稿刊出,没有读过早年相同诗歌的人们都会认为诗人创作了新作品。但这并不意味着著作权法承认动物的“智力成果”是作品,或者抄写之前的诗歌属于创作。是信息的不对称造成了在作品认定方面应然状态与实然状态的对立。
那么,对于在应然状态下不构成作品的由人工智能生成的内容,能否可视人工智能的研发者或使用者为创作者呢?有学者主张,可比照著作权法中视法人为作者和将著作权归属于投资者的规定,“将人工智能的所有者视为作者”。{17}对此需要指出的是,著作权法的上述规定,是以相关内容已构成作品为前提的。如果内容产生的过程并不属于创作,相关内容并不是作品,又谈何通过法律的拟制将未参与创作者视为作者呢?
结语
正如莎士比亚在《哈姆雷特》中所言,“人是宇宙的精华,万物的灵长”。{18}329人的创造性思维,人的灵感与个性,是作品创作中不可或缺的因素,“那些最具特色、最有生命力的成功之作往往只产生在难得而又短暂的灵感勃发的时刻”[36]。迄今为止的人工智能只能按照人类预先设定的算法、规则和模板进行计算并生成内容。无论这种过程多么复杂,其结果多么接近作品,终究只是如来佛手中的孙悟空,无法突破如来佛的五指手掌。因此,一篇研究人工智能生成内容著作权保护的文章所称的“机械在作品创作过程中发挥的作用——尤其是对独创性部分所作的贡献——日益超过人类,甚至完全取代人类的精神劳动”,{19}恐怕仍然是对未来的幻想,而不是现实。当然,如果这一天真的到来,面临挑战甚至威胁的,将是整个人类社会。即使不去想象此类人工智能是否会演化成科幻电影《终结者》中的杀人机器,也应考虑一本世界著名计算机教材对此表达的忧虑:“看来人工智能领域的大规模成功——创造出人类级别乃至更高的智能——将会改变大多数人类的生活,我们工作和娱乐的真正本质将会被改变,我们对于智能、意识和人类未来命运的观点也会如此。在此层次上,人工智能系统会对人类的自主性、自由乃至生存造成更为直接的威胁”。{20}878与之相比,著作权制度受到的冲击大约可以忽略不计了。
(本文责任编辑焦和平)
【注释】基金项目:国家社会科学基金重大项目(14ZDC020)“互联网领域知识产权重大立法问题研究”
作者简介:王迁(1975—),男,上海市人,华东政法大学教授、博士生导师,法学博士。
[1]参见《为什么人工智能(AI)如此难以预测?》,http://tech.qq.com/a/20141229/006887.htm,2017年4月2日访问。
[2]TelstraCorporationLtdvPhoneDirectoriesCompanyPtyLtd,〔2010〕FCA44,para.5.
[3]JaniMcCutcheon,TheVanishingAuthorinComputer-GeneratedWorks:ACriticalAnalysisofRecentAustralianCaseLaw,36Melb.U.L.Rev.915,924-927(2013).
[4]美国联邦最高法院早在1991年的Feist案中,就已经认定这样的电话号码簿并不属于美国《版权法》保护的作品,SeeFeistPublicationsv.RuralTelephoneService,499U.S.340(1991).在我国发生的“族谱案”中,原告辛苦收集了某一家族族人的姓名并编成了族谱。法院同样认为,“族谱资料虽然记载了在若干自然村屯上曾经生息繁衍的祖先及其后代的名字,并对这些名字按辈分大小进行编排,但这种编排不具有独创性”,因此判决涉案族谱并不构成作品。参见广西壮族自治区河池市中级人民法院民事判决书(2004)桂民三终字第3号。
[5]相关新闻报道参见:《效果惊艳你应该试试Prisma这款软件》,http://mobile.163.com/16/0801/09/BTCHAI79001168BQ.html,2017年4月2日访问;钱好:《一键“变身”毕加索“文艺心”修图软件为何走红?》,《文汇报》2016年8月2日第10版;刘燕秋:《Prisma走红人工智能试水图像处理》,《21世纪经济报道》2016年8月17日第16版。
[6]参见刘霞:《艺术或不再是人类专属——下一个毕加索可能是机器人》,《科技日报》2016年4月3日第2版;《德国研制出绘画机器人》,http://scienceblog.blog.163.com/blog/static/1896850072012122112947126/,http://tech.qq.com/a/20141229/006887.htm,2017年4月3日访问。
[7]《著作权法实施条例》第4条第(八)项。
[8]参见《你还在听人类的歌?机器人创作天团都来了》,http://mt.sohu.com/20161130/n474580792.shtml,2017年4月3日访问。
[9]在司法实践中,已有法院确认用新创造的记谱方法对已有音乐记谱,不能形成作品,参见北京市第一中级人民法院民事判决书(2009)一中知民初字第9159号。
[10]这里所称的精确临摹,产生的是与被临摹的美术作品几乎无差异的结果。绘画大师也可以做到这一点,有些模仿画作的行为虽然也被称为“临摹”,但产生的结果与原画作存在明显的视觉差异,自然不在此列。
[11]参见拙作:《著作权法》,中国人民大学出版社2015年版,第22至24页,以及最高人民法院《关于范曾诉盛林虎著作权纠纷一案的复函》,1989民他字第55号。但对此学术界存在不同观点,参见郑成思:《版权法》(修订本)中国人民大学出版社1997年版,第161页,173页;杨明:《文字作品v.美术作品:对几个基本理论问题的反思》,《中外法学》2009年第2期。即使承认由人进行的精确临摹可构成演绎作品,由具有人工智能的绘画机器人所作的精确临摹是否构成作品的问题,也能在后文的讨论中得以解决。
[12]典型案例见“高丽娅诉重庆市四公里小学案”,重庆市第一中级人民法院民事判决书(2005)渝一中民初字第603号。
[13]参见jfy19920503(原文未署真实姓名,只有此代号):《智能机器人来绘画,八大美院教谁去?》http://www.ithome.com/html/next/185755.htm,2017年4月10日访问。
[14]摘录其中一段如下:“首节开场之后双方杀得相当胶着,你来我往都有得分,快船在克里斯–保罗的带领下取得10分的优势,杰弗瑞•洛文吉的扣篮成功帮助掘金缩小差距,紧接着杰米尔•尼尔森、威尔森•钱德勒也为球队做了贡献,最后的混战过后,首节,快船以22–17领先。次节,快船轰出34–25的高潮,领先对手14分。第二节已经接近结束,上半场结束快船56–42暂时领先。易边再战,快船凭借一波26–19攻击波,将比分差距扩大到21分。杰弗瑞•洛文吉的投篮成功帮助掘金缩小差距,随后威尔•巴顿也为球队赢得了得分,前三节结束,快船84–65暂时领先”,参见陈玉敬、吕学强、周建设、李宁:《NBA赛事新闻的自动写作研究》,《北京大学学报(自然科学版)》2017年第2期,第217页。
[15]A.M.Turing,ComputingMachineryandIntelligence,59Mind236,445(1950).
[16]知的財産戦略本部:《知的財産推進計画2016》,第8页。http://www.kantei.go.jp/jp/singi/titeki2/kettei/chizaikeikaku20160509.pdf.2017年3月2日访问。
[17]SeeCopyrightLawReviewCommittee,DraftReportonComputerSoftwareProtection,OfficeofLegalInformationandPublishing,Attorney-General'sDepartment(1993),para.13.08.
[18]SeeAustralianCopyrightCouncil,ResponsetotheCopyrightLawReviewCommittee’sDraftReportonComputerSoftware(1993),p.18,para.96.
[19]SeeCopyrightLawReviewCommittee,ComputerSoftwareProtection,OfficeofLegalInformationandPublishing,Attorney-General'sDepartment(1995),para.13.11-13.21.
[20]TheCopyright,DesignsandPatentAct1988,Section178.
[21]TheCopyright,DesignsandPatentAct1988,Section9(3).一些以英国立法为参照的英美法系国家和地区的法中也有类似规定,如我国香港特别行政区《版权条例》第11条第(3)款;CopyrightAct1994
[22]WIPO,BCP/CE/I/2.CommitteeofExpertsonaPossibleProtocoltotheBerneConventionfortheProtectionofLiteraryandArtisticWorks,FirstSession,MemorandumpreparedbytheInternationalBureau,para.51.
[23]SeeJonathanGriffiths,LionelBently,WilliamR.Cornish,UK,§2〔b〕〔i〕,inPaulEdwardGeller(ed),InternationalCopyrightLawandPractice,MatthewBender&Company,Inc.(2015).
[24]这正是某些学者的观点,SeeJaniMcCutcheon,CuringtheAu-thorlessVoid:ProtectingComputer-GeneratedWorksFollowingIceTVandPhoneDirectories,37Melb.U.L.Rev.46,56(2013).
[25]NovaProductionsLtdvMazoomaGamesLtd,〔2006〕R.P.C.14,398-399,para.105.(NewZealand),Section5(2);CopyrightAct1978(SouthAfrica),Section1(1),indefinitionof“author”(h);CopyrightAct1957(India),section2(d)(vi).
[26]法院还否认运行游戏的玩家是作者,因为他们既没有投入艺术性的技巧和劳动,也没有对各帧画面的创作进行必要的安排,同上注,399,para.106.
[27]即使是认同英国《版权法》该规定的学者,也认为该判决的观点存疑,因为“组成(电子游戏画面)的各帧画面都是组合自琼斯创作的单幅图片,是他的心灵和意志决定了由计算机生成的组合画面的形状”。JaniMcCutcheon,CuringtheAuthorlessVoid:ProtectingComputer-GeneratedWorksFollowingIceTVandPhoneDirectories,37Melb.U.L.Rev.46,66(2013).
[28]如美国法院认为游戏运行过程中出现的连续画面属于“视听作品”,游戏设计者当然是作者。典型案件如SternElectronics,Inc.v.Kaufman,669F.2d852(2dCir.1982);Atari,Inc.v.NorthAmericanPhilipsConsumerElectronicsCorp.,672F.2d607(7thCir.,1983);MidwayMfg.Co.v.ArticIntern.,Inc.,704F.2d1009(7thCir.1983);AtariGamesv.Oman,888F.2d878(D.C.Cir.1989)等。
[29]上海市浦东新区人民法院民事判决书(2015)浦民三(知)初字第529号。
[30]上海知识产权法院民事判决书(2016)沪73民终190号。
[31]《著作权法》第1条即开宗明义地规定:“为……鼓励有益于社会主义精神文明、物质文明建设的作品的创作……根据宪法制定本法。”
[32]SeeUSCopyrightOffice,CompendiumoftheU.S.CopyrightOfficePractices(3rdEdition),§313.2.
[33]SeeNarutov.Davidjohnslater,2016U.S.Dist.LEXIS11041.
[34]《著作权法》第11条第3款规定:“如无相反证明,在作品上署名的公民、法人或者其他组织为作者。”
[35]知的財産戦略本部:《知的財産推進計画2016》,第8页http://www.kantei.go.jp/jp/singi/titeki2/kettei/chizaikeikaku20160509.pdf.2017年3月2日访问。
[36]〔奥〕斯蒂芬•茨威格著,舒昌善译,《人类的群星闪耀时:十四篇历史特写(增订版)》,三联书店2015年版,序言第1页。在该书《亨德尔的复活》一章中,茨威格生动地描述了曾一度丧失创作的灵感,如同行尸走肉的作曲家亨德尔,在看到了友人撰写的清唱剧《弥赛亚》歌词后激情勃发,创作《弥赛亚》乐曲的过程。我们难以想象,人工智能如何取代亨德尔创作出天才之作《弥赛亚》。
【参考文献】{1}蔡自兴,徐光福.人工智能及其应用〔M〕.北京:清华大学出版社,2004.
{2}蔡自兴,等.人工智能及其应用〔M〕.北京:清华大学出版社,2016.
{3}任翀.机器人写稿?是大数据分析!〔J〕解放日报,2015-09-11(8).
{4}刘燕秋.Prisma走红人工智能试水图像处理〔N〕.21世纪经济报道,2016-08-17(16).
{5}赵陈婷.Prisma爆红这么久现在才有中国追随者〔N〕.第一财经日报,2016-08-9(A08).
{6}倪菲,付庄,曹其新,赵言正.肖像漫画绘制机器人技术研究〔J〕.自然杂志,2007,(4):212.
{7}孟盼盼.肖像绘制机器人技术研究〔D〕.中国科学技术大学硕士论文,2011.
{8}技术宅.自动写作语言大师揭秘〔J〕.电脑爱好者,2015,(9):55-58.
{9}陈玉敬,吕学强.WBA赛事新闻的自动写作研究〔J〕.北京大学学报(自然科学版),2017,(2):216.
{10}“阿尔法狗”之后的科技征途——眺望人机共存时代〔N〕.经济参考报,2016-03-18(5).
{11}Haykin.神经网络与机器学习〔M〕.申富饶.等译.北京:机械工业出版社,2011.
{12}吴月辉.“阿法狗”为什么厉害〔N〕.人民日报,2016-03-21(20).
{13}周志华.机器学习〔M〕.北京:清华大学出版社,2016.
{14}李星燕.算出音乐来〔J〕.新发现,2009,(8):98.
{15}郑成思.版权法(修订本)〔M〕.北京:中国人民大学出版社,1997.
{16}李明德,许超.著作权法(第二版)〔M〕.北京:法律出版社,2009.
{17}熊琦.人工智能生成内容的著作权认定〔J〕.知识产权,2017,(3):3-8.
{18}〔英〕莎士比亚.哈姆雷特〔M〕//莎士比亚喜剧悲剧集,北京:译林出版社,2010.
{19}曹源.人工智能创作物获得版权保护的合理性〔J〕.科技与法律,2016,(3):488-508.
{20}StuartJ•Russell,PeterNorvig.人工智能:一种现代的方法(第3版)〔M〕.殷建平,等译.北京:清华大学出版社,2013.
【期刊名称】《法律科学》【期刊年份】2017年【期号】5
陈兵:ChatGPT生成内容是否为“作品”版权属于谁丨法经兵言
近期,由OpenAI开发的聊天机器人ChatGPT火爆全网,再次让人工智能生成物版权归属问题成为焦点。
其实早在ChatGPT之前,人工智能生成内容(AIGC)能否享有著作权就引发各界讨论,但由于早期人工智能受限于算法算力瓶颈,其生成的内容往往只能根据算法提供的模板生成内容,开放性、包容性还有待提升,无法较好地完成“创作”,存在可读性不强、拼写错误、缺乏逻辑等缺陷,因此此前AIGC的版权问题未受到过高的关注。
随着自然语言处理、深度学习、机器学习、深度神经网络等技术的发展,以ChatGPT为代表的以人工智能技术驱动的自然语言处理工具,加上超大规模算力的支撑,使得能通过学习和理解人类的语言来进行对话或写作,而非简单地从某个模板中选择内容,可以根据使用者提出的问题或者要求,进行内容创作。
由于ChatGPT生成内容已具备一定的可读性、逻辑性,目前已有用户使用该工具撰写论文、写代码、写课程作业等,由此引发对人工智能生成物版权问题的新一轮讨论,ChatGPT生成的论文等作品版权属于谁?是属于ChatGPT,开发者OpenAI,还是用户自己?
是否构成著作权法意义上的“作品”
在探讨版权归属之前,必须先明确ChatGPT的生成内容是否属于著作权法意义上的“作品”,若不构成“作品”,则意味着ChatGPT的生成内容不受著作权保护,也无进一步探讨其版权归属的必要。
我国著作权法第三条明确规定:“本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。从中可以提炼出两个要件:一是具有独创性,二是以一定形式表现的智力成果。其中,“具有独创性”是实质性要件,而“以一定形式表现的智力成果”可以视为一种形式要件。
由于ChatGPT能够响应用户输入并生成类似人类的文本,在外观上符合文字作品的表现形式。因此,判定ChatGPT生成内容是否构成“作品”的关键,在于判定其是否具有“独创性”。对“独创性”的判定可以将其拆分为“独”和“创”两方面进行分析。
其一是“独”,即判定ChatGPT生成内容是否满足“独立完成”的要求。虽然用户只要提出问题或者下达指令,ChatGPT在无需人工干预或者辅助的情况下,即可“独立”生成文字内容,但实际上,不论是从技术层面还是从法律层面看,ChatGPT自身暂时都难以达成“独立完成”的要件。
从技术层面看,ChatGPT使用一种称为人类反馈强化学习的机器学习进行训练,可以模拟对话、回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。为了创建强化学习的奖励模型,OpenAI收集了比较数据,其中包含两个或多个按质量排序的响应模型。模型会根据提示生成多个输出,训练师将ChatGPT的回复与人类的回答进行比较,并对它们的质量进行排名,以帮助强化机器的类人对话风格。奖励模型将自动执行最后一个训练阶段,使用排名后的数据训练。可见ChatGPT运行的实质仍然是建立在“人工标注+机器学习”的基础上,可谓有多少“智能”,其背后仍然有多少“人工”,ChatGPT作为“主体”很难说具有了法律上的独立性品格。
从法律层面看,“独立”完成的主体是自然人或法人,人工智能在著作权法、民法等法律中的主体地位尚未得到承认,对于完全独立于人类参与而生成的内容,通常不能认为其满足了“独立完成”的要件。
ChatGPT作为人工智能体无法达成著作权法中“独立完成”的要件,是否意味着其生成内容不能视为“作品”呢?其实不然,ChatGPT虽不具备独立的法律人格,但可以寻找其背后具有“法律人格”的自然人或法人。这一点在我国及其他大陆法系和英美法系国家的司法实践中皆有所体现。以法国为代表的大陆法系国家认为,虽然人工智能生成内容的直接创作者不是自然人,但是可以联系到人工智能背后的创作者、开发者。英美法系则认为人工智能是自然人创作的工具,其生成内容的作者是付出智力劳动、进行必要安排的自然人。因此,即便ChatGPT本身暂不能达成“独立完成”的条件,也并不影响其生成内容的“可作品性”。
其二是“创”,即判定ChatGPT生成内容是否满足“创造性”要件。在国内外司法实践中,判断一个作品是否满足创造性要件,需判定其内容与已有作品是否存在差异,或具备最低程度的创造性。对此需要分两种情况分析:当ChatGPT生成的是单纯事实消息或对已有作品的复述等内容时,不满足“创造性”要件;当ChatGPT生成的内容在一定程度上区别于已有作品时,则要判定是否具备“最低程度的创造性”。由于ChatGPT生成的内容具备可读性、逻辑性,人们在多数情况下已无法区分为人类创作还是机器生成,即具备“不可区别性”,可视为其已满足“创造性”的基础与可能。
人工智能生成物具有的“独创性”也在我国司法判决中得到法院支持。例如,在AI版权归属第一案——腾讯诉网贷之家案中,对于涉案由智能写作辅助系统Dreamwriter软件自动生成文章是否具有独创性的问题,法院认为涉案文章内容结构合理、表达逻辑清晰,具有一定的独创性,即其内容生成物可认定为“作品”。
综上,ChatGPT生成内容在一定条件下能够满足独创性要件,构成著作权法意义上的“作品”,受到著作权法的保护。
ChatGPT生成的作品属于谁
在ChatGPT生成内容可构成著作权法意义上“作品”的情况下,需探讨该“作品”的权利归属,即谁才是该“作品”的“作者”。对此,需分别判断ChatGPT、开发者OpenAI以及用户是否享有“作品”的权利。
其一,ChatGPT作为人工智能机器人是否享有其生成内容的“著作权”。目前,人工智能机器人的法律主体地位尚未得到我国相关法律的承认。根据著作权法第二条,只有自然人、法人以及非法人组织享有作品的著作权,人工智能机器人未在其列。而且,著作权法目标是通过授予作者专有权来鼓励创新,这一制度的前提是:如果创新不需要激励就能产生,那么权利就不需要被保护。ChatGTP作为智能聊天机器人,虽然能够生成类似人类的文本,但并没有真正具备自我意识,它只是根据用户的提问或相关指令生成相关内容,即其“创作”并不需要著作权的激励就能产生。因此,虽然ChatGPT生成的内容可以视为“作品”,但无需赋予其著作权以激励“创作”。
其二,OpenAI作为开发者是否享有生成内容的“著作权”。当前ChatGPT作为人工智能机器人不能成为著作权的拥有者,但OpenAI作为法人在现行法律上拥有享有著作权的主体资格。且ChatGPT生成内容所蕴含的“创造性”是能够“连接”到其拥有者OpenAI的,ChatGPT之所以能够生成“作品”,缘于OpenAI创建的强化学习奖励模型,收集比较数据,并使用收集到的数据不断训练和调整模型,最终生成具有可读性和逻辑性的类似人类的文本。从这个层面看,OpenAI为ChatGPT生成“作品”付出了大量的智力劳动,故OpenAI享有著作权也就可以理解了。
著作权法目标是通过授予权利人专有权来鼓励创新,虽然ChatGPT无需激励即可生成内容,但只有让OpenAI获得“创作”的激励,才能推动其不断提升优化和训练ChatGPT的算法模型,提升生成内容的质量。
其三,ChatGPT的用户是否享有生成内容的“著作权”。从表面上看,ChatGPT生成的内容,比如一段文字甚至一篇文章,是源于用户直接下达的指令生成,但并不意味着用户因此获得ChatGPT生成内容的著作权。若用户仅是下达简单指令或者提供了一些关键词,这时基于ChatGPT生成内容仍主要源于开发者OpenAI提供的模型,故不能视为用户独创,用户并不能因其操作ChatGPT而获得生成内容的著作权。但若用户是提供一段由其独创的文章,并下达指令让ChatGPT修改,此时ChatGPT仅起辅助作用,没有实质性改变文章蕴含的思想或情感表达,用户仍拥有经ChatGPT修改生成后文章的著作权。
在司法判决中,不少法院也倾向于将人工智能背后的自然人或法人视为人工智能生成内容著作权的所有者。在腾讯诉网贷之家案中,法院在承认由Dreamwriter软件自动生成的文章构成文字作品的基础上,并没有将软件视为该文章的作者,而是认为从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,所以原告拥有该文章的著作权。在2000年法国“人工智能作曲案”中,法院认为由人工智能帮助创作的歌曲,只要有自然人的介入,自然人选择引导了作品创作,那么该人工智能创作物的著作权归属于其背后的自然人。
可见,ChatGPT生成内容在具有“独创性”的情况下属于著作权法意义上的作品,而其生成内容的著作权归属,则需根据生成内容中自然人或法人付出智力劳动的情况进行判定。
理性看待AIGC版权问题
以ChatGPT为代表的AIGC工具应用及产业发展具有巨大的前景,赋予AIGC开发者或拥有者版权,能够在一定程度上产生激励效果,促进AIGC工具及相关技术的创新发展。当然,AIGC开发者在获得权利的同时,也需要承担相应义务,譬如,需规范数据采集行为,避免侵犯他人的著作权,同时还需不断改进算法模型,避免生成存在歧视性或者误导性的信息。
此外,为了更好地规范AIGC在学术界、教育界等领域的使用,AIGC开发者也应适当增加AIGC内容的可识别标识或者信息,避免出现滥用误用而产生损害的情况。
同时,对于AIGC领域的发展要坚持发展与规范并重。在发展层面,需加大对AIGC领域的政策、财政支持,明确允许并规范AIGC作为辅助工具参与科学研究和艺术创作等的态度与边界,完善AIGC内容的著作权保护,以开放、科学、严谨的态度看待AIGC技术及产业的发展;在规范层面,需加快出台人工智能生成物著作权相关规定,加强对AIGC内容生成全过程的监管,包括数据来源端、内容生成端、消费端及建立健全违法和不良信息识别机制、过滤机制、辟谣机制及矫正机制等,对输入数据和合成结果进行审核,夯实算法开发者、应用者相应法律责任。
(陈兵系南开大学法学院副院长、教授,南开大学竞争法研究中心主任,南开大学数字经济交叉科学中心研究员;林思宇系南开大学法学院博士生)
ChatGPT生成的内容是作品吗著作权归谁
原创羊城晚报羊城晚报
“最近ChatGPT非常火爆,很多专家学者围绕着ChatGPT的发展,看到很多知识产权保护的问题。”在2月13日广东高院举行的“加强知识产权司法保护、护航广东高质量发展”座谈会上,一位企业界人士发言时提到了人工智能生成物的著作权保护问题。
ChatGPT“走红”之际,人们发现它能做的事实在太多:写论文、写文案、写作业、写代码、写新闻、写评论……一个个拷问当下的问题随之来临:如果它仅仅是辅助工具,为什么被很多领域禁用?如果它能生产作品,著作权归谁,现有的法律体系准备好了吗?
图/视觉中国
ChatGPT生成的内容是作品吗?
早在计算机发明之初,关于人工智能所产生的内容能否享有著作权的讨论就已经开始了。从1964年开始,美国版权局就连续多年在年报中提及计算机作品对著作权制度带来的挑战,并尝试探讨计算机作品、计算机能否享有作者权等问题。
时至今日,计算机技术飞速发展,人工智能更新迭代,如今已发展出“能写会道”的ChatGPT。在许多学习、工作的领域出现了人工智能解决方案:有的中学生直接复制答案交作业,有的大学生直接用它生成论文,有的记者输入新闻要素一篇新闻稿就出来了……
与此同时,它对现有的著作权制度的冲击已经显现:人工智能生成的内容,著作权归谁?如果它仅仅是人类的辅助工具,为什么被很多领域禁用?如果它能生产作品享有著作权,现有的法律体系准备好了吗?
“需要明晰的是,此处谈及的‘作品’是指著作权法语境下的作品,而不是社会大众泛化理解下的作品。”对外经济贸易大学法学院助理教授、北京大学粤港澳大湾区知识产权发展研究院研究员徐美玲告诉羊城晚报全媒体记者。
徐美玲介绍,根据著作权法的基础理论和相关规定,著作权法所保护的作品需要满足一定的条件,即文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。根据这一规定,即便是ChatGPT生成的内容,也并非所有均可视为作品,诸如对“著作权法是哪一年颁布的”这样简单问题的回答,属于现有知识的原样呈现,是应该被排除在“作品”之外的。
西南政法大学民商法学院副教授郑志峰接受羊城晚报全媒体记者采访时说:“根据我国著作权法的规定,作品认定的关键在于独创性,但何为独创性存在不同的理解,一种是主观主义,强调作者的个性化创作过程;一种是客观主义,强调作品本身具备一定的创造性、区分性。如果从客观主义出发,ChatGPT生成的许多内容可以被认定为具有独创性,进而属于作品。”
两宗判决背后的司法信号
不过,一个事实是,我国司法实践对于人工智能自动生成的文章是否构成作品,已进行了一些探索。法院的基本观点是,司法争议的人工智能的法律主体资格有待法律予以明确规定,但对于人工智能自动生成的相关内容还需要加以保护。
2019年5月,北京互联网法院一审公开宣判北京菲林律师事务所诉北京百度网讯科技有限公司侵害署名权、保护作品完整权、信息网络传播权纠纷案。法院在该案中认定,计算机软件智能生成的涉案文章内容不构成作品,但同时指出其相关内容亦不能自由使用。其理由是:根据现行法律规定,文字作品应由自然人创作完成。
深圳市南山区法院2020年判决的腾讯诉盈讯科技侵害著作权纠纷案,是我国首例人工智能生成文章作品纠纷案,它提供了另外一种视角。
2018年8月,腾讯公司在其网站上首次发表了标题为《午评:沪指小幅上涨0.11%报2671.93点通信运营、石油开采等板块领涨》的财经文章,末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。同日,盈讯科技在其运营网站发布了相同文章。
腾讯公司认为,涉案文章作品的著作权应归其所有,盈讯科技的行为侵犯了其信息网络传播权并构成不正当竞争。2020年1月,深圳南山区法院审理认定,涉案文章属于我国著作权法所保护的文字作品,是原告主持创作的法人作品。
在中国政法大学法律硕士学院副教授陶乾看来,上述第一个判决是数据库自动生成的分析报告,法院认定不构成作品,但是有保护的价值,本判决的缺憾是,未能详细地阐述,为什么在有保护的价值的情况下,本案要适用著作权法进行保护。第二个判决认定构成作品,属于腾讯公司的法人作品,本判决实际上是将Dreamwriter作为一种创作工具,在人工智能技术不断发展、愈发智能化的趋势下,人工智能已经不仅仅是工具了。
“总的来说,司法实践越来越重视人工智能生成物的保护,逐渐放宽对作品的认定,但如何认定著作权人以及相关的保护规则尚缺乏清晰的规则。”郑志峰说。
人工智能生成物的著作权归谁?
北京航空航天大学法学院教授龙卫球在腾讯诉盈讯科技侵害著作权纠纷案判决后点评说,人工智能技术和产业的迅猛发展,对现有法律体系特别是著作权保护体系提出了巨大挑战,其中人工智能能否成为著作权主体,人工智能生成的内容能否构成著作权客体的作品,在国内外存在广泛争议。
人工智能能否具有独立的法律人格,成立私法上的民事主体资格,需要国家法律的明确规定或认可。
郑志峰表示,根据我国著作权法,著作权的归属,主要包括作者和其他主体。作者指的是创作作品的自然人,但对于ChatGPT不太适用,一方面,ChatGPT并非民法上定义的自然人;另一方面,使用ChatGPT的用户虽然是自然人,但其通常只是简单的提问或发出指令,并没有创作行为。
基于此,对于ChatGPT生成的作品到底由谁作为著作权人成为难题,学说上存在不同观点。
徐美玲提出:“既然ChatGPT生成的内容具备‘可作品性’,有可能享有著作权,那么其权利人如何界定?我认为,其背后的设计人、开发者或者投资方等享有控制权的主体均可能成为著作权人,具体如何确定,可以通过合同机制来确定。当然,‘权利-义务-责任’一体,成为著作权人,同时也应当对所生成的内容负责,如果存在侵害现有作品著作权,或者其他违法行为,同样应当由著作权人来承担相应责任。”
徐美玲说:“社会大众可能还存在一个疑问,在ChatGPT‘创作’过程中,千千万万的用户通过提问的方式引导回答,那么用户是否也付出了劳动,也参与了‘创作’,那么权责又该如何分配?”
“我认为,‘OpenAI(即“ChatGPT所属的公司”)——ChatGPT——User(用户)’三者之间的关系可以理解为一种‘委托创作’,即用户委托OpenAI通过使用其享有的ChatGPT来进行创作,那么著作权的归属即可以根据著作权法第十九条的规定来认定。”徐美玲说。
著作权法第十九条规定:“受委托创作的作品,著作权的归属由委托人和受托人通过合同约定。合同未作明确约定或者没有订立合同的,著作权属于受托人。”
ChatGPT大行其道时,一些出版物、论文开始将ChatGPT列为合著者、非第一作者,但随后遭遇了“封杀”,包括《科学》《自然》在内的大量权威期刊,都要求不能将ChatGPT列为作者。
在郑志峰看来,如果人工智能模型客观上生成了大量具有独创性的作品,法律上不将其视为相应的著作权人,那么这些作品就会成为孤儿作品、无主作品,对于作品的使用势必会引发诸多纠纷。特别是当人工智能模型生成的作品具有巨大的经济价值时,更容易引发纠纷。
“当然,著作权除了对于作者进行保护外,还包括其他享有著作权的主体。虽然理论上说,ChatGPT和用户都难以称为一般意义上的作者,但法律完全可以通过拟制作者或者其他方式来确定著作权人。”郑志峰说。
现行著作权法律跟得上吗?
在徐美玲看来,应当摒弃作品必须只能由“人”来创作的理念,应该转变为作品可以“为人”而创作。人工智能生成物在本质上是人类的智力劳动成果,只是借助了人工智能这样的工具,使文学艺术领域的智力劳动科技化、规模化、智能化。
不过,为保护社会大众的知情权,徐美玲特别强调应设定标注区分的义务。她说,在我国已做出的判决中,法院就指出“从保护公众知情权、维护社会诚实信用和有利于文化传播的角度出发,应添加相应计算机软件的标识,标明相关内容系软件智能生成。”
“欧盟、美国等都有关于人工智能生成物著作权的纠纷,也出台了一些法律政策。例如,欧盟2020年出台了《关于人工智能相关知识产权问题的立法建议》,提出区分人工智能辅助人类创作和人工智能自主创作,构建不同的保护制度。”郑志峰说。
郑志峰说,我国著作权法没有对人工智能生成物的著作权问题做出明确规定,但已注意到这个问题。2020年修订的著作权法第三条将原来的“(九)法律、行政法规规定的其他作品”修改为“(九)符合作品特征的其他智力成果”,这为今后将人工智能生成物纳入作品保护奠定了基础。
正承担国家社科基金一般项目“人工智能生成内容的著作权立法研究”的陶乾向记者介绍,目前,仅有英国对计算机软件生成内容进行了规定,尚无对人工智能生成的成果如何保护的规定。未来,可以考虑通过对衍生数据提供财产权保护的方式来保护利用人工智能技术生成的内容,同时,立法也有必要对于文本与数据挖掘问题作出回应。
来源|羊城晚报、金羊网、羊城派
原标题:《ChatGPT生成的内容是作品吗?著作权归谁?》
阅读原文
人工智能“生成物”有版权吗属于谁
数字法治带来的是整个法律制度的变革。在版权保护领域、知识产权领域、反垄断领域都要利益平衡。在数字时代,成为透明人的人类将面临人权将如何保护。
如何界定与保护数字化作品的版权?
对外经济贸易大学法学院教授卢海君认为在探讨数据挖掘的过程中,怎样去解决版权授权付费的问题,并不是任何东西都是可版权的,其中包括很多数字化作品。
ChatGPT用的是全网抓取的数据,那么这些数据当中存在有版权保护的作品,和没有版权保护的作品。如果都需要通过版权这个路径来解决,就会存在很多的坎坷。
GPT所生成的内容,它的创作者是人吗?有意识吗?有思想吗?有感情吗?创作出来的东西是不是思想情感的外在表现?现行著作权法的回答仅是这个东西可能还不能够完全的嵌入到著作权法当中,可以在正确认知数据二元性基础上来寻求人工智能数据挖掘问题的解决方案。
数据具有二元性,它之上可能有个人信息、公共利益、版权保护的作品、科学的数据、商业机密等在内,都可以受到一定程度的保护。比如说专利权、商业秘密权还有版权的保护,但是它跟数据本身之间有区别,数据是它的载体。
从数据的二元性本身的认识出发,解决人工智能数据挖掘当中的问题,可能是更加可行的一个方案。从作品的版权保护的角度来去衡量这个问题很难解决,包括很多数字化作品是没有版权保护,而不是在于说数据上承载的这个作品有没有版权。
卢海君教授强调人工智能产业发展是大势所趋,不应为人工智能产业的发展设置太多的障碍,在人工智能数据挖掘的问题上,应关注数据本身,而不是数据上承载的内容,企业可根据数据的价值付费,如果想有更优质的数据,开发者可以购买各种数据包,以开发出更具有竞争力的人工智能产品。他同时建议权利人和产业界加强对技术保护措施的运用。
大模型推动下的数智化场景应用
澜舟科技创始人兼CEO、中国计算机学会副理事长周明认为,以ChatGPT为标志的大模型产品,代表着语言理解、多轮对话、问题求解进入了一个可实用的时代,有效解决了自然语言处理中任务碎片化的问题,大幅度提高研发效率,标志着自然语言处理进入工业化实施阶段。
但目前生成式人工智能产品在专业领域的落地使用并不是简单的事,在它的构想中,需要进行三个层次大模型——通用大模型、行业大模型、任务大模型的训练。生成式人工智能产品才有可能逐渐从通用走向专用,大幅度提升个人和企业的工作效率。
数传集团CEO施其明结合人工智能在数传集团发展中的一些经验和做法,谈了他对生成式人工智能版权价值的看法。
AIGC在图书的服务领域运用的场景还是非常非常多的。在各类的内容生成,用户之间的交互、机器人和人之间的交互当中,很多读者在通过智能化服务之后,会产生的后续的付费、阅读的满足感、阅读的延展性阅读,这其中的90%都是AIGC的机器人在与读者做互相的交互。
针对AIGC运用场景下的资源服务,数传集团也历史上第一份和人签的数字人的版权。当然这个版权的定义现在很不清晰,也是非常直接的版权问题。版权的价值在哪里?
伴随版权疑问,其实源于AIGC的版权的商业价值就会逐步出现。近期,日本、美国已经有专门针对元宇宙版权和数字人版权相应的采购机构,他们认为及早的布局这些版权市场对未来的价值是很强的,就像及早布置数字图书、有声图书、电影版权等……
提早布局这个版权市场,在未来生成式人工智能的版权定义清晰化之后,可以形成巨大的经济效益。
AIGC时代,开启数字版权保护新格局
从OpenAI推出的GPT系列,一直到现在GPT4.0标志性的产品出现,已经证明人工智能达到了人类的智能水平,2023年也被称之人工智能的历史性时刻。
AI技术的发展,其实对于内容产业,尤其是数字内容产业带来全新的机遇。
在整个AIGC领域,高质量的数据是AI模型的底层基石,从大数据转移到高质量数据,这是至关重要的。AIGC产生的新型内容产品过程中,AIGC模型很难去保证数据质量的准确性或者答案的准确性。
欧盟在首例AIGC的侵权案件发生之后公布了一项新的法律提案——人工智能法案,这也是全世界第一部人工智能的立法,即将在2024年正式生效。
那么如何去构建数字内容的版权保护体系?中文在线董事长兼总裁童之磊提到:首先提供高质量的数据,其次是强化版权服务,第三是构建版权保护的联盟。AI今天带来的版权挑战,既然是以技术为起因,那就应该以技术去应对,从而去解决AI产能认证的新的版权挑战。
关于AIGC和ChatGPT,从版权角度ChatGPT的训练过程使用了大量的数据和文本,清华大学新闻学院教授、元宇宙文化实验室主任沈阳认为从文本的角度走向多模态的角度,数据的预训练是第一个涉及到版权的阶段。生成的内容是需要由提示词来引导,那这个提示的版权怎么样进行保护?提示语的版权保护,未来应该也将会成为一个需要保护的领域;AIGC自己产生的数据AIGD,相当于二次数据,从一次数据到二次数据的版权保护。内容的这种一种数据的保护,其实也包括了行为数据的保护。
携手保护数字版权,开启AIGC版权保护的新的格局。进一步完善数据相关的立法,推动在现有法律框架和未来新的法律框架下的司法保护。
国际应对人工智能生成及内容版权司法保护的监管政策
鉴于人工智能技术爆发出的一个巨大的生产力,目前人工智能生成的内容占所有内容不到1%,但是有数据来预测,将在很短的时间达到10%,甚至更高。
北京互联网法院综合审判一庭副庭长朱阁结合自身的工作环境,谈了她对人工智能生成内容版权司法保护的实践与思考:通用的人工智能,可以像人一样进行感知、理解和交互,也存在人可能被塑造、被取代,社会财富分配不均衡等风险。
我国作为相对较早监管人工智能技术的国家之一,整个法律体系对人工智能技术都有相应的规制和服务管理办法。未来的发展思路促进发展同步的进行依法的治理与规范,在全球合作的法律体系下,共促发展、共护安全、共享成果。
国际上不同的国家有不同的监管政策:意大利比较明确禁止使用ChatGPT;德国、加拿大等国家也表示出于数据保护的方面的考虑,将禁止使用ChatGPT,或者采取更加严格的监管;欧盟在最新的立法草案中提出应该严格禁止对人类安全造成不可接受风险的人工智能系统,同时要求人工智能公司对它的算法保持人为控制提供技术文件,并且要为高风险应用建立风险管理系统;美国在今年1月份发布的一个人工智能的风险管理框架,实际上也是一个发展和治理的这么一个思路。
那么,关于人工智能生成内容是否能够获得版权保护,具有两种观点,一种是不能构成作品,是从人工智能生成物的过程来进行分析,从机器属性和人在其中的参与程度进行的分析,还有认为它可以纳入临界权的制度进行保护。
比如澳大利亚的一份报告认为计算机生成的内容无法达到独创性的要求,只能作为临界权的客体进行保护。日本认为它是作为一个道具被使用,所生成的内容不是日本著作权法规定,就不存在对它享有著作权。
第二个观点是认为人工智能生成物只要在外在表达形式上与人类创作的作品一致。大模型所生成的内容,它显然在表达上与人类基本是一致的,就可以作为作品来进行一个保护。
中国科学院大学知识产权学院副教授、中国科技法学会人工智能法专委会执行主任刘朝分享了对国外生成式AI训练内容相关版权诉讼的思考。
现在案例中因为新技术出现的时候,关于法律能够对现有的技术规制多少?核心的问题就是生成出来的训练数据中包含未经许可的作品或片段,所以才会产生诉讼。针对这样的情况,现有的法律框架中存在哪些风险和问题?
首先,衍生作品的界限判断,衍生作品本来在版权法中不被认为是一个有多大争议的,但是现在由于生成式的AI训练数据出来的衍生作品恐怕人们要重新探讨和认识,这是一个合理使用的判定。其次,商业和商业信息的风险输入的时候,存在风险的商标侵权。最后,关于版权许可,按现在的新技术的发展,真的是不能解决的吗?
刘朝教授举例,美国在这样看似这种乱象下出了一个计算机统一信息交易法,它不仅站在软件企业中自己的交易规则,把软件企业突破合同法和版权法的交易规则上升为联邦层面统一基本法,同时要求各州使用这个法律。
针对衍生作品的界限判断、合理使用的判定、商业秘密的风险、版权许可等风险和问题,她认为通过保持著作权的基本逻辑,充分发挥政府、企业和第三方机构的作用,构建创新的商业模式和交易规则,可以解决目前存在的大部分问题。
人工智能是新一轮科技革命的头雁,汇聚共同的智慧,对企业、社会产生重要的价值。数据训练模型的数据使用问题、文本挖掘问题,以及我们人工智能生成的内容的相关的版权问题,在遵循着国家对人工智能的整体发展的思路下,需要在现行法律的框架下对其进行思考、反思,完善或建立新的制度。
编辑:Kean返回搜狐,查看更多
ChatGPT生成的内容是作品吗著作权归谁
“最近ChatGPT非常火爆,很多专家学者围绕着ChatGPT的发展,看到很多知识产权保护的问题。”在2月13日广东高院举行的“加强知识产权司法保护、护航广东高质量发展”座谈会上,一位企业界人士发言时提到了人工智能生成物的著作权保护问题。
ChatGPT“走红”之际,人们发现它能做的事实在太多:写论文、写文案、写作业、写代码、写新闻、写评论……一个个拷问当下的问题随之来临:如果它仅仅是辅助工具,为什么被很多领域禁用?如果它能生产作品,著作权归谁,现有的法律体系准备好了吗?
图/视觉中国
ChatGPT生成的内容是作品吗?
早在计算机发明之初,关于人工智能所产生的内容能否享有著作权的讨论就已经开始了。从1964年开始,美国版权局就连续多年在年报中提及计算机作品对著作权制度带来的挑战,并尝试探讨计算机作品、计算机能否享有作者权等问题。
时至今日,计算机技术飞速发展,人工智能更新迭代,如今已发展出“能写会道”的ChatGPT。在许多学习、工作的领域出现了人工智能解决方案:有的中学生直接复制答案交作业,有的大学生直接用它生成论文,有的记者输入新闻要素一篇新闻稿就出来了……
与此同时,它对现有的著作权制度的冲击已经显现:人工智能生成的内容,著作权归谁?如果它仅仅是人类的辅助工具,为什么被很多领域禁用?如果它能生产作品享有著作权,现有的法律体系准备好了吗?
“需要明晰的是,此处谈及的‘作品’是指著作权法语境下的作品,而不是社会大众泛化理解下的作品。”对外经济贸易大学法学院助理教授、北京大学粤港澳大湾区知识产权发展研究院研究员徐美玲告诉羊城晚报全媒体记者。
徐美玲介绍,根据著作权法的基础理论和相关规定,著作权法所保护的作品需要满足一定的条件,即文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。根据这一规定,即便是ChatGPT生成的内容,也并非所有均可视为作品,诸如对“著作权法是哪一年颁布的”这样简单问题的回答,属于现有知识的原样呈现,是应该被排除在“作品”之外的。
西南政法大学民商法学院副教授郑志峰接受羊城晚报全媒体记者采访时说:“根据我国著作权法的规定,作品认定的关键在于独创性,但何为独创性存在不同的理解,一种是主观主义,强调作者的个性化创作过程;一种是客观主义,强调作品本身具备一定的创造性、区分性。如果从客观主义出发,ChatGPT生成的许多内容可以被认定为具有独创性,进而属于作品。”
两宗判决背后的司法信号
不过,一个事实是,我国司法实践对于人工智能自动生成的文章是否构成作品,已进行了一些探索。法院的基本观点是,司法争议的人工智能的法律主体资格有待法律予以明确规定,但对于人工智能自动生成的相关内容还需要加以保护。
2019年5月,北京互联网法院一审公开宣判北京菲林律师事务所诉北京百度网讯科技有限公司侵害署名权、保护作品完整权、信息网络传播权纠纷案。法院在该案中认定,计算机软件智能生成的涉案文章内容不构成作品,但同时指出其相关内容亦不能自由使用。其理由是:根据现行法律规定,文字作品应由自然人创作完成。
深圳市南山区法院2020年判决的腾讯诉盈讯科技侵害著作权纠纷案,是我国首例人工智能生成文章作品纠纷案,它提供了另外一种视角。
2018年8月,腾讯公司在其网站上首次发表了标题为《午评:沪指小幅上涨0.11%报2671.93点通信运营、石油开采等板块领涨》的财经文章,末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。同日,盈讯科技在其运营网站发布了相同文章。
腾讯公司认为,涉案文章作品的著作权应归其所有,盈讯科技的行为侵犯了其信息网络传播权并构成不正当竞争。2020年1月,深圳南山区法院审理认定,涉案文章属于我国著作权法所保护的文字作品,是原告主持创作的法人作品。
在中国政法大学法律硕士学院副教授陶乾看来,上述第一个判决是数据库自动生成的分析报告,法院认定不构成作品,但是有保护的价值,本判决的缺憾是,未能详细地阐述,为什么在有保护的价值的情况下,本案要适用著作权法进行保护。第二个判决认定构成作品,属于腾讯公司的法人作品,本判决实际上是将Dreamwriter作为一种创作工具,在人工智能技术不断发展、愈发智能化的趋势下,人工智能已经不仅仅是工具了。
“总的来说,司法实践越来越重视人工智能生成物的保护,逐渐放宽对作品的认定,但如何认定著作权人以及相关的保护规则尚缺乏清晰的规则。”郑志峰说。
人工智能生成物的著作权归谁?
北京航空航天大学法学院教授龙卫球在腾讯诉盈讯科技侵害著作权纠纷案判决后点评说,人工智能技术和产业的迅猛发展,对现有法律体系特别是著作权保护体系提出了巨大挑战,其中人工智能能否成为著作权主体,人工智能生成的内容能否构成著作权客体的作品,在国内外存在广泛争议。
人工智能能否具有独立的法律人格,成立私法上的民事主体资格,需要国家法律的明确规定或认可。
郑志峰表示,根据我国著作权法,著作权的归属,主要包括作者和其他主体。作者指的是创作作品的自然人,但对于ChatGPT不太适用,一方面,ChatGPT并非民法上定义的自然人;另一方面,使用ChatGPT的用户虽然是自然人,但其通常只是简单的提问或发出指令,并没有创作行为。
基于此,对于ChatGPT生成的作品到底由谁作为著作权人成为难题,学说上存在不同观点。
徐美玲提出:“既然ChatGPT生成的内容具备‘可作品性’,有可能享有著作权,那么其权利人如何界定?我认为,其背后的设计人、开发者或者投资方等享有控制权的主体均可能成为著作权人,具体如何确定,可以通过合同机制来确定。当然,‘权利-义务-责任’一体,成为著作权人,同时也应当对所生成的内容负责,如果存在侵害现有作品著作权,或者其他违法行为,同样应当由著作权人来承担相应责任。”
徐美玲说:“社会大众可能还存在一个疑问,在ChatGPT‘创作’过程中,千千万万的用户通过提问的方式引导回答,那么用户是否也付出了劳动,也参与了‘创作’,那么权责又该如何分配?”
“我认为,‘OpenAI(即“ChatGPT所属的公司”)——ChatGPT——User(用户)’三者之间的关系可以理解为一种‘委托创作’,即用户委托OpenAI通过使用其享有的ChatGPT来进行创作,那么著作权的归属即可以根据著作权法第十九条的规定来认定。”徐美玲说。
著作权法第十九条规定:“受委托创作的作品,著作权的归属由委托人和受托人通过合同约定。合同未作明确约定或者没有订立合同的,著作权属于受托人。”
ChatGPT大行其道时,一些出版物、论文开始将ChatGPT列为合著者、非第一作者,但随后遭遇了“封杀”,包括《科学》《自然》在内的大量权威期刊,都要求不能将ChatGPT列为作者。
在郑志峰看来,如果人工智能模型客观上生成了大量具有独创性的作品,法律上不将其视为相应的著作权人,那么这些作品就会成为孤儿作品、无主作品,对于作品的使用势必会引发诸多纠纷。特别是当人工智能模型生成的作品具有巨大的经济价值时,更容易引发纠纷。
“当然,著作权除了对于作者进行保护外,还包括其他享有著作权的主体。虽然理论上说,ChatGPT和用户都难以称为一般意义上的作者,但法律完全可以通过拟制作者或者其他方式来确定著作权人。”郑志峰说。
现行著作权法律跟得上吗?
在徐美玲看来,应当摒弃作品必须只能由“人”来创作的理念,应该转变为作品可以“为人”而创作。人工智能生成物在本质上是人类的智力劳动成果,只是借助了人工智能这样的工具,使文学艺术领域的智力劳动科技化、规模化、智能化。
不过,为保护社会大众的知情权,徐美玲特别强调应设定标注区分的义务。她说,在我国已做出的判决中,法院就指出“从保护公众知情权、维护社会诚实信用和有利于文化传播的角度出发,应添加相应计算机软件的标识,标明相关内容系软件智能生成。”
“欧盟、美国等都有关于人工智能生成物著作权的纠纷,也出台了一些法律政策。例如,欧盟2020年出台了《关于人工智能相关知识产权问题的立法建议》,提出区分人工智能辅助人类创作和人工智能自主创作,构建不同的保护制度。”郑志峰说。
郑志峰说,我国著作权法没有对人工智能生成物的著作权问题做出明确规定,但已注意到这个问题。2020年修订的著作权法第三条将原来的“(九)法律、行政法规规定的其他作品”修改为“(九)符合作品特征的其他智力成果”,这为今后将人工智能生成物纳入作品保护奠定了基础。
正承担国家社科基金一般项目“人工智能生成内容的著作权立法研究”的陶乾向记者介绍,目前,仅有英国对计算机软件生成内容进行了规定,尚无对人工智能生成的成果如何保护的规定。未来,可以考虑通过对衍生数据提供财产权保护的方式来保护利用人工智能技术生成的内容,同时,立法也有必要对于文本与数据挖掘问题作出回应。
来源| 羊城晚报、金羊网、羊城派
文字|羊城晚报全媒体记者董柳
编辑|木言
校对|潘丽玲
审签 | 周乐瑞
人工智能生成内容独创性认定【侵犯著作权律师】
原标题:人工智能生成内容独创性认定【侵犯著作权律师】人工智能生成内容独创性认定【侵犯著作权律师】
广东长昊律师事务所
【摘要】随着微软“小冰”出版诗集,人们渐渐产生了疑问:“版权归谁?”与此同时,学界也在对人工智能生成内容的法律性质进行探讨,并且分歧较大。引发这一讨论的原因在于人工智能生成内容已经具备了人类作品的外观,但人工智能并不具备法律主体资格,人工智能生
成内容的法律定性存疑。从作品的独创性标准角度对人工智能生成内容进行考察,不同学者主张以不同的独创性标准来判断人工智能生成内容是不是作品。不同的独创性标准背后隐含的是不同的价值选择。基于两种不同的价值选择,人工智能生成内容的版权保护面临两种不
同的制度安排。
关键词:人工智能;人工智能生成内容;版权
一、人工智能生成内容独创性认定的难题
人工智能生成内容到底是不是作品?要回答这一问题,就要回答其是否具有独创性。尽管以独创性来判断作品地位已经成为共识,但无论在理论界还是实务界,对于独创性标准的认定具体应如何操作,至今尚未有统一的答案。也就是说,独创性标准本身可操作性不强。在认定人工智能生成内容是不是作品的三段论推理中,大前提的不确定性导致了结论的多种可能性。
(一)独创性认定的难题与出路
科学技术发展到今天,以往被认为由人类独享的创作活动,也能够部分由机器来完成。在各国立法中,对作品本质的最常见表述是“独创性表达或成果”,但不同的国家对独创性的要求也不同。与英美相比,德法对作品的独创性要求较高,而我国版权法在构建的过程中同时借鉴了大陆法系和英美法系两方的制度,却对独创性的高度没有作出明确规定。
争议的焦点在于“创”。在讨论人工智能生成内容是不是作品的过程中,有三种不同的立场,有否认其具有独创性的、认为其具备了最低限度的独创性的,和认为其具备独创性并且应当重塑独创性标准的。这对应的是对于独创性是否要求创作高度的三种态度:一是独创性要求一定的创作高度,二是只要有创作高度即可,三是独创性不要求创作高度。
创造是一个很难定义的概念。即使在要求作品有一定创作高度的德国,由于这一标准过于抽象,在确认版权作品和判定版权侵权过程中也存在着盲目性和任意性的问题。
探寻创造概念的过程仿佛盲人摸象,从不同的角度出发,得到的结果也是不同的。有人提出“创造是一个无意识的集合,很难从作者的创作意图与心理过程去揭示创造的秘密。”。不确定性是创造本身的特质,也正是创造本身的价值所在。创造的概念至少到现在为止还是一个黑盒子。
既然创造的概念模糊不清,我们或许可以转变思路。我们一直在探寻“创造”的本质,但说到底,“创造”这一概念是人类社会的一种想象。我们认为只有人类才能够创造,这里的“创造”是人文意义上的而非物理意义上的。独创性则是一个属性概念,脱离作品而单独讨论独创性是没有意义的。之所以会出现前述三种不同的独创性标准就是因为学者们对于什么是作品有着三种不同的价值取向。对于不同的人而言,作品的意义是不同的:有的人把作品当作人格的延伸;有的人则看重其经济价值。无论是“创造”、“独创性”还是“作品”,界定这些概念的意义在于实现人与人之间利益的合理分配。那么问题的根源就在于我们应当坚持怎样的价值取向,搞清楚这一问题,创作、独创性的标准也就迎刃而解。
(二)人工智能生成内容的本质
尽管创作是难以被定义的,但我们可以以辅助性的判断标准排除创作活动的存在。在笔者看来,有两个理由认为人工智能不能够进行创作。第一,创作并非进行不合逻辑的排列组合,并且人工智能工作的结果相对确定;第二,创作是一个表达的过程,内含着一个表达的意愿,人工智能不具有这一点。当然,在人工智能在进行“创作”时,有类似于判断、组合的过程,但也不能算是创作,而是对人类行为的模拟。其实质是将选定的素材进行排列组合和筛选,这种排列组合遵循了一定规则却没有内在的逻辑。在脑力劳动与体力劳动区分不明显的今天,“人类物质生产与精神生产的关系也越来越密切,物质生产的进步越来越依靠精神生产的支持,精神生产的发展也越来越离不开先进的物质手段。”这就使人类创作活动发生了深刻的变化,更多地体现出技术因素,创作的标准也应当相应发生变化。那么人工智能的工作是否符合“独”的要求呢?其整个工作过程依赖于人的操作,人向其提供素材的过程体现的是人的独创性安排,因此,其生成内容并非人工智能独立完成,而是来源于其设计者和操作者。因此在笔者看来,这些生成物不具备足够的独创性,不能够与人类作品相比较。
总之,现阶段人工智能的重点不在于智能,而在于人工,是对简单人类劳动的替代。人工智能在这类“作品”产生的过程中起到的仍然是辅助作用,尚不能体现较高的独创性。只要人工智能尚未发展出自由意识,那它就依然是个工具。既然人工智能只是一种工具、一种技术,其生成内容的价值也主要是由人来产生的,人与人之间关系的调整才是法律应当关切的。返回搜狐,查看更多
责任编辑: