博舍

机器新闻写作: 媒体行业的探索研究与实践 人工智能与新闻媒体的联系与区别是什么

机器新闻写作: 媒体行业的探索研究与实践

原创任鼎传媒

在2019年1月,习近平总书记在中共中央政治局第十二次集体学习时强调,探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力。机器新闻写作作为人工智能与新闻业相结合的典型代表,是新闻业基于人工智能技术创新出的内容生产方式。在媒体竞争中,回归优质内容将是媒体内容生产的重要趋势,新闻内容的高质量和多元化是其主要竞争力,这势必会推动新闻内核的重归。机器新闻写作对搜集和输入的数据信息进行自动化的分析、处理和加工,进而根据特定的场景生成一篇较为完整的新闻报道,通常包括数据挖掘、知识图谱、自然语言处理、事理图谱、神经网络、深度学习等人工智能技术。

01

机器新闻写作应用现状

机器新闻写作最早起源于美国,至今仍然以绝对的优势领先,中国在第二批发展浪潮中表现亮眼,瑞典、英国、法国、丹麦等国家紧随其后。目前机器新闻写作的话题较为局限,以体育竞技与经济热点为主,包括体育赛况报告、财报解读等,社会民生、自然灾害、气象变化等话题占比合计仅为30%。

在国外,美联社、雅虎、华盛顿邮报、BBC新闻都已开始使用机器新闻写作技术来负责稿件的生成,其中,华盛顿邮报的Heliograf软件,只需编辑设置稿件模板,确定好关键词便可完成稿件编写,升级之后,可以用更加专业的评论语气和分析事情的思路进行写稿;BBC新闻实验室的Juicer在2012年被首次引入,它的任务包括新闻快讯、视频新闻、政府公告、社交媒体信息等在内的海量数据汇集,并进行自由调用,同时监控着850余个媒体新闻源、政府信息源和部分互联网新闻源,再将其分门别类以供写稿使用。

中国的机器新闻写作研究起步较晚,但发展迅速,新华社的“快笔小新”在擅长的体育和财经领域,编辑记者需要用15~30分钟时间完成的稿件,小新只需要3~5秒钟,而且小新可根据文字自动搜索资源库匹配关联性最强的图片、视频、音频素材,自动制作成一段视频,同时支持语言配音。封面新闻的小封机器人在2018年世界杯期间总共推送了世界杯相关资讯600多篇,获得了全网总阅读量超2亿的成绩。字节跳动Xiaomingbot作为首个3D多语言AI记者,除了新闻写作的基本功能外,还被赋予了3D动画形象,能够配合文本内容完成多种语言的新闻播报任务。

02

机器新闻写作技术支撑

人工智能的三大支撑为算力、数据与算法,机器新闻写作同样如此。算力被形容为支撑人工智能走向应用的“发动机”,芯片、加速计算、服务器等软硬件技术和产品的完整系统提供超强算力,帮助算法快速运算出结果。数据作为大数据时代的基石,为人工智能的实际应用提供“燃料”,大数据具备5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。算法模型是人工智能落地的“承载体”,其复杂度不断加深,解决问题的能力以及服务的业务场景也不断增强。

硬件平台支撑。在人工智能发展的早期阶段,以能力训练为核心,这一阶段更多的计算负载集中在离线的数据中心。在进入大规模应用阶段后,人工智能的能力赋能产品或行业解决方案,成为普适的应用技术,在这一阶段将呈现“云+端”部署、分散化、终端化、场景化的特点,对算力的需求也将迅速增长,更加多元化。

媒体大数据云服务平台基础。媒体大数据云服务平台涵盖数据采集、数据挖掘、自然语言处理、计算机视觉处理等一系列的相关技术与理论,并对海量文、图、音视频数据进行统一采集、处理、存储、检索以及深度智能挖掘分析的大数据平台。

数据采集。数据是起点,数据让机器新闻写作所需内容的关联、预测、分析成为可能。数据采集为大数据平台的基础,广泛、大量、多样性的真实数据保障模型的学习训练与优化。

大数据平台的数据源大致可以分为三类:互联网公开采集数据、中央媒体新闻稿件、媒体单位内部数据。由于外部数据的获取渠道不同,需要多种数据采集方式,以实现覆盖新闻/视频网站、微博、微信、移动新闻客户端等多种媒体渠道的文、图、音视频的富文本数据采集。

大数据平台建设。随着智能媒体时代到来,传统媒体正处于向新型智能媒体的转型期。构建媒体大数据服务平台为媒体单位的网站、官方微博、微信、移动新闻客户端的运营提供强有力的数据支撑,也为机器新闻写作提供底层数据支持,助力技术与传统媒体和新媒体在新闻生产、内容传播、技术创新、产品创新、服务创新等方面深度结合。

机器新闻写作旨在特定的新闻报道场景下,如重大突发性事件、体育、财经等,可以快速地生产出内容,在这一过程中,并不否定人参与的重要性,而是通过机器新闻写作得到完成度极高的稿件内容,在机器或者人工审核通过后进行最终发布。为了保障机器新闻写作的成稿质量,数据的规范性以及标签体系的构建显得尤为重要,数据的准确性与代表性是模型学习训练的关键,这对大数据平台的建设提出了较高的要求。

非结构化数据的数据消重、垃圾信息过滤、非相关数据过滤、统一格式等多种数据处理操作,转换为格式规范的数据,并存入数据资源池。自然语言处理技术与计算机视觉处理技术实现文本数据的多维挖掘分析,以及图像内容的提取分析识别处理。

围绕当前媒体融合发展的趋势,针对不同行业以及媒体单位属性构建符合其特点的分类标签体系,对来自不同媒体渠道、不同表现形式、不同数据字段的多媒体数据进行分类与标注,从而快速发现互联网热点线索与信息,为机器新闻写作提供方向与素材。

应用服务。脱离了应用场景的机器新闻写作以及人工智能技术是没有意义的,技术的发展更新迭代都是为了更好地服务业务场景的实际应用需要,技术、算法与模型的实际落地也需要同应用服务场景相结合。

算法模型支撑。算法是计算机科学领域最重要的基石之一,算法与模型自人工智能与机器新闻写作技术提出以来就备受关注,诸多公司将算法作为企业的核心竞争力之一。算法按照模型训练方式和解决任务不同可以划分为很多类型,在具体的业务场景中,算法的选择与使用也呈现出差异化的特点。

目前的机器新闻写作大致可以分为两类:一是将数据填空到系统模板形成新闻,模板是常量,数据是变量;二是从管理系统获取数据,将数据进行分类、筛选、汇总、计算处理后,利用最终数据形成文本,主要适用于写作财经类新闻文本。现有机器新闻写作报道算法缺乏针对深度报道、追踪报道以及富文本形式报道的稿件生成算法,随着短视频的兴起,针对短视频的机器新闻写作报道也将是大家关注的焦点。

新闻热点发现与新闻素材匹配。基于内容相似度计算模型与聚类算法模型,对大数据平台中的素材进行相似度计算与内容聚类,快速发现互联网新闻热点线索,为机器新闻写作提供内容创作方向。构建从语言、图片和视频到文本的跨模态语义映射和对齐,对未标注的原始数据进行自动精确的文本标注,将提取到的语义特征投影到深度特征空间进行面向语义理解的多层次的深度匹配,以实现在报道需求确定后,新闻素材的快速匹配。

新闻报道脉络挖掘。以大数据平台提供的新闻素材为数据基础,事理图谱与马尔科夫随机场为计算模型学习新闻报道事件间的因果关系,使模型实现自动识别新闻报道脉络,并具备连续报道事件的能力。

典型新闻报道场景下新闻与短视频生成。对语音、图片、视频数据的文本标注,结合知识图谱技术与弱监督学习的方法,融合多元信息,面向新闻素材领域的弱监督迁移学习。基于自然语言生成算法和注意力机制,实现端到端学习自动生成新闻文本,自动选择图片与视频素材,不断提高学习网络模型的鲁棒性。最终形成面向多领域、多主题事件模型的泛化性,开展零次学习、主动学习与强化学习的模式。

在机器新闻写作走向应用的过程中,以业务场景为核心,实现以最少的数据、最简单的模型、最少的计算力解决最实际的问题,达到最好的效果。

03

机器新闻写作评价体系

机器新闻写作自2015年走入国内公众的视野以来,已经历了5年的发展,机器新闻写作评价体系的建立对算法模型与数据质量的优化将起到一定的指导性作用。目前,国内外还没有针对机器新闻写作评价体系的权威发布,对标传统媒体内容与新媒体内容稿件的评价标准与指标权重体系,维度包含内容的完整性、准确性与时效性,内容安全,传播效果以及写稿的效率评估。

内容的完整性、准确性与时效性。在地震、爆炸、事故等重大突发性事件的报道工作中,基于其硬新闻的属性,有极严格的时间要求,报道必须迅速、准确、信息尽可能量化,这类新闻一般带有强烈的时效性、广泛性和指向性。机器新闻写作,可实现文字、图片、短视频等多媒体稿件与专题的自动生成,大大减少了新闻成稿的时间,也保证了内容的完整、准确与时效。

内容安全。在新闻的内容审核环节,可以对文字、图片、音视频进行基于人工智能的内容审核,精准识别涉政、涉黄、涉暴、涉恐和敏感人物等信息,有效管控业务违规风险。

通过语法分析、语义分析、知识图谱、规则模型以及检索模型等技术实现稿件内容审查。解决常见的字词差错、标点差错、政治性差错、常识性差错、中英文关键词差错等类型,实现自动查错、手动纠错,提示错误原因、修改建议,并可统计错情、生成勘误表。

传播效果。机器新闻写作的内容大多发布在新媒体渠道中,在早先学者的研究中,网络新闻的传播效果体现在:一是网民的新闻消费行为,二是网民的新闻生产行为,三是媒体的反应,并且提出了点击量、网站访问浏览量、网民搜索等网民消费行为的评估方式,网民评论、转发、收藏、受众调查等网民新闻生产行为的评估方式以及从媒体转发量、媒体跟进报道两个方面分析媒体反应与网络新闻传播效果的评估方式。

机器新闻写作写稿效率。机器新闻写作需要与现媒体单位使用的数据库、采编系统、发布系统、媒资系统等平台以及环境相适配,确保顺利运行。同时,作为新的生产工具,需要一定的可操作性与便捷性,才能更快地推动落地应用。

04

机器新闻写作的优势与影响

新闻内容的生产方式在由PGC(媒体生产内容)到UGC(用户生产内容),再到AGC(算法生产内容)的演变趋势发展。机器新闻写作依托数据与算法自动生成新闻稿件,避免了主观因素导致的新闻失实,减轻新闻创作者的重复性工作,使新闻的生产与传播更加高效,内容更加丰富。

真实、准确、客观。新闻具有播散性与导向性,真实、准确、客观是新闻报道工作的基本要求,在新闻生产过程中,为报道一篇作品,新闻人员需要对历史新闻数据有基本的了解与掌握,而对于素材的收集整理归类是一项需要时间的繁重且重复性工作。机器新闻写作一是可以将新闻工作者从重复的素材整理工作中解脱出来,二是能提高内容生产的真实性、准确性与客观性。

快速、高产。前文提到的美联社使用的Wordsmith平台,每秒甚至能生产2000篇文章,每周将可以写出上百万篇文章。财报报道的工作效率已经大大超过预期,在采用该平台之前,每季度仅能够完成300家企业的财报,而现在能够完成3000家企业的报道。

对于地震、火灾等突发性重大事件的报道,机器新闻写作在报道速度方面体现了极大的优势。2017年,九寨沟地震的第一条新闻报道便来自于写稿机器人,7.0级地震报道用时25秒,其他余震消息仅用时5秒。

05

结语

马克思在《资本论》中提出:“社会劳动生产力首先是科学的力量。大工业把巨大的自然力和自然科学并入生产过程,必然会极大地提高劳动生产率。”人工智能的快速发展给生产效率带来了提升,诸多行业都享受到了这次技术革新带来的红利。在智能媒体时代,从新闻素材采集、数据处理与分类标签、新闻报道选题策划、富文本内容的生产编辑、新闻的发布与精准推送、新闻人员的绩效考核,人工智能将参与到媒体行业的各个环节。

太极计算机股份有限公司深耕媒体行业20年,长期服务于媒体单位,见证并参与了媒体行业的技术发展及产业转型,太极深刻地理解技术给媒体带来的巨大影响。人工智能等新技术将持续赋能媒体应用,创新新闻创作、发布形式,太极将同媒体单位一起拥抱新技术,引领媒体融合的未来。(作者系太极计算机股份有限公司文旅战略业务本部业务发展中心总经理)

喜欢此内容的人还喜欢

原标题:《机器新闻写作:媒体行业的探索研究与实践》

阅读原文

人工智能将对媒体业带来哪些变革

内容分发是沟通内容生产与消费的枢纽所在,是内容产业运行的核心机制。为了提升内容分发效率,人类一直在不断创新和优化内容分发方式。

在大众媒体时期,内容分发主要依靠职业编辑人员的手工操作来完成。在互联网产生初期,新闻网站和门户网站也延续了这种内容分发方式。这种依靠编辑手工操作的内容分发方式,不仅分发效率低,而且难以满足个性化需求。此外,这种分发方式发挥作用的前提是有限的内容供给,一旦内容供给海量化,这种分发方式将难以成立。

互联网的产生打破了内容供给的时空限制,使得网上内容走向海量化。这对以网络编辑为主体的内容分发方式形成了挑战,从而导致内容供给的“堰塞湖”问题,用户越来越难以高效率获取其所需要的内容。

为了解决这一问题,搜索引擎把人工智能率先引入了内容分发领域,试图通过机器算法为每一个问题提供最精准的答案。凭借人工智能的精准匹配,搜索引擎在固定互联网时期构建了第一个全网的内容产业生态体系。

内容分发效率的提升,也反过来推动了各类内容的互联网化。搜索引擎所构建的这种内容分发方式也并不完美,其精准匹配建立的前提是用户能够提出相对明确的需求,但是用户有时候对自己的需求并不明确,这需要用户在浏览信息中不断明确自己的需求。

在SNS、微博、微信等社交平台兴起以后,“社交分发”成为新的内容分发方式。社交分发的核心是激活用户的参与行为,通过用户的转发、共享、点赞、评论等方式,扩大内容的传播范围和影响深度。社交分发是建立在用户认同的基础上,利用用户的社会关系网络和个人品牌背书而产生的传播方式。

用户认同是社交分发的前提和基础,如果产生强迫分发行为,不仅会引发用户的集体反感,而且会破坏个人品牌及其社交关系,甚至损害社交平台的品牌形象。虽然个人的社会关系维度是多元化和多层次的,但是在社交分发中却缺少对这些影响因素的考量,同一化分发的长期结果则是降低用户的活跃度,甚至让用户逐渐远离社交平台,使其逐渐成为功能单一化的社交工具。

为了满足用户的个性化需求,智能推荐在固定互联网时期就已经出现。虽然固定互联网时期的智能推荐与移动互联网时期的智能推荐在工作原理方面相似,但是智能推荐在固定互联网时期并未成为主流的内容分发方式,直到移动互联网时期才成为主流的内容分发方式。其原因有两点:

第一,移动互联网时期智能推荐的数据维度更加丰富,不仅对用户刻画的维度从IP层次提升到ID层次,而且还可以加入使用场景、社交关系等多维数据。

第二,在移动互联网时期,用户接触内容的场景更加丰富、内容消费时间更长,可以更好地记录与刻画用户的内容偏好。

因此,由于用户内容消费数据的丰富,以“今日头条”为代表的智能推荐集合了网络编辑分发、搜索引擎分发、社交分发等分发方式的优点,可以更好地满足用户的个性化和个人化需求,从而增强用户对智能推荐平台的黏性,使得智能推荐成为主流的内容分发方式。

内容生产:人工智能将丰富内容生产方式

在大众媒体时期,虽然在“言论自由、出版自由”的制度框架下每个人在理论上都可以成为内容生产者,但是并不是每个人生产的内容都可以从大众媒体分发出去。

这是因为大众媒体产业在发展过程中形成了“许可证制度”或“垄断性市场竞争”,这种市场格局使得内容生产成为具有一定门槛的专业化领域,大众媒体的内容主要由专业人士和专业机构来提供。而普通人生产的内容则需要经过专业人士的编选,才有可能获得在大众媒体上曝光的机会。

在互联网产生初期,虽然互联网产业延续了大众媒体的内容生产方式,要么自建专业内容生产队伍,要么免费或付费转载传统媒体的专业化内容,但是互联网与大众媒体的差异化逐渐凸显出来,互联网上的专业生产内容(PGC)已经不能像大众媒体一样专享用户的注意力资源,而是被互联网上的游戏、社交、论坛等占用了大量用户注意力资源。

为了获取更多的用户注意力资源,降低内容生产成本和满足用户的多样化需求,用户生产内容成为互联网新的内容来源。但用户生产内容的水平参差不齐、难以进行人工审核、缺少持久创作机制等问题,也让用户生产内容难以获得互联网平台的青睐。因此,互联网平台也一直渴望引入新的内容生产方式,包括把人工智能引入内容生产领域。

首先,人工智能对内容生产的改变体现在数据来源方面。

在人工智能产生之前,内容生产所采用的数据主要是文字、图片、音频、视频等人类可以识别与处理的结构化数据,所有的内容都是基于这些数据组合的基础上生产出来的。而人工智能所能识别和处理的数据已经不再局限于这些结构化数据,还包括各类人类无法直接识别的非结构化数据。

虽然人类对于这些非结构化数据的认识和利用才刚刚开始,但是这些数据所展示的潜在价值远远超出人类想象。随着各类物联网感知设备的普及,人类将获取越来越多的结构化数据和非结构化数据,这将为内容生产带来丰富的数据资源。

其次,人工智能对内容生产的改变体现在生产的模块化方面。

在内容生产过程中,已经积累了丰富的生产经验,也形成了各类内容的标准化模板。在人工智能产生之前,内容生产的标准化模板只是隐藏在生产人员的个人经验和生产流程的标准化过程之中,这种标准化模板的实现对人的依赖性比较大。

在人工智能引入内容生产之后,这种标准化模板可以被人工智能所学习,从而为内容生产提供各类辅助性工具,这就可以实现内容生产的模块化,甚至是部分内容的自动化生产。

因此,在人工智能产生之前,内容产业是一个劳动密集型产业,内容生产主要依靠人工操作来实现。人工智能产生之后,可以取代标准化的体力劳动和智力劳动,进入内容生产领域。这将丰富内容产业的生产方式,提高内容生产效率,降低内容生产成本。

媒介形态:人工智能将成为“个人生活智能助理”

在大众媒体时期,根据媒介的物理属性不同,纸质媒介形成了空间性的媒介形态,而电子媒介则形成了时间性的媒介形态。而到了互联网时期,互联网打破了时间性媒介和空间性媒介之间的界限,再加上互动性等新技术特征,创造了更多的媒介形态。

在已有的媒介形态中,无论是用户的被动接受还是主动获取,用户是内容消费的主体,所有的内容生产都指向于用户的理解、记忆、遗忘等自然能力。在人工智能产生之后,人工智能将成为内容生产者与用户之间新的媒介形态,将以“个人智能生活助理”的形式为用户提供服务。

未来在VR/MR/AR技术的支撑下,人工智能甚至可以以拟人化形象向用户提供服务。人工智能可以提供两种服务:

一种是代替用户筛选各类内容,满足用户的个性化消费需求,这种服务并不改变用户的消费主体地位。另一种则是代替用户成为部分内容的生活主体,负责处理与用户相关的各种生活和工作信息,并向用户提供各类生活和工作建议,甚至代替用户自动化处理。

在第二种情形下,内容生产的对象不再面向用户,而是面向人工智能,这将改变内容生产的原有形式和内容。比如广告信息,已经不能再以简单的广告语来说服人工智能,可能需要提供多维化的产品信息,由人工智能进行产品与用户的智能化匹配。

您可能感兴趣的是返回搜狐,查看更多

【他山之石】人工智能在新闻传播中的运用:实践探索与伦理困境

近来,一套名为“立法新闻提示表”(LNTS)的人工智能新闻报道系统被广泛运用于法治新闻的报道场景当中。[3]这个由AI驱动的新闻报道辅助工具可以通过系统搜索和收集与美国各州立法会议有关的具有新闻价值的事件,为记者及时提供事件背景数据,从而方便他们进入更为深入的后续采访。例如,今年6月美国最高法院做出有关“堕胎权”的仲裁后,引发舆论的高度关注。各州立法机构也纷纷展开辩论,制定相应的法案。对于这类具有高度争议性和关注度的议题,AI系统可以在数据出现井喷或异常时向记者发送“新闻预警”,提供包含相关事件背景信息的模板文本。地方媒体的专业记者和编辑借助于LNTS分析议员之间的对话,可以监测和跟踪他们之间的“拮抗”关系,从而对各州立法的结果进行准确的预测,影响舆论的走向。

这套AI新闻报道系统还可以帮助记者捕捉到日常工作中难以发现的线索,将新闻生产者的“触角”延伸至以往报道匮乏甚至于完全缺失的领域。例如,通过历时性的资料收集,该系统可以汇总各州议员的投票历史,判断特定人选的投票结果是否与之前的立场相悖,并向记者及时提供相关数据,使其能够把更多的时间和精力投入深入的思考和解读中。

显而易见,这套系统可以有效节约人力和财力,可以自动生成包含从众多新闻网站之中收集的信息线索的“菜单”或“食谱”供记者随时调用和搭配。另外,该系统还借助于传感器技术来帮助新闻媒体完成远程资料和数据的收集工作。在堕胎立法争议的报道中,加利福尼亚州、佛罗里达州、得克萨斯州和纽约市等新闻“热点”地区都对该系统开放了当地立法机构和会议的访问权,从而大大提升了新闻媒体跨地域的报道效率。值得注意的是,LNTS是多方合作联手开发的创新成果,专业记者、编辑、数据科学家、工程师、新闻学院的教授携手合作,推动产学研一体化的全链条再造,为解决长期以来新闻业界、学界和教育界之间相互“脱钩”的积弊探索出了一条新的道路。[4]

第二,新闻呈现。AI的运用可以优化和丰富新闻报道的表现方式,增强了产品、内容与用户之间的互动性,帮助用户获得临场的个性化体验,同时也提供更为高效的信息服务。算法推荐系统可以根据用户的偏好和所处场景,为其提供定制化的环境信息和服务,有效提升用户黏性。

2022年2月,路透社和从事AI研发的“合成媒体”(Synthesia)公司发布了世界上首个以虚拟主播为中心的自动化播报系统。该系统建立在路透社视频素材库的基础上,将专业体育主播的影像和与AI相结合,创建了一个可编程的虚拟主播来进行赛事报道和分析。路透社的图片摄影和视频报道为这位虚拟主播提供信息和观点,甚至可以细化到主播的一招一式,不仅无需任何的人工脚本、编辑和制作,还能够自动创建新闻摘要和字幕,根据传统媒体和社交平台的需求创建与之适配的不同播放版本。[5]

2021年初,BBC管理层关注到62%的在线用户每天收听播客,时间从30分钟到4小时不等。为此,BBC与微软合作开发了AI辅助的播客App,借助深度神经网络创建出具有自然语调和清晰发音的合成语音。起初作为BBC名牌系列节目“生活方案”(TheLifeProject)”的一部分推出,将16篇新冠肺炎疫情期间为读者提供生活指南的专题文章以音频方式呈现。获得广泛好评后,该产品又拓展内容,精选BBC网站特色垂类频道的优质文章以播客形式推出。

用户可以在电脑、智能手机等多个终端上获取这个App,在浏览精选文章时会收到“收听文章”提示,并且可以选择后台不间断的播放以获得“伴音”体验。更具特色的是BBC为此开发的合成语音系统。此系统具有位于柔和音域的声音,以其圆润、拟人化的音质给人温馨的感受。此外,合成语音还具有更为显著的包容性和适应性,音频可以在文本编辑时根据不同的需求自动更新,并根据不同的内容调整播报的音调和音色[6]。

第三,新闻分发。在信息过载时代,运用AI不仅能够对新闻媒体生产内容进行精准分发,提高触达率,还可以为用户提供定制化、个性化的信息。初代“新闻推送”功能主要是基于时效性的考量,辅以AI可以将基于内容的推荐、协同过滤和时序流行度相结合,采用“混合概率”的新模式而非传统的“相似性”原则进行推送。谷歌新闻(GoogleNews)是这一新模式的先行者,通过计算历史点击数据或互动频率等数据预测用户的偏好,根据每名用户的不同配置信息为其量身定做“我的日报”。

基于内容的算法推荐和用户之间的协同过滤可以满足不同的用户在“冷启动”“短暂兴趣”“长期偏好”等三个方面获取定制化的内容需求,并将用户的兴趣标注为对某些内容特征的偏好,从而维持更长时间的关注度,尽可能降低由“冷启动”带来的用户数据的“稀疏度”。借助于“协同过滤”可以合并用户近期的兴趣和浏览行为,满足短时间内用户对信息新鲜度和热度的需求。总的来看,人工智能新闻推送系统有利于通过提供个性化信息的方式增强用户黏性和忠诚度,通过提升用户的消费意愿提振新闻产品的价值转化。

当前AI在新闻传播领域的应用不仅可以给予新闻生产者更多的便利,也可以在新闻呈现上更加人性化,并为用户提供个性化的内容消费体验。但不容忽视的是,AI算法在提高新闻传播运作效率的同时,也蕴含着“把关人”权力转移的危机,从而成为加剧偏见和谬误扩散的催化剂,导致国家和社会在种族、党派、性别等议题上的撕裂。

智能传播中的偏见扩散

在新闻生产的过程之中,“算法偏见”的主要来源并非是算法本身,而是底层数据的收集和筛选结果。新闻生产算法模型分为“训练器”和“筛选器”两部分。“训练器”的偏差主要是在基础数据库和训练过程中产生;而“筛选器”则可以根据“训练器”的预测模型使用包含人类决策和带有社会偏见的数据进行“次级训练”。例如,在海量新闻文本基础上“训练”出来的“词嵌入”技术强化了固有的有关性别的刻板印象,而算法设计者即便没有突出性别偏见,也依然会因为被其他变量编码而将带有性别偏见的词条“嵌入”最终显示的文本当中。

更有甚者,人类也会蓄意利用算法偏差误导和操纵偏见,这便是“计算宣传”的由来。2022年2月,丹麦哥本哈根大学进行多模态人工智能感知研究的学者杜尔(BrianL.Due)在其论文中将散播社会偏见的人工智能技术分为三类,一是社交机器人,二是平台内置算法工具,三是人工合成的虚假人物“档案”。首先,目前从“社交机器人”(socialbots)到“深度伪造”(deepfake)等多种借助于人工智能技术的计算宣传手段层出不穷。大量蓄意散播偏见的社交机器人在Facebook和Twitter等全球性社交平台上泛滥成灾。这些“僵尸军团”在关键性议题上散播海量的带有偏见和歧视性的“谬讯”(disinformation),误导公众认知和舆论,降低了民众对政府、媒体等公共机构的信任度,让选举、公投等政治活动的走势发生戏剧性的逆转,甚至于挑动暴力行为和群体冲突,从而加剧了社交平台的“武器化”倾向。[7]

其次是特定社交平台内置的人工智能工具所产生的社会偏见。这些以提升工作效率为目标的工具基于“规范性分析”的机制,通过将下一步行动“嵌入”算法来操控用户的行为偏好。例如,社交平台上的词句联想和自动生成的功能和对图片、视频选择的暗示或诱导,都会影响用户对下一步行动的决策。如果使用特定的数据对这些工具进行“训练”,就会导致社会偏见的隐性扩散。杜尔对Twitter的“人工智能裁剪”进行研究后发现,虽然这一工具帮助用户自动选取“精华”部分作为缩略图进行展示,但它优先选择的往往是白人而非少数族裔。

再次还有利用“虚拟网红”来散播似是而非的偏见性内容。虚假的“合成人设”拥有比“社交机器人”更加拟人化和有说服力的背景资料,在社交平台上更容易成为受到粉丝追捧的网红意见领袖(KOL)。在“领英”(LinkIn)等交友平台上,出现了一个名为“凯蒂·琼斯”(KatieJones)的网红,她与多名美国政界顶级人物建立社交网络。美联社在对其照片进行分析和比对之后宣告此人不存在,她的面部特征都由人工智能进行合成,并将此类行为定性为社交平台上兴起的“隐身间谍”活动。

在新闻呈现的方式上,机器人的形象设计在外观和语音上反映了一定程度的社会刻板印象,并通过与用户的精准互动促进了偏见的深度“内嵌”。在新闻机器人的多元呈现方式中,最为明显的伦理困境便是性别偏见,这种偏见主要来源于对机器人的“类人化想象”。最为常见的是具有性别特征的机器人与不同工作与任务相联结的“职业偏好”。例如,虚拟主播通常设定为青年女性,而虚拟评论员通常设定为中年白人男性,这在一定程度上复刻了传统媒体实践中的“刻板印象”。另外,调查显示,用户会更多与具有女性特征的机器人产生情感上的亲近与信任,并且默认“女性”机器人更适合从事信息服务类的工作。

目前最普遍使用的AI机器人是“语音助手”,而具有“专属性”和“服务性”的语音助手通常被设定为青年女性,例如Windows系统的小娜(Cortana)、苹果系统的Siri和亚马逊的Alexa等。这样的人设不仅加深了原有的性别偏见,而且出现了用户“调戏”语音助手的大量案例。“小娜”的语料编写者透露,在其上线初期的对话请求中包含了大量的色情露骨内容。

为了解决这个问题,2019年3月,哥本哈根大学的语言学家和软件工程师合作,推出了全球首个无性别语音助手Q。其音质采集自五个不同性别的原型并进行合成和训练。系统研发者还在欧洲进行了4600人次的测试,最终将Q呈现为频率在145赫兹上下的“中性”声音。Q的出现是对AI固有的“无意识偏见”的揭示和反抗,目的是彻底消除智能传播领域的性别刻板印象,充分彰显新媒体的社会责任。这意味着人工智能在新闻传播领域的运用逐渐跳脱了技术中心主义的窠臼,成为社会改革和进步的工具,也意味着AI在新闻传播领域的实践创新中,应当制定更高的产品标准,更为严格地界定用户特性。[8]

在新闻的推荐分发上,算法对内容可见性和可及性的影响会导致“拟态环境”中对特定事件不同观点呈现的权重失衡,从而导致新闻舆论场撕裂和极化。在平台化时代,算法接管了长期以来传统媒体“把关人”的角色。因此,持有不同立场的社群将偏见的扩散归咎于平台出于政治目的对“新闻菜单”的选择性呈现。

除了算法本身的偏差之外,相关研究发现,在线广告定位中的种族差异相当显著,用户生成的在线数据会产生固化偏见的“反馈闭环”,导致种族偏见成为智能传播中的“抗解问题”。虽然从理论上讲,不同观点的数据库储存应当体现“权重均衡”的原则,但用户的搜索行为会打破这种均衡状态。他们更加频繁点击含有某种观点的内容,尤其是在受到算法推荐的诱导之下。这样一来,算法之中的协同过滤机制对特定观点会更加“敏感”,某一方信息的可见性会呈现出几何级数的增长。目前,社交平台已经成为首要的新闻来源,每天数十亿全球用户的点击和搜索行为客观上起到了固化偏见和加剧分裂的作用。

近来,AI助推偏见扩散的“抗解难题”引发各方关注,要求强化算法治理的呼声越来越高。美国国会就偏见、“误讯”和内容审核等议题召开了多次听证会,传唤Facebook创始人扎克伯格等社交平台巨头。一些民权组织也发起了诉讼,迫使后者承担起打击仇恨言论和调整算法模式的责任。

智能媒体时代社会偏见的治理

平台化时代,社交平台算法的广泛运用加剧了社会偏见扩散的危机。算法本身的机制性偏差和一些使用者的蓄意利用,都使得算法成为危害社会公平正义的重要因素。除了强化法制层面的“他律”进行“治标”之外,推动和深化技术“自律”才是治本之道。对社会偏见扩散进行消弭需要从算法核验、智能偏见探测和人机耦合三个方面入手,充分发挥人工智能和人类智能的协同作用。

首先是算法核验。从算法在新闻传播之中的运用逻辑入手,对算法依托的基础数据库和算法运行的规则进行公平性核验。并且对AI新闻产品的生产、呈现方式和分发结果进行监管,消弭算法对社会偏见的催化作用。

第一个步骤是加强数据的“预处理”,让数据库储存数据保持精准和公平,有意识降低算法推荐与输出结果的关联性,由此生产出能够呈现不同立场和观点的新闻文本。AI新闻应当通过有意识地增加更多“数据点”来适当提高非主流观点的权重,并且在数据处理的过程中引入“反事实公平”(counterfactualfairness)的核验方法,从而对边缘弱势群体的歧视性内容进行“稀释”和“过滤”,确保信息传播的公平性。

第二个步骤是完善对技术的“后处理”,根据模型输出预测的结果,对输出内容按照“适配公平化”的原则进一步修正。

第三个步骤则是在增强透明性的同时,增强算法系统的“易解性”,主要是对具体决策的达成方式和导致结果的数据特征进行合理化解读,帮助用户核查在决策过程中所考量的因素是否包含偏见。[9]

“算法审核”是目前较为成熟的有效工具之一。在缺乏人工监督和干预的情况下,机器人通常会在“特征优先级”方面选择带有偏见性的语素作为算法推荐的最佳预测因子。这类工具的使用可以帮助机器人纠正这一趋向。例如,对于YouTube等视频网站而言,使用“算法审核”可以帮助我们了解哪些类型的视频会被优先推荐,其推荐系统是否有意散播偏见性信息。虽然“算法审计”和“反事实公平”等工具引入新闻传播业的成本还比较高昂,实际运用还比较有限,但“智能偏见预测”已经成为提升算法治理水平的突破点,未来成果及其广泛运用值得期待。

再次是人机耦合。在人工智能得以广泛运用的当下,“人类智能”的作用不仅没有被削弱,反而在算法治理中得以强化,这一点在新闻传播领域表现得尤为突出。人机耦合与协作也被证明可以在新闻生产、呈现和分发的过程中有效阻断偏见的扩散,提升新闻媒体的公信力和可靠性。调查显示,算法依赖于数据库的特性可以为新闻用户提供“客观”“准确”的观感,但是用户对真人记者的信赖度又高于新闻机器人和算法推荐。因此,从理论上说,机器自动生成的文本与真人记者的专业素养相结合,能够实现智能传播可信度的最大化。从实践运用来看,人机耦合与协作需要依赖跨学科、跨领域的技术研发,协商如何在新闻传播实践中“内嵌”道德标准,并建立起行之有效的“算法问责”制度。

小结与展望

人工智能在新闻生产中的运用目前已经从节省人力成本、提高效率发展到延伸专业新闻工作者的感知范围、强化其判断能力的阶段。人工智能可以在生产过程中拓展记者搜集新闻线索的范围,并增强他们对新闻内容的理解,在新闻呈现阶段为用户带来更加多元的体验,并且在新闻分发的过程中为用户筛选出类似于“我的日报”这样的定制化内容。但是,AI运用也为新闻媒体带来了社会偏见扩散的伦理困境。为了回应这一挑战,新闻传播学界与业界共同努力,通过在技术维度上的“算法核验进化”和社会维度上的“人机耦合”为消除偏见和维护社会公平开辟了创新路径。

应当看到,消除机器算法的偏见与消除人类社会的偏见一样充满挑战性。在现实生活中,偏见以隐蔽的方式影响对特定群体和个人持有的态度和行为。消除偏见的主要阻碍便是偏见的“无意识性”。这种隐形的偏见是在日常生活中不断接触到的关于他人的直接和间接信息中日积月累而形成的,与对“他者”认知的发展交叠在一起贯穿于整个人生的发展历程之中。消除偏见的另一个困难是偏见的“有效性”。偏见已经在某种程度上演变为一种可以增强决策过程的“保护机制”,尤其是当决策面临的风险较高时,人们通常会选择墨守成规的“保险方案”,从而将根深蒂固的偏见保持下去。心理学领域用于隐性偏见预测的一种行之有效的偏差评估工具是“内隐联想测验”(IAT)。其结果显示,虽然可以使用技术手段提示个体存在的隐性社会偏见,但依旧很难带来个体行为的改变。

偏见作为人类社会中无法根除的痼疾,应当实施更为长期化、系统化的举措来消弭其负面影响,阻断其扩散机制。在智能传播时代,社交平台作为公众获取信息的首要渠道既要推进人工智能的深入运用,也要重塑传播生态,弥合社会裂痕,维系人类社会的长治久安。从更为宏观的层面上看,模拟和拓展人类智能的人工智能技术应当嵌入人类社会运作的方方面面,推动包括新闻传播在内的各个领域内的创新探索。在“人类智能”力有不逮的情境下运用“人工智能”对社会偏见进行有效治理,也应当在“训练”人工智能走出其伦理困境的同时,带动人类社会在道德伦理水准上的共同提升。

参考文献

[1]XuY,GuanK,LeiL.Reviewontheprinciple,ProgressandApplicationofBlockchainTechnology[C]//JournalofPhysics:ConferenceSeries.IOPPublishing,2020,1651(1):012041.

[2]MASONWALKER.U.S.newsroomemploymenthasfallen26%since2008[EB/OL].(2021-07-13).https://www.pewresearch.org/fact-tank/2021/07/13/u-s-newsroom-employment-has-fallen-26-since-2008/.

[3]HoweP,RobertsonC,GraceL,etal.ExploringReporter-DesiredFeaturesforanAI-GeneratedLegislativeNewsTipSheet[J].SpecialIssueTheme:AIandtheNews,2022:17.

[4]BarbaraGutierrez.Canartificialintelligencehelpjournalists?[EB/OL].2022-07-01.https://news.miami.edu/stories/2022/07/can-artificial-intelligence-help-journalists.html.

[5]ReutersStaff.ReutersandSynthesiaunveilAIprototypeforautomatedvideoreports[EB/OL].(2020-02-07).https://www.reuters.com/article/rpb-synthesia-prototype-idUSKBN2011O3.

[6]BBC.BBCGlobalNewslaunchesAI-poweredsyntheticvoicewhich‘reads’articlesonBBC.com[EB/OL].2020-11-16.https://www.bbc.co.uk/mediacentre/worldnews/2020/life-project.

[8]MeetQ.FULLSPEECH[EB/OL].(2019-03-09).http://www.genderlessvoice.com/.

[9]WaddellTF.Cananalgorithmreducetheperceivedbiasofnews?Testingtheeffectofmachineattributiononnewsreaders’evaluationsofbias,anthropomorphism,andcredibility[J].Journalism&masscommunicationquarterly,2019,96(1):82-100.

[10]GoldwasserD.Teachingcomputershowtoidentifyideology:UsingAItodeducebiasinsocialmediaandnewsarticles[J].2018.

[11]SilbergJ,ManyikaJ.NotesfromtheAIfrontier:TacklingbiasinAI(andinhumans)[J].McKinseyGlobalInstitute,2019:1-6.

(史安斌:清华大学新闻与传播学院教授、爱泼斯坦对外传播研究中心主任,本刊学术顾问;高姝睿:清华大学新闻与传播学院硕士研究生)

【文章刊于《青年记者》2022年第19期】

本文引用格式参考:

史安斌,高姝睿.人工智能在新闻传播中的运用:实践探索与伦理困境[J].青年记者,2022(19):92-96.

转载于:青年记者杂志

特别声明:本文仅代表作者个人观点

责编:李倩宇|审核:曾婷婷

免责声明:本文为转载文章,部分文字/图片来自互联网,无法核实真实出处,我们致力于保护原作者版权,如涉及版权问题,请及时联系我们删除。

【他山之石】论媒介化社会的媒介管理创新

【他山之石】视频化生存:深度媒介化时代的社会重构与反思

【他山之石】境况逆转?推特陷入裁员流言,美国大型报纸裁员率5年来最低

【他山之石】韩国踩踏事故:负面消息越多越怕看新闻,你有这种心理吗?

【他山之石】老龄社会的新青年研究:概念隐喻、议题重构与公共叙事

【他山之石】元宇宙入口,AI科技营销的前瞻与创新

【他山之石】我们用什么样的姿态关注元宇宙

【他山之石】网络社会中的城市声誉传播管理

【他山之石】发展与突破:我国东北三省地市级广电媒体融合发展状况

【他山之石】儿童与电子媒介的关系是怎样的?这8篇论文提供了一些思路

【他山之石】“文字讨好症”悄然流行:是社交内卷,也是社交内耗?

【他山之石】垂直与破圈:都市报向文化传播服务机构的转型

【他山之石】智媒时代舆论的特征、实质及对策

【他山之石】西方Z世代的社交媒体偏好转向

【他山之石】AI画作拿下一等奖:争议之余,再谈媒介对人的延伸

【他山之石】美国社会极化:电视的作用远超社交媒体

【他山之石】网络社交新迷思:人人讨厌已读不回,人人都在已读不回

【他山之石】七问:媒体深化融合中的新媒体战略与竞争策略

【他山之石】社交媒体的终结与推荐媒体的诞生,正在同时进行?

END返回搜狐,查看更多

人工智能时代对媒体的挑战浅析

目前对于人工智能大致有两种看法:一种认为人工智能是美好的、值得期待的,而另一种观点则认为人工智能是人类文明的威胁。尽管在人工智能方面存在巨大分歧,但无人能阻挡这个时代的快速到来。十年来互联网和手机的发展普及说明,高科技浪潮是无法抗拒的,作为媒体人顺应发展才是唯一出路。

二、信息传播形态面临多重挑战

众所周知,随着外部环境的重大变化,互联网、物联网和大数据的快速发展,信息传播已经从文本、图像、视频、音频等单一媒体形态过渡到相互融合的跨媒体形态。当前几乎所有媒体都已经自觉不自觉地走上媒体融合的道路,这是世界传播新闻史上发生的最大变化。报刊、电台、电视台之间的相互融合成为常态,不同媒体呈现“你中有我、我中有你”的融合状态。

技术的发展使媒体在某些方面已经大大超出国家社会原先对媒体形态和体制机制的认知范围。在被称为“后媒体时代”的今天,我们受到的挑战,更多更直接的将是来自人工智能时代的技术冲击,我们认为这将是今后十年内媒体业界遇到的最大挑战之一,并且这些挑战将与媒体发展如影相随。

(一)媒体形态面临升级转型挑战

在互联网技术发展基础上,中国媒体已经实现了第一次转型,即由传统媒体向新媒体的融合转型。无论中央主流媒体、地方媒体还是新兴互联网媒体,基本形态都发生了巨大变化,而下一步媒体融合必然要向智能化方向发展。从新闻信息生产到传播整个产业链都将围绕人工智能技术发展而不断调适变化。目前可以观察到已经有两个方面已经和正在发生变化。一方面是受众需求的变化。随着人工智能的普及发展,受众对新闻信息的需求同步发生变化,技术保障了新闻产品时效性,新闻零秒时差成为可能。如不久前美国拉斯维加斯赌场发生枪击案,现场视频几乎同步出现在中国观众面前。同时,移动化、视频化成为新闻信息受众的新追求,不能适应这一需求的传统媒体,其生存空间将进一步受到挤压。

另一方面是媒体技术的变化。过去十年间,媒体生产方式和生产工具发生革命性变化,数码摄影技术的平民化、信息传播的便利化等使新闻生产成本日益降低,自媒体雨后春笋般涌现,新闻单位垄断新闻信息发布的格局被打破,信息呈现爆炸状态。而在步入人工智能时代门槛后,智能化工具将迅速取代现在的媒体生产工具,采编发工具革命势必进一步引发媒体管理的变迁。媒体技术平台将更趋于精致化、智能化、一体化。例如,语音智能工具将取代传统采访录音的语音整理,机器翻译工具将打破更多语言隔阂障碍。

目前,媒体融合的主要形式是音视频之间的融合、传统报刊与互联网站的融合、通讯社与电台电视台之间不同业态的整合组合。而在人工智能背景下,这样的整合将变得更容易简单,可能出现多种融合集于个体一身的状态。智能化的办公方式,将真正打破集体办公模式,远程编发稿件、记者多能化将成为常态。信息的收集将更为方便快捷,智能传感器的广泛应用犹如天眼,可以为新闻信息提供更多现场素材。而更大的突破,将是跨媒体智能的普遍应用,高效的智能芯片和硬件像生物大脑和感知系统那样以极低功耗来高效地表达外部世界的复杂结构。

具体来讲,我们认为AR技术发展将使新闻产品更具体验式样,由目前的音视频化进入交互体验互动阶段,新闻产品形态和受众阅读工具都将随之发生改变。新闻感染力、现场体验力、与读者的互动力将得到发展,新闻产品立体化是个大方向。

中国工程院院士、北京大学教授高文认为,跨媒体智能理论研究主要围绕跨媒体感知计算理论展开,从视、听、语言等感知通道把外部世界转换为内部模型的过程出发,实现智能感知和认知。可以预料,在智能搜索引擎、计算机视觉和图像处理、机器翻译和自然语言理解、数据挖掘和知识发现方面,智能技术的每一步发展,都将对社会带来深刻影响,媒体当然无法置身度外。

(二)人工智能应用引发内容品质变化的挑战

大数据的运用已经对媒体发生重大影响。除了大量正面影响,如增加数据性分析,提高媒体报道内容的丰富性,也出现了媒体内容浅化与社会责任之间的矛盾。

新技术的运用大大提高了媒体人的劳动效率,数据抓取日益发挥着不可或缺的作用。同时,对数据的依赖以及对流量的追求,也导致一些媒体从业者逐渐放松了对内容的自我要求。商业网站和自媒体,甚至主流网站媒体也不能免俗,加入搏眼球、标题党的行列,有些信息含金量几乎为零,甚至是谣言。如“快看,刚刚中国又出大事了”“速看,马上被删的内幕”“太震撼了,美国白宫南草坪出现毛泽东雕像”等等,不一而足。媒体降低自身品格,陷入传播浅薄化泥淖,把十分严肃的内容用轻浮的口吻表达,这不是新闻文风改革,而是一种新闻自轻。目前国内自媒体难以计数,微信公众号等各种形式的传播渠道每天产生大量分享内容,但真正优质作品不多见。新闻信息的重复生产传播导致新闻信息垃圾充斥的现象值得警惕。

(三)人工智能将加剧媒体及相关领域的洗牌

媒体运营中最主要的两个环节——生产与传播(传播过程包括营销)均将受到前所未有的挑战。在生产环节,智能化应用一方面提高劳动生产效率,一方面也会导致媒体人员被替代。如智能机器人写稿技术的成熟将导致一些相关领域从业人员面临被裁员;与此同时,智能技术倒逼媒体采编发传统流程再造,对媒体适用人才提出更高要求,对媒体通才(一专多能、采编发合一、采访评论兼顾、国内外新闻通吃等)的需求等变化将冲击目前全国新闻院校的设置课程与人才培养目标,新闻教学面临重大变革。甚至有观点认为,这将导致一些新闻院校、专业被取消,或改为短期培训场所。

传播环节,新兴媒体的更迭将加速。十年来,从新浪博客一家独秀,到腾讯微信、微博、推特、公众号等自媒体迅速发展、互相取代来看,新兴媒体必然随着新技术的成熟经历兴衰周期,未来媒体形态业态实在难以估摸。这一点,现在就有必要做一些畅想。同样,新闻机构经济效益的获取也将经历重大转变,由过去的借助行政手段推广推销产品逐步向全面以市场导向为主转变。同时,随着用户阅读习惯的转变,盈利手段平台也将发生重大转移,从传统纸质广告向电子广告转移,由固定广告空间向移动电子空间转移。目前看来,媒体机构越来越重视手机广告的经营推送,这是大趋势。

三、人工智能时代呼唤媒体人的主体存在

人工智能时代,之所以被称为时代,就是具有对社会足够深刻的影响力。我们当前正处于互联网时代叠加智能时代,这是媒体业界面临的巨大挑战所在。而且,后者的挑战其深度广度将大大超越前者,其影响怎样估计都不会过高。智能化时代也是人类发展到现阶段面临的前所未有的巨大挑战。人工智能的影响在不久的将来将在各个领域全面体现,涉及交通、军事、科技、医药、教育、养老、伦理等几乎所有领域,其与新闻媒体关注的领域存在巨大交集。

人工智能在媒体的应用尽管可能千变万化,但是万变不离其宗,技术是用来为人的精神服务的,媒体空间发挥人可发挥的作用依然巨大。从现在看,最起码有两个方面还难以替代:一是新闻工作不是简单机械劳动,难以被智能机器取代;二是新闻工作是涉及政治思想宗教文化意识领域的高级劳动,如发表评论、参与国内国际外交舆论斗争等,不是智能化可以替代的,即使利用机器人写稿,也是在特定领域在人工管控下实现的,并且这方面技术的成熟和推广还要有一段过程。

在这一切发生改变的同时,媒体人的作用也将更为突出。媒体专家就像科技专家一样,有自己的研究对象,以及进行媒体舆论报道策划、对报道效果作出科学评价、全面规划媒体发展、评估媒体社会责任感等。智能化时代,媒体专家的核心作用必然得到强化,在激烈的媒体竞争中,媒体专家将实现自身价值和社会价值。

(老记说事微信号:laojiss2017)

(林双川:新华社高级编辑;欧阳迪娜:新华社主任编辑)

(图片来源网络)

抽丝剥茧返回搜狐,查看更多

人工智能对新闻生产的影响及发展趋势

2.编辑制作:智能机器人辅助新闻报道

编辑制作新闻是整个新闻生产链条中最为重要的环节。机器写作的出现充分体现了人工智能技术等科技的进步,同时其契合了传媒的发展需求。智能机器人的出现改变了传统仅可由人撰写稿件的历史,创新编写新闻的方式。作用主要体现在如下三大方面:1、机器写作加快新闻生产速度,2、机器写作提升新闻生产数量,3、机器写作减少新闻生产成本。

3.内容推送:个性化定制实现精准推送

在传统媒体时代形成了稳定、单一的途径传播新闻。而在互联网的背景下,将直接打破此种定向因定的传播连接方式,在此背景下分析用户需求关系链将成为工作的重点。而在互联网业态发展变化的这一过程中,新闻信息传送平台的形态也在随之而发生深刻改变。当前互联网已经处于Web3.0与Web4.0阶段,依托智能平台可实现总的传播用户需求。在完善大数据与算法的同时,实现智能化服务,为用户构建一个需求供给相互匹配的个性化连接的数据通路。构建智能平台旨在匹配用户与内容;从而为用户奉上个性化、人性化的服务;从本质上说构建的关键在于形成如下平台:其一是用户沉淀平台;其二是大数据资源平台;其三是内容平台。

(二)人工智能在新闻生产中的局限性

1.技术不成熟导致适用范围窄

人工智能化新闻生产依托于的大量数据,这对于需要处理、分析大量数据的新闻是十分便利的,如财经类新闻报道、体育类新闻报道等。目前也正是这些领域采用新闻写作机器人进行新闻写作,而深入报道类的需要人类的思想、情感、创作的新闻产品,人工智能化新闻生产在目前是无法进行生产的。

2.生产模版化导致新闻缺乏深度

人工智能技术应用与新闻生产后就一直受到“流水线生产”的质疑,将预先设置的程序和模版用不同的数据填充,产出标题相似,导语相似,主体内容相似,背景资料相似,结构相似,格式相似的同类型稿件。

3.信息来源造假导致无法判断新闻真相

记者在新闻采访中经常使用录音笔对当下的语音采访内容进行保存,录音内容也是作为新闻写作可靠的原材料之一。但是当技术泛滥之时,采访时的录音和被采访者提供的录音证据还具有完全的可信度吗?这可能会导致更多的新闻造假,人们制造假新闻的成本也大幅降低。使新闻谣言的滋生和传播变得更加容易和便捷。而辟谣的成本和难度却大大提高。

4.侵犯受众隐私和威胁数据安全

人工智能技术在搜集和处理数据信息时,无法像人类一样分辨筛选是否涉及个人隐私,所以如何在新闻生产中赋予人工智能区分可用数据和隐私数据的能力,对当前的个人隐私保护和互联网信息安全而言是亟待解决的问题。

Part3人工智能时代新闻生产的发展趋势与反思

(一)新闻生产愈加智能化

智能化技术的发展对新闻生产的影响主要体现在逐渐实现从“技术导向”取代传统的“记者导向”。在此背景下记者退居幕后,不再主要完成采编新闻工作,而是主要负责修正语言、整合结果、统筹分析等方面的事宜。随着智能化技术的发展新闻生产将迎来分布多、数据化、智能化的发展格局。

(二)新闻从业者的危机与转型

随着机器新闻的引入,新闻自动化进入了一个新阶段。算法现在可以根据统计信息和一组库存短语自动生成新闻报道,而不受人类记者的干扰。与过去的其他技术发展和社会趋势一样,人工智能新闻这一新形式使记者重新考虑自己的角色和核心技能。在对这些新技术发展的回应中,新闻是由履行的任务来定义的,而不是拥有实现它们的技能和知识的人。来自人工智能新闻的竞争将迫使记者专注于只有人类可以做的任务。创造力,分析技能和个性变得更加重要,而专业的日常任务将自动化。

(三)对策与反思

随着人工智能技术的发展,万物相连并全面数据化,人们在享受由科技带来的智能、便捷、高效的同时,也要辩证地看待技术发展带来的问题。对于人工智能的“入侵”,人类必须把握其发展方向,坚守人的价值。一是为用户提供针对性的新闻生产,二是拓展报道领域实现广泛应用,三是追寻真相是新闻永恒的生命,四是加快立法进程。

#参考文献:

[1]吴扬.人工智能对新闻生产的影响与发展趋势研究[D].南京艺术学院,2019.返回搜狐,查看更多

人工智能技术在文化产业中的应用与影响研究

摘要:人工智能技术的发展为文化产业提供了诸多应用性机遇;其中一些关键性技术点与文化产业相结合,可以实现文化内容产生、创意资讯传播以及文化市场管理方面的创新。本文拟从几种主要的人工智能技术出发,介绍在技术与产业相结合过程中形成的代表性应用,同时探讨分析目前的人工智能应用带来的“信息茧房”“机器歧视”等社会问题,从而为我国文化产业发展提供相应的经验。

关键词:人工智能;文化产业;算法公平;信息茧房

人工智能(ArtificialIntelligence,AI)本质上是对人的意识与思维的信息过程的模拟,是指使用机器代替人类完成认知、识别、分析和决策等功能。在《人工智能:一个现代路径》[STUARTJ.RUSSELL&PETERNORVIG,ARTIFICIALINTELLIGENCE:AMODERNAPPROACH1034(3ded.2010),supranote7,at4.]一书中,“人工智能”被定义为:行为是为了获得最好的结果,或者在不确定的情况下,获得期待的最好结果,这是一种“理性行为”选择。在过去的十余年中,人工智能技术在以深度学习为代表的机器学习、语音识别、自然语言生成与处理、计算机视觉等领域取得不少成果,引得全球广泛关注。

世界各国都在积极部署关于人工智能的战略规划,2016年10月,美国和英国双双出台国家人工智能战略。就我国而言,2017年,国务院印发《新一代人工智能发展规划》,其中提出到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元[国务院:新一代人工智能发展规划[J].重庆与世界,2018(02):5-17.]。

基于此,本文重点关注人工智能技术在文化产业――即新闻出版、发行、广播电视、电影、文化艺术、文化信息传输、广告服务和文化休闲娱乐等领域中的应用现状、存在的问题及对策,从而为我国文化产业发展提供可借鉴思路。

一、人工智能的主要技术类型与文化产业中的典型性应用

在美联社于2017年发布的《人工智能工作手册》中,人工智能在新闻业应用最频繁的技术主要有5类,包括机器学习、自然语言技处理术、语音识别技术、机器视觉和机器人技术[余婷,陈实.人工智能在美国新闻业的应用及影响[J].新闻记者,2018(04):33-42.]。在整个文化产业当中,目前应用最为广泛的技术类型是以深度学习为代表的机器学习,其他4类技术类型也均有不少应用落地。

通过上表可知,人工智能中的虚拟代理、机器人自动化、机器学习、深度学习、生物与语音识别、自然语言生成与处理(NLP)、硬件优化与决策管理等技术可以与文化产业中的信息采集、内容生产、信息传播和受众管理等有效结合,提供诸如内容个性化算法、受众目标与偏好识别、自动新闻内容生产等方面的服务,也可以提供在客户管理与市场调研方面的有力手段。

目前,国外一些先进的文化媒体机构对于上述技术的应用已经形成一定的有益经验与有效做法。

首先,在内容生产中,人工智能可以实现自动写作与自动摘要、抽取式新闻写作,并试图使机器像人类一样阅读与思考。

美联社是最早运用AI技术进行自动化写作的媒体之一。2014年,美联社与美国AutomatedInsights公司合作,使用该公司开发的自动化写稿程序Wordsmith来自动编发企业财报新闻。该程序几分钟内可写出150-300字的快讯,每季度能生产4000篇财报新闻,是过去数量的10倍。2015年之后,国内腾讯新闻、新华社和今日头条等也陆续推出了写稿机器人。

其次,在信源数据收集中,人工智能可以基于传根器应用生成内容,实现信息传播的可视化追踪。

NewsTracer是路透社使用的新闻追踪系统,这一系统每天可以对5亿条Twitter信息进行分析,从假新闻、广告和杂音,以及众多的人名、机构和地点中找到真的新闻事件与线索,这让记者能够从社交媒体的众多信息中脱身,把更重要的时间用来挖掘故事。

第三,在文化创意视频类服务中,人工智能可以实现文本和视频之间的转换、高效寻找视频片段与资源以及优化视频内容搜索等。

Zorroa是美国的一家视觉资产管理公司,2017年,公司推出企业可视化智能平台(EVI),帮助用户对大型数据库中的可视资产进行搜索和运行分析。在与索尼影业的合作中,EVI通过面部识别、图像分类、机器学习等方式整理、分析了索尼多年来积累的数百万小时的视觉资产。使用该平台后,平时需要27小时才能搜索到的特定视频资源,仅需3分钟即可检索到,为索尼影业的视频资源开发带来极大的便利[https://zorroa.com/case-studies/]。

第四,在文化信息传播中,人工智能可以通过受众的好奇点与文化传媒内容进行匹配、通过信号源获取受众的兴趣点,并且精准分析受众,预测其内容消费需求,实现精准投放。

Netflix是在用户个性化分发业务上较为成熟的视频网站。2016年年报显示,Netflix拥有9300万全球会员,每天流媒体播放超过1.25亿小时的电视节目和电影。预测用户想要观看的内容是其公司业务模式的关键部分。2016年,Netflix开发名为Meson的应用程序,构建、培训和验证个性化算法,提供视频推荐建议。类似的企业还有IRIS.TV等,该公司曾在三个月的时间内运用个性化分发,将其客户所在公司的观众存留率提高了50%[https://www.techemergence.com/ai-in-movies-entertainment-visual-media/]。

最后,在市场调研与客户管理方面,人工智能可以获知受众对内容消费的使用特点、通过深度神经网络技术来感知受众对文化内容的情感参与和变化,从而进行有效的客户管理与市场营销。

2016年,日本广告公司MaCannEricksonJapan聘用了全球第一个使用人工智能开发的机器人创意总监AI-CD?。当年9月,机器人创意总监与人类创意总监以同一个广告主题各自开发了10分钟的广告片,并交由全国民意调查评判。尽管人类创意总监以8%的微弱优势险胜,AI在受众分析与市场营销方面的潜力不容小觑。

可见,人工智能已经显著改变了媒体格局――包括观众发现和参与内容的方式,以及内容创建和分发给观众的方式。目前,算法不仅会影响受众在不同平台上看到的内容,还会首先影响平台生产和创建的内容。人工智能从根本上改变了受众行为和创作过程。

二、人工智能应用对文化产业发展的影响与启示

尽管统计显示,就目前的全球文化产业而言,仅有8%的文化企业已经部署并使用了人工智能技术应用[https://www.ibc.org/tech-advances/the-future-is-artificial-ai-adoption-in-broadcast-and-media/2549.article],但人工智能技术对文化产业乃至整个社会的影响已经有所显露。

就其积极意义而言,人工智能技术在提高内容生产效率、提升用户留存率以及优化文化产业资产管理等方面存在重要意义、毋庸置疑的高效率和部分的不可替代性。而就其消极影响而言,内容分发的局限性开始受到社会关注;人工智能算法的公平化、透明化一度遭受质疑;算法带来的偏见与歧视又引发社会伦理问题;人工智能应用背后的商业力量或许是造成这一系列问题的原因之一……

不少科技界声名显赫的人物也因此表达了对人工智能未来发展的担忧,如特斯拉创始人埃隆・马斯克曾说:“我们应该十分小心地看待人工智能。我越来越倾向于认为,在国际或者国家层面上应当有相应的人工智能监管措施,以防人类做出不可挽回的事情来。”微软创始人比尔・盖茨、物理学家史蒂芬・霍金等也表达了类似的看法。未来人工智能应用将在何种程度上造福于人类,部分取决于今天我们在何种程度上理解并解决人工智能可能产生的问题与自有弊端。

具体而言,本文将从如下三方面阐述人工智能应用的问题、影响与对策:

(一)内容分发的局限性:“信息茧房”

如今的网络文化空间,从某种意义上说,是一个算法帮助公众做决定的环境。如果说曾经的传统媒体为公众搭建了一个“拟态环境”,不同的编辑部依托各自的编辑方针、新闻判断原则,以“议程设置”的方式决定着每日媒体内容的生产加工,那如今,在网络媒体中这一权力部分地转交给了算法。算法可以决定人们阅读哪些新闻,观看哪些视频,收到哪些广告,人们的数字存在(DigitalExistence)日益受到算法左右。

文化传媒企业使用算法决定内容推荐的初衷是在于解决信息过载的问题,提高用户获取信息的效率,更希望借此增加用户的沉浸时长,提高应用的用户忠诚度和留存率。因此,企业利用大数据主动搜集用户信息,根据用户自身兴趣,为用户定制个性化内容,形成一整套精确的内容分发模式。Facebook信息流产品Newsfeed、对话式新闻产品微软小冰和Quartz、今日头条以及Netflix、IRIS.TV等一系列人工智能应用均属于此类型。

这一初衷是好的,但问题出在“精确”上。信息越精确,代表着信息涉及的范围越狭窄。人工智能研究者已经发现,仅仅关注推荐系统的精确度远远不够,这会导致用户难以获取足够的信息增量,视野越来越狭隘。美国学者桑斯坦在其著作《信息乌托邦》[凯斯・R・桑斯坦.信息乌托邦:众人如何生产知识[M].法律出版社,2008:206-208.]中指出,人们借助网络平台和技术工具,在海量的信息中,完全根据自己的喜好定制报纸和杂志,进行一种完全个人化的阅读。在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的“信息茧房”中。

学术界不少学者指出“信息茧房”问题的危害,将“信息茧房”与群体极化、证实性偏见等议题关联起来。学者陈昌凤认为,信息的个人化偏向容易产生詹姆斯・斯托纳(JamesStoner)1961年提出的群体极化现象,即团体成员从开始只是有某些偏向,通过协商、讨论,逐渐朝偏向的方向继续移动、形成极端的观点,甚至引发社会波动,如散播错误信息、形成极端性社会团体、公共理性批判缺失等[陈昌凤,张心蔚.信息个人化、信息偏向与技术性纠偏――新技术时代我们如何获取信息[J].新闻与写作,2017(08):42-45.]。与此同时,人们总是倾向于寻找、阅读自己认同的信息来佐证自己的认知,加深了信息的个人化偏向。对垂直细分领域内容的追逐,弱化了公共事务领域内容的传播,网络社会中传统媒体讲求的“社会公器”意义式微,一个对公共事务冷漠、毫无参与感与同理心的社会将会是“信息茧房”之下最极端也最为悲剧性的结局。

对此,文化传媒企业和公众这两个主体都需要采取一定的对策。对于文化企业而言,应当在推荐的精确度指标之外,加入新的算法推荐考量指标,如多样性、覆盖率、新颖性等;另外,有研究表明,基于关联规则的推荐方法要优于基于内容规则的推荐方法,更易为用户发掘新的兴趣点,现有的障碍在于关联规则难以抽取、耗时长[刘辉,郭梦梦,潘伟强.个性化推荐系统综述[J].常州大学学报(自然科学版),2017,29(03):51-59.]。

而对于公众而言,文化传媒企业设置算法推荐的初衷就有迎合用户喜好的意味,用户越是喜欢哪一类内容,平台就越是推荐哪一类内容。因此用户想要逃离“信息茧房”,第一个步骤就是反省自身,提升自身的媒介素养。平台可以帮助用户实现媒介素养提升,如每周发布用户阅读周报,告知用户在阅读中各类型信息的占比情况,提示用户哪一类信息了解匮乏等,起到一定的督促作用。

(二)从算法偏见到机器歧视――算法的公平与透明化困境

当我们在日常生活中的决策权部分地交给算法之后,我们本能地期待着一个更加公平、透明的环境。但是,一个不容忽视的问题是:算法或者机器真的能够做到公平、公正、不偏不倚吗?算法的规则是否本身就带有人类固有的偏见呢?

2015年5月,Google的照片应用加入自动标签功能,应用更新不久,一位黑人程序员发现自己的照片竟然被Google打上“大猩猩”的标签。Flickr类似的自动标签系统也犯过大错,曾把人标记为猿,把集中营标记为健身房。2016年3月,微软公司的人工智能聊天机器人Tay上线。可是上线不到一天,Tay就被网民“教育”成为一个集反犹太人、性别歧视、种族歧视等于一身的“坏孩子”,被强制下线。此外,有研究称谷歌广告服务会默认为女性用户推送比男性用户薪水更低的广告。这些事件一方面反映出现有的人工智能、机器学习技术的不成熟,另一方面,机器歧视(MachineBias)问题开始进入公众视野。

2017年,Pew研究中心曾在研究报告《算法时代》[LeeRainie,JannaAnderson:Code-Dependent:ProsandConsoftheAlgorithmAge,http://www.pewinternet.org/2017/02/08/code-dependent-pros-and-cons-of-the-algorithm-age/]中指出:“算法的客观中立仅仅是理想,创建算法的人即使尽量做到客观中立,也不可避免地受到自身成长环境、教育背景、知识结构和价值观的影响。此外,创建算法所依赖的底层数据的有限性也会导致算法偏见。”

那么,算法偏见的来源在哪里?首先,存在错误、不准确和无关的数据可能导致偏见。输入不完美、甚至有错误的数据,自然会得到错误、有偏见的结果。

其次,机器学习的过程可能是偏见的另一个重要来源。例如,一个用于纠错的机器学习模型在面对大量姓名的时候,如果某姓氏极为少见,那它在全部数据中出现的频率也极低,机器学习模型便有可能将包含这个姓氏的名字标注为错误,这对罕见姓氏拥有者和少数民族(姓氏与非少数民族不同)而言就会造成歧视[曹建峰.人工智能:机器歧视及应对之策[J].信息安全与通信保密,2016(12):15-19.]。这类歧视的来源并非程序人员有意识的选择,具有难以预料、无法估计的特点。

再者,正如Pew报告所指出的,算法可能先入为主地默认了算法创建者或者底层数据中带有的价值判断,从而产生了性别、宗教和种族方面的歧视。这类歧视主要是由于产品设计(DiscriminationbyDesign)的局限性。

种种算法偏见与机器歧视的案例让我们不禁怀疑,“公平”这一社会理念到底是否可以被操作化,成为被准确量化的算法规则。而与此同时,机器自动化决策的不透明性使得准确量化公平难上加难。机器决策是经由算法这一“黑箱”(Blackbox)完成的,也就是说,不论是普通人还是熟悉公平原则的社会学者,均无法了解算法的内在机制、原理,更无法监督机器的决策过程。因此,当算法的编程人员不清楚或者未能统一“公平”的内涵与规则时,他们自身的偏见就会在一定程度上影响算法,同时他们也可能会忽视算法可能产生的偏见,不公平的人工智能应用随之产生。

正如学者DanielleK.Citron在《技术正当程序》中所说,对于关乎个体权益的自动化决策系统、算法和人工智能,考虑到算法和代码,而非规则,日益决定各种决策工作的结果,人们需要提前构建技术公平规则,通过设计保障公平的实现,并且需要技术正当程序,来加强自动化决策系统中的透明性以及被写进代码中的规则的准确性。

日前,美国弗吉尼亚大学学者AhmedAbbasi等在《让“设计公平”成为机器学习的一部分》(Make“FairnessbyDesign”PartofMachineLearning)一文[https://hbr.org/2018/08/make-fairness-by-design-part-of-machine-learning]中指出,可以通过将数据科学家与社会科学家组队、谨慎打标签、将传统的机器学习指标与公平度量相结合、平衡代表性与群聚效应临界点(criticalmassconstraints)以及保持意识等方法减少算法形成歧视的可能性。其中,“平衡代表性与群聚效应临界点”是指在对数据进行采样时,应既考虑数据的整体特征,同时不忽略某个特定少数群体或者极端数据情况。只有这样,机器学习模型在预测一个普通人和一个特殊群体时,才能都给出更为准确的答案。

另外,谷歌也开始倡导“机会平等”,试图将反歧视纳入算法。还有学者引入“歧视指数”的概念,为设计“公平”的算法提供具体方法。我们必须清楚,人工智能总是通过一个快速且脱离人类社会与历史的学习来完成自我构建,因而一个未经完善的机器学习模型必然存在“道德缺陷”。在人工智能应用的构建中,人类与人类长久以来葆有的道德与社会规则不能缺席。

(三)人工智能应用背后的力量

“信息茧房”的形成不是由于信息广度不足,内容生产不够,而是由于信息推荐固定地集中在某一特定领域造成了信息的窄化;算法偏见的形成不是由于机器学习具有天生的弊端,而是由于人类未将公平公正的原则纳入算法考量之中。人工智能应用背后存在着的,是人的力量与符合经济社会的商业逻辑。

为了迎合消费者,信息推荐系统会将消费者的阅读“口味”作为依据。当搜索引擎通过机器学习意识到,搜索八卦新闻的人愿意在日后更多地看到八卦新闻,为了提升用户留存度,搜索引擎会相应地减少其他类型新闻推荐。

为了满足商家,人工智能产品会把更昂贵的产品卖给用户忠诚度高的用户,即“大数据杀熟”现象。同时,为了更加精准地进行广告投放,人工智能偶尔也会忽视公平原则,例如女性用户通常会收到比男性用户薪资低的推荐广告。这样的现象发人深省,未来是否有必要通过一定的法律手段,要求包括文化企业在内的商家作出“不作恶”的商业承诺。

整体而言,我们的社会正被人工智能推向一个新的发展节点。正如[金兼斌.人工智能将给传媒业带来什么?[J].中国传媒科技,2017(05):1.]学者指出,社会和传媒技术的发展,从来都不是线性和匀速的。从工业革命到信息技术革命,每一次社会巨变都伴随着这样一个临界时刻。今天,我们已经能够感受到,我们的日常生活――包括媒介生活中的许多基础性的东西,正在被人工智能应用所搅动。在这样的时刻,只有紧抓机遇、规避风险、解决弊病,才能真正实现行业和社会的跨越式发展。我国的文化产业走到了一个崭新的路口,新的机遇在等待着它。

(责编:尹峥、赵光霞)

分享让更多人看到

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇