人工智能时代,如何做好内容审核和流量反作弊
【数据猿导读】4月21日,由DataFun、数据猿联合微软加速器主办的主题为“人工智能时代:内容审核与流量反作弊”活动在微软亚太研发集团总部举行。本期活动邀请了曾参与、负责360等多家公司内容开放平台建设的资深算法研发工程师刘路、爱奇艺流量反作弊项目负责人张晓明和数美科技联合创始人&CTO梁堃从内容、流量等方面分享了人工智能时代,平台的内容审核与流量反作弊是如何完成的。
记者|郭敏
官网|www.datayuan.cn
微信公众号ID|datayuancn
近日,短视频APP成为众矢之的。因相关短视频内容涉未成年人低俗不良信息,国家网信办相继约谈了快手和今日头条旗下火山小视频相关负责人,提出严肃批评并责令全面整改。之后,微信、QQ也将在互联网短视频整治期间暂停短视频APP外链直接播放功能,涉及的APP包括微视、快手、抖音、西瓜视频等。
新媒体时代,用户每天生产的内容都在爆发式增长,在这些新生产的内容里通常存在着大量的不良内容,会使得用户产生反感,甚至触犯法律,这时就需要对这些新生产的内容进行审核,而传统的人工审核方式已经跟不上爆发式增长的内容量,人工智能时代,如何做好内容开放平台建设成为业内人士关注的热点。
4月21日,由DataFun、数据猿联合微软加速器主办的主题为“人工智能时代:内容审核与流量反作弊”活动在微软亚太研发集团总部举行。本期活动邀请了曾参与、负责360等多家公司内容开放平台建设的资深算法研发工程师刘路、爱奇艺流量反作弊项目负责人张晓明和数美科技联合创始人&CTO梁堃从内容、流量等方面分享了人工智能时代,平台的内容审核与流量反作弊是如何完成的。
当下,内容开放平台有三种类型:用户生产内容、专业生产内容和职业生产内容。大众点评、地图属于典型的用户生产内容;豆瓣、知乎属于典型的专业生产内容;微信公众号、抖音属于职业生产内容。内容开放平台的强社交性、强随机性和强运营性带来的主要问题和矛盾为广告主和消费者之间的矛盾,内容质量和内容之间的矛盾以及流量和质量之间的矛盾。
刘路资深算法研发工程师
刘路认为建设一个行之有效的信用体系是内容开放平台解决这些矛盾的关键。一个常规的信用体系建设架构涉及到内容生产者和用户。内容生产者提交了内容之后去做个人信用和内容审核,审核需要利用大数据风控和信用评级功能,如果审核不通过内容生产者需要进行申诉,两方面审核均通过则可发布内容,之后可进行AB测试和分级发布,而内容发布之后需要进行风险评估,从而判断该内容是否需要召回,并设置相应的召回策略。
刘路特别指出,在内容方面需要设置层层关卡,低信用内容需要被内容信任监控,高信用内容则需设置内容被举报监控,从而最大程度地清除内容开放平台的不合规内容。
当下,视频网站已经形成一条灰色产业链,一些视频平台默认刷量行为,广告展现量中超过20%是虚假的。同时,刷量的流程已经高度程序化,业界缺乏合理的监管。而对于广告主,流量造假与欺诈行为无异。如今,各大视频网站发展十分迅速,如何在用户量较大的情况下,做好流量反作弊?爱奇艺流量反作弊项目负责人张晓明分享了爱奇艺流量反作弊的“术”与“道”。
张晓明爱奇艺流量反作弊项目负责人研究员
在业界,对于流量反作弊并没有统一的定义,在张晓明看来流量反作弊是制造非用户产生或带有一定目的性的数据,并且有机器作弊和人工作弊两种形式。其中机器作弊包括模仿投递日志、调用接口,这种形式设定模式相对固定,短期效果明显;人工作弊则包括微信群、QQ群以及由专人指导的专业APP,指导操作并与用户分成,这种模式不固定,效果与组织规模有关。
利用这两模式进行直播刷人气、网站刷广告、电视剧和商品刷流量,会使得正常用户对产品的判定标准失衡、企业信誉受损、数据分析不准确和成本上升等多种伤害。
在张晓明看来,流量反作弊具有被动防守、事后分析,业务场景复杂、没有通用模型,持续旧规则不断更新新规则等特点,如何进行有效地流量反作弊?基于以往的业务经验,张晓明表示,进行行之有效的流量反作弊需要做好前期的准备工作:掌握投递日志或者数据库中的元数据含义,掌握主体业务的工作模式和场景,避免信息孤岛,了解作弊的目的是什么以及与业务部门进行良好的沟通确认作弊的口径并做好保密工作。准备工作完成之后,在技术方面进行IP信誉、安全画像、加密信息检测和设备硬件信息检测;在业务方面进行规则统计和机器学习。
随着移动互联网的发展,人们的衣、食、住、行各个方面都结合在了一起,这给黑色产业带来了很大的盈利空间。在金融领域有借贷欺诈、盗卡交易、洗钱套现等模式;在电商行业有刷榜、促销活动欺诈等形式;在游戏方面有黑卡、挂机等现象;在社交方面有淫秽色情发帖、欺诈广告等现象。
梁堃数美科技联合创始人&CTO
梁堃表示,面对这些欺诈行为企业采取了相应的措施,但多数企业缺乏全局的风险数据支撑和专业的反欺诈人才团队,随着UGC内容的内在复杂性越来越高,黑产技术水平与专业程度的不断提高,企业面临的挑战越来越多。
当天,基于以往的经验梁堃分享了在内容反欺诈方面的一些经验。他表示,UGC场景包括头像、昵称、发帖、弹幕、评论、个人描述、私信、群聊等,UGC带来的问题:诈骗、广告、色情、暴恐等文本、图片、语音UGC内容。同一个内容在不同的场景下含义不同,单一的关键字黑名单或单一模型极易造成大量误杀,影响用户体验,使用深度学习(RNN)、SVC善NLP技术针对语意理解的不同方面分别建立不同的模型,从多个纬度检测语意环境。采用Char&WordEmbedding自动识别数万种敏感词变体、微信/QQ/手机号等联系方式变体,采用基于CRF的序列标注自动识别并排除干扰。
如今,骗子们分工明确,形成了庞大的黑色产业链。随着人工智能时代的到来,通过大数据、机器学习等技术势必将打击黑产进行到底。(文/郭敏)
ChatGPT代写论文别把人工智能当成作弊帮手
ChatGPT浪潮已经蔓延至教育领域。据北京青年报报道,高校学生越来越多地用ChatGPT辅助完成课程作业及论文。有文科学生表示,通过自建语料库,就可以让ChatGPT为他生成“和自己写得越来越像”的论文;还有理工科学生直接通过这一工具完成编程作业。不仅如此,ChatGPT的强大代工能力直接冲击了传统人力代写灰色产业链,连论文代写都出现降价潮了。客观来说,部分学生用ChatGPT做作业不过是图个新鲜,毕竟年轻人向来走在使用新技术的前沿。为了给完成作业的核心内容腾出时间,利用ChatGPT查查文献、顺顺框架未尝不可。令人担忧的是,已有学生完全把作业交给人工智能来完成。建立一个语料库就能生成论文、输入一个指令就得到一份作业,这和拿别人的作业有何区别?这样的智能助手分明是作弊帮手。让他人替自己完成知识生产的做法本就恶劣,用ChatGPT代替人力代写、简化程序降低价格,岂不是在助推作弊之风?写作业不是为写而写,写论文也不是为论而论。让学生完成功课根本目的,是帮助其形成创造性解决问题的能力。从搜集资料到动笔成文、修改完善,每个环节都需要学生动手动脑才可能有所收获;这个过程也有助于学生提升批判能力、培养学术素养、形成学术规范。如果通过把人工智能训练得和自己语言风格相似,交上一篇难辨真假的作业,不仅老师难以掌握学生的学习状况,学生本人更是一无所获。让人工智能写作业,看似省了一时的功夫,却废了长久的功夫。这样的风气如果在学术研究的基础阶段蔓延,对于学术生态、学术精神,无疑都是一种破坏。鉴于人工智能存在的“作弊”隐患,国内外已有部分高校发布禁止或限制ChatGPT使用的规定,一些期刊和出版机构也对人工智能写作工具的使用提出了相应要求。这些措施有助于限制用人工智能作弊的行为,但彻底杜绝的关键还是使用者主动拒绝被工具“异化”。正如有专业人士说,“ChatGPT本身没有诚信,只有使用它的人才存在诚信问题。”不管是学生还是学者,都应该明白,学术研究容不得半点掺假,只有自己完成的作品才能谈得上有价值。不能任由人工智能技术成为作弊帮手,但可以用开放的心态去回应。人工智能的有限性决定了它不可能代替人而存在,作为一种辅助工具,它的发展完全可能给教育教学带来更多便利和创新。已有老师意识到,如果学生善于运用ChatGPT,则有利于提升学习的综合能力、提高作业质量,也会督促教授反思自己的教学方法和内容。在信息技术不断发展的当下,学习用新技术为教育锦上添花,也许是一门必修课。海量资讯、精准解读,尽在新浪财经APP构建人工智能未来法治体系
核心阅读
任何技术都是双刃剑,人工智能也不例外。在享受最新技术带来的便利时,不能忽视与之相关的安全问题。要用法治为人工智能产业健康发展保驾护航,让人工智能服务造福人类社会。
从智伴机器人到自动驾驶汽车,再到法院庭审中的智能语音识别,近年来,人工智能已逐渐进入人们的日常生活。
“深化大数据、人工智能等研发应用,培育新一代信息技术、高端装备、生物医药、新能源汽车、新材料等新兴产业集群,壮大数字经济。”今年政府工作报告让人工智能产业看到了前进的方向。
在人工智能迅猛发展的进程中,关于可能引发的道德伦理问题,可能带来的社会治理问题争议不断。
推动新一代人工智能健康发展,法治应该有哪些作为,或者说人工智能产业健康发展到底需要怎样的法治保障?近日,《法制日报》记者采访了人工智能产业领域、法律界的相关代表、委员,以及人工智能法律研究的相关专家学者。
人工智能发展亟需立法保障
几天前,全球首例无人车致死案宣判,Uber公司不承担刑事责任,再次引发了公众对人工智能发展中法律问题的热议。
“如何推动法律体系与时俱进,尽快满足人工智能产业飞速发展和社会进步的需要,这对法治带来了很大挑战。”全国人大代表、科大讯飞董事长刘庆峰说。
与刘庆峰观点一致,在记者采访的代表委员中,无一例外都提出应加快人工智能立法工作。
全国人大代表、中华全国律协副会长刘守民认为,立法一方面要对人工智能发展做引领,另一方面也要规制如发展目标、路径和阶段。但由于人工智能发展飞快,立法往往跟不上发展速度。
关于法律滞后,全国人大代表、重庆盼达汽车租赁有限公司党支部书记、总经理高钰有不同看法:前沿的技术变革和创新的商业模式带来的不确定性,也决定了相关的立法工作会有滞后性。
“但新生事物并非排斥法律法规的制约,相反,法律对于新兴商业模式和技术创新的有效规范和制约能更好地引导企业、行业健康有序发展。”高钰说。
由于人工智能涉及的领域众多,不同领域涉及的立法也存在差异。因此,全国人大代表、北京市律师协会会长高子程建议,前期可在重点领域,比如交通、医疗等先行试点专门立法,待总结经验后再进行综合系统立法。
全国人大代表、致公党上海市委专职副主委邵志清也有类似的建议:“由于涉及面太宽,社会对人工智能的认识还处于初步阶段,目前对人工智能进行综合立法的条件还不具备。但是为了防范重大风险,需要针对人工智能的具体应用进行立法。”
对于立法到底应该从哪些方面进行,基于自己的专业实践,受访者都有不同的认知。
刘庆峰指出,算法、算料(数据)、算力是人工智能技术发展的重要支点,需要有针对性地予以立法规制。
而在高子程看来,还应立法应明确规定人工智能的法律地位、人工智能生成内容的权利归属、人工智能损害后果的责任分担、人工智能风险的法律控制等亟待解决的内容。
邵志清告诉记者,人工智能应用的管理应该重点围绕伦理道德、资源获取、主体认定、行为认定、责任划分等方面进行立法。
“人工智能立法已不仅是一个国内法的问题,这是人类共同面对的课题。”刘守民认为,人工智能发展还需要国内与国际间的协调,通过国际的公约条例,包括技术标准等领域形成共识。
规范司法加强执法不可或缺
“用法治的手段保障人工智能‘安全、可靠、可控’,也是欧、美、日、韩等国发展人工智能产业的必经之路和共同经验。”西南政法大学人工智能法学院院长陈亮说。
在陈亮看来,立法只是法治保障人工智能发展的其中一环:执法、司法等环节同样不能偏废。
高子程也认为,完善立法,规范司法,加强执法,加大普法,积极构建人工智能未来法治体系,用法治保障人工智能健康持续发展。
“在司法中,要坚持法治理念、法治思维和法治方式,树立谦仰、审慎、善意、文明、规范办案理念,恪守技术中立原则,不轻易对司法机关看不准、有市场、受欢迎的技术业态产品采取强制措施,最大限度减少司法活动对新技术发展的不利影响。”高子程说。
在高子程看来,司法还应坚持刑法的谦抑性,在其他法律规范足以保护相应法益的前提下,刑法不应首先介入,只有在其他法律规范无法充分有效保护相应法益时,刑法才有介入的必要和空间。
“在执法环节,应建立专门的执法部门,明确其职权范围,规范其执法程序。”陈亮认为,尤应注意的是,在制度设计时,应以委托代理理论为指导,从制度层面解决好该执法部门的参与约束和激励相容的问题,以免执法过程中出现委托代理人问题,导致人工智能立法流于形式。
为让执法真正有成效,高子程认为,应组织相关执法部门专责制定人工智能领域配套的各种技术规范、技术标准,这个标准应当是对行业自身所发展出来的标准与公共利益、个人权利保护原则的综合考量,其制定程序应当遵循公共参与、听证等行政程序规则。
伦理及安全问题不容忽视
从目前已经投入使用的人工智能产品中看,部分智能庭审系统甚至已经能够基本代替书记员的记录工作,加快了庭审进度。
人们不禁会问,当人工智能广泛应用之时,一些可以替代的传统行业是否会造成大量的失业,造成社会的不稳定。
“解决这些问题首先是在人工智能大规模替代现有工作之前,把社会保障体系建立起来。”刘庆峰说,在社会保障体系之下,人工智能代替了重复性工作后,人会有更多的时间去做创意等不能替代的事情,从而获得社会价值感。
刘庆峰认为,人机合成是未来人工智能的重要突破方向。他举例称,目前“智医助理”可以根据医嘱对话,自动生成对疾病的判断,供医生参考确认。“所以我想人工智能并不是要淘汰人类,而是要让人类站在人工智能的肩膀之上。”刘庆峰说。
对于人类与人工智能的关系,刘庆峰还是很乐观。他认为,人工智能立法应当遵循“人机耦合”和“以人为本”原则。
“这意味着要充分认清人工智能是帮助人的,而不是替代人的,要刺破技术面纱,有针对性地规制技术背后人的行为;意味着要把人民群众的生命和财产安全放在首位,实现人工智能在风险可控的范围内发展。”刘庆峰说。
不论乐观与否,人工智能立法在伦理道德方面还是要有明确规定。
邵志清认为,应明确禁止应用人工智能技术实施违反人类伦理道德的行为,特别是在基因工程、生命科学、情感意识等方面用法律为智能社会划出伦理道德的边界,让人工智能服务造福而不是困扰危害人类社会。
“对人工智能要抱有一定的尊重和敬畏,技术进步带来的东西不见得都是好事,一定要慎重,避免出现有悖伦理道德的事情。”刘守民说。
全国政协委员、360集团董事长兼CEO周鸿祎也认为,任何技术都是双刃剑,人工智能也不例外。“但我们在享受最新技术带来的便利时,也不能忽视与之相关的安全问题。”(法制日报记者战海峰)