博舍

人工智能技术在广播电视行业的落地应用 人工智能在广播电视的应用

人工智能技术在广播电视行业的落地应用

近两年,随着信息化的快速发展,人工智能与广播电视行业尤其是新媒体的融合趋势愈发明显,并对广播电视行业产生更加深入而长远的影响——既开拓了更大的想象空间,也为其高质量发展提供了新动能。

在广东南方新媒体股份有限公司高级副总裁王兵看来,人工智能与广播电视业务应用强相关,是接下来重塑广电媒体核心竞争力的关键。同时,人工智能技术在广播电视行业的落地应用,也将反过来促进人工智能技术自身的快速发展。

1月7日,在广播电视人工智能应用国家广播电视总局重点实验室广东南方新媒体股份有限公司等共建实验室揭牌仪式上,广东南方新媒体股份有限公司、上海海思技术有限公司、腾讯科技股份有限公司一起获得了国家广播电视总局广播电视科学研究院的授牌。

从2017年启动平台的“智能化”升级,到“大平台·新生态”战略的提出,再到如今与海思、腾讯共建人工智能实验室,新媒股份在自我革新、广泛连接的同时,也在为合作伙伴和产业进行赋能。新媒股份正走在一条不断创新的技术进阶之路上。

广电媒体核心竞争力的重塑

人工智能是新一轮科技革命和产业变革的重要驱动力量,也是引领广播电视发展进步的支撑性、示范性关键核心技术之一。而广播电视与人工智能的融合也正在各方的推动下走上快车道。

2018年11月,国家广播电视总局印发的《关于促进智慧广电发展的指导意见》中指出,要充分发挥广播电视内容优势,加快大数据、云计算和人工智能等新技术在广播电视内容生产中的创新应用,进一步增强广播电视内容核心竞争力;2019年5月,国家广播电视总局发布的《广播电视人工智能应用白皮书(2018)》则指出,广播电视行业科技依存度高,人工智能等关键技术对全行业的引领驱动作用更加突出。

可以说,人工智能与广播电视的融合带来的影响是全方位的。王兵表示,“二者的融合必将提升行业在生产制作、分发传输、运营服务、运行维护等方面的工作效率,推动智慧广电新业态的构建,提高广播电视舆论引导力,加速广播电视行业的转型升级。”

虽然当前广电行业的人工智能应用处于较为初级的探索阶段,也就是所谓的“弱人工智能阶段”,但现阶段的人工智能技术在多媒体内容处理、识别、分析、生成和传输等方面的创新,却与广播电视业务应用强相关。一弱一强之下,显现出人工智能与广播电视融合创新的紧迫性。

因此,行业内都开始进行一系列人工智能应用的尝试,建设人工智能技术平台,尽可能地推动广电媒体在人工智能时代的同步升级,进而完成核心竞争力的重塑。新媒股份正是其中的重磅玩家之一。

从技术输出,到技术收入

2017年开始,新媒股份顺应全球信息化发展趋势,启动了平台“智能化”升级的新战略,基于云计算、大数据、人工智能等前沿科技成果,以资源智能化、运维智能化、数据智能化为目标,对平台全面进行“智能化”升级。

也正是在人工智能等新兴技术的落地实践过程中,新媒股份先后打造了云计算、大数据及智能运维等平台,完成了智能推荐系统、智能化自动测试、智能机房及智能审核系统等人工智能应用的实践工作。比如智能运维平台实现了运维工作从被动救火向主动预测、从传统经验型向高新技术型的战略转变;再比如智能审核系统利用视频和图像处理与机器学习相关技术识别审核内容,可以实现视频内容的自动审核,禁止不符合规定的视频,提高审核效率。

目前,无论是IPTV还是OTT,都面临着由规模向价值的转型,随着业态的变迁,让单纯的内容服务难以满足新阶段的新要求。这一趋势下,各方纷纷开始基于电视大屏,基于客厅场景,寻找新的价值、增量,以及边界。随着5G来临,以人工智能为代表的新技术则带来了更多的可能。

于新媒股份来说,一方面,对于人工智能与家庭场景结合所产生的极具想象的场景,新媒股份提出了“大平台新生态”的战略目标,并以人工智能、大数据为核心构建统一的大会员体系,深度聚焦家庭场景,跨界联结家庭生态圈,挖掘家庭场景的新价值。而支撑新媒股份这一战略的,是其构建起的连接2.5亿家庭用户的超级入口。

另一方面,新媒股份正在积极突破IPTV的封闭性,为全国多省市IPTV平台提供相关技术和运维服务。王兵说,“新媒股份愿意与全国IPTV平台分享自己的技术经验,当然也包括人工智能技术。”

据王兵介绍,当下新媒股份的智能化升级已经实现了较大的成本降低和效率提升,人工智能的技术输出也已经覆盖河南、湖南、海南等地区。未来,新媒股份还会进一步加大技术服务的输出,提高技术收入在整体收入中的占比。从技术输出到技术收入,不仅仅是实力的体现,在电视大屏的价值转型过程中,新媒股份的发展思路,也为产业提供了更多借鉴。

新媒股份+海思+腾讯=?

广播电视人工智能应用国家广播电视总局重点实验室为2019年开始设立,而此次获得授牌的三家企业,则是首批21家共建实验室企业名单中的成员。更重要的是,三家企业涵盖了产业三大核心环节——“新媒股份”是全国首家实现独立IPO上市的播控平台运营公司,具备平台运营优势;“华为海思”是终端国产芯片龙头企业,具备终端芯片优势;“腾讯”是全国综合视频内容平台龙头企业,具备内容优势。新媒股份+海思+腾讯,平台运营+终端+内容,强强联合下,更强的势能也将随之产生。

作为重点实验室的共建单位,按照“开放、共享、合作、共赢”的理念,新媒股份将与广科院、海思、腾讯继续加深合作,借助重点实验室这一平台,共同研究人工智能与互动电视的融合发展,探索AI+电视在智慧广电、媒体融合等方面的创新路径,合力推动广播电视智能化、网络化发展。值得一提的是,几方的合作目前已经有了实质性进展。

在国家重点研发计划网络空间安全专项“互联网+环境中基于国产密码的多媒体版权保护与监管技术”项目上,新媒股份作为国产密码技术在DRM领域应用推广的试点示范单位,正与广科院合作,并牵手海思和腾讯,探索适合IPTV及OTT的ChinaDRM应用集成方法,制定相关规范,开展应用试点示范工作,促进4K、8K等超高清视频内容的落地应用;另外,新媒股份正在探索基于华为鲲鹏和昇腾系列的国产芯片集成测试工作,在人工智能、大数据等研究方向进行国产化的试点示范。

当谈及新媒股份未来在人工智能方面的规划时,王兵表示,新媒股份会继续顺应全球信息化发展趋势,逐步完善平台的智能化升级,在“生态服务型”平台架构中全面提升并完善“云-管-端”的智能化立体服务能力和业务服务承载能力。同时,加强人工智能技术的研发投入,加快人工智能的研究和应用落地探索,开展产、学、研的合作模式。在他看来,只有通过这样系统的布局,技术创新能力才会得到更好地激发,市场竞争力才能得以长久地保持。

【分析】人工智能在广电推荐系统中的应用

谷歌无人驾驶汽车始于2009年,2011年为其收购510Systems、Anthony’sRobots等公司。目前无人驾驶行驶里程达180万英里,且成功发布了全球第一款完全能够自动驾驶的原型车“豆荚车”,并宣称到2020年谷歌自动车将正式上市。

谷歌2014年1月耗资2.63亿美元收购DeepMind,并于同年12月与牛津大学的两支AI研究队伍建立合作。2015年2月,Deepmind系统学会了49款雅达利经典游戏。2016年3月,由Deepmind研发AlphaGo以4:1嘉绩击败世界围棋冠军李世石,激发全世界对人工智能的关注。

3)NVIDIA

与CPU相比,GPU具有数以千计的计算核心,及强大、高效并行计算能力,可实现10-100倍应用吞吐量,特别适用于AI海量训练数据情形。目前深度学习解决方案几乎完全依赖NVIDIAGPU。根据艾瑞咨询,2020年全球AI市场规模达1190亿元,市场潜力巨大。据机构预测,硬件市场占AI市场份额将达30%。此外,NVIDIA还专门设计了全球首款针对深度学习的GPU架构(Pascal架构)。

4)Intel

近年来,英特尔将业务从PC芯片、移动芯片拓展至云数据中心、物联网、人工智能等领域,提出“2016重建计划”,根据CBInsights,英特尔在AI领域总投资额排在第二位。英特尔AI终端布局聚焦于人机交互,通过提供英特尔Curie模块、Edison计算平台、CedarTrail芯片平台、RealSense实感技术及凌动处理器等技术,将设备数据上传至后端数据中心。AI后端布局主要是研发适合机器学习CPU芯片(如XeonPhi)、及FPGA芯片,以拓展AI计算性能。

5、人工智能对未来技术革命的影响

GoogleCEOSundarPichai:“过去10年我们一直在做一件事,那就是打造移动优先的世界。而在接下来的10年时间里,我们将转到一个AI优先的世界。”

AmazonCEO贝索斯:“AI在未来20年对社会产生的影响之大怎么评估都不为过。”

二、智能推荐系统总体架构及基础算法

1、总体架构

数字电视节目推荐系统主要由以下四个功能模块组成:用户特性文件模块、节目特性文件模块、合作过滤模块、推荐模块。

2、节目特征建模

1)节目特征描述

基于内容的节目特性可以从节目分类、节目制作信息(主要演员、导演、制作商、制作年代等),节目内容信息(对节目内容的文字描述)、节目播出信息(播出频道、播出时间、节目时间)等几个方面来描述。

节目特征可来自各个途径的文本表述,也可来自对节目的语音识别及图像识别而形成的文本表述,这方面是目前需要研究和加强的领域。

2)节目特征定义

节目特征用于描述节目的娱乐新、知识性方面的特点。常用的节目特征定义方式包括:节目的名称、类型、导演、演员、关键词等元数据信息。

基于节目特征实现个性化推荐的优势在于,只需要分析单个用户的历史行为就可以推荐,即使只有少量用户也可以产生推荐列表,并且推荐的效果往往能够符合用户的“心理预期”,从而提高用户对推荐引擎的信任。

3)节目特征的发展

节目特征模型的准确性对推荐效果的影响显著,目前较成功的商业推荐引擎会采用更专业的描述信息来构建节目特征,常用的描述信息包括:

节目标签:用户对节目评价的“关键词”,一般不成体系;

微类型:由专业人员对节目类型进行细化,netflix目前有一支专业的影评团队给节目标注微类型。

娱乐基因:从更多维度描述节目,如故事背景、特效、奖项、剧情结构、价值观、亚文化等,一般成体系。采用用人工标注的方式成本高昂,业内前沿的技术是用语义分析技术,从影评信息中提取基因,如Jinni目前已支持该项技术。

4)节目特征的定量计算

由于节目特征是通过一系列文本数据构成,在推荐算法中为比较不同节目之间特征的相似性,需要进行定量计算。目前常用的计算方法包括:DICE系数、编辑距离等。

3、用户特征建模

1)用户特征描述

初始用户特征的获取。用户特征文件的自动更新:显性反馈、隐性反馈(聚类、贝叶斯、NN算法等)。显性用户特征:基于分类人群收视率社会调查及用户主动方式的特征提取,能够解决用户初始特征的缺失问题,即系统冷启动和突发兴趣问题;隐性用户特征:来自于用户长期的行为特征数据的提取,反映的是用户稳定的喜好特征。

2)用户特征的定义

用户特征(画像)用于刻画用户收看节目的口味,其最常用的模型是:用户对节目进行评分的列表构成的向量。

用户的性别、年龄、收入等冷数据,在广电业务中使用较少,因广电运营商主要面向的是家庭用户。

3)用户特征的变种

对不同类型节目的评分,对不同节目标签的评分。用户特征的变种,往往能够在某种推荐场景中更准确的描述用户的“口味”,从而使得特定的推荐算法更准确。

4)直接评分

通过节目评分功能直接采集,较知名的评分系统如IMDB,豆瓣电影等;显性评分能够直接了当的反映用户对节目的偏爱程度。评分方法包括:正负值(踩/顶)、5分制、10分制等。

鉴于用户惰性,在没有激励的情况下,用户并不愿意主动进行评分,这会造成用户特征矩阵非常稀疏,导致推荐算法的结果不准确。

5)广电大数据节目推荐系统算法研究及应用-用户特征提取

间接评分:为了解决直接评分过于稀疏的问题,采用计算间接评分的方式构建用户特征。间接评分的修正:点播节目以主动收视为主,直接评分的可信度较高;直播节目以被动收视为主,如果采集到用户收看每个频道时间过长,则时间线上靠后的节目的隐性评分的可信度较低;基于用户收视模式修正间接评分是目前推荐算法研究的前沿之一,netflix等公司正致力该方面的研究。

6)家庭用户的特征提取

在家庭中,多个家庭成员共用机顶盒的情况很普遍,家庭用户的特征建模也是目前业界研究的重点。

目前常用的模型包括:

基于用户组(Group-based)的特征模型:将用户的偏好融合为整个组的偏好,这种模型适用于推荐适于所有成员一起收看的节目;

家庭内部特征模型:将家庭用户的特征按照不同的口味划分为多个特征,每个特征代表了一类需求,这种特征模型有适用于有成员主导电视的情况,例如有孩子的家庭,每天的17点至19点可能由孩子主导电视收看动漫类节目。家庭内部口味的划分方法可以通过人工分类、聚类、双聚类的多种方法实现。

案例:Jinni提供了针对多个口味特征分别推荐的算法,youtube、GroupLens等能够提供针对家庭或多个好友共同收看节目的推荐算法。

7)基于MDS聚类算法的隐性用户特征提取

试验记录20个用户从2006年11月1日到2007年4月30日的全部收视节目,应用MDS变换聚类算法,通过计算可以看到19个用户的收视样本都具有较为明显的聚类特征,将这些收视样本在变换空间的对应点投影到两维坐标系,我们可以清晰地看到聚类云团。

8)基于MDS聚类算法的用户特征提取

按照变换空间像点距离聚类中心近远的排序,本文计算得到了每个用户对应于其每个类别中心的10条实义节目样本。

经过聚类得到的对应于每个用户每个类别中心的节目样本,具有相同或相似的节目特征,基本属于相同的节目类别,这些样本节目的特征,就反映了用户的收视特征。

由于收视记录是基于机顶盒的,也即是基于家庭的,因此上述聚类结果存在多个类别中心的现象是合理的。

4、特征的自动提取

1)TF-IDF自动提取多类特征

TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。

节目标签提取:通过对节目内容信息,评论信息等文本进行分词,利用TF-IDF技术可以提取关键词形成节目标签。

用户画像:将用户看成文档,看过的节目名称和节目标签当作文档的关键词,则可以通过TF-IDF算法,提取用户画像。

5、特征相似度匹配

1)深度学习计算特征相似度

在实际业务场景计算相似度时,单靠特征标签无法解决所有问题。

例如:用户A,有一个标签为琅琊榜,其偏好程度为5;用户B有一个标签为伪装者,其偏好程度为4。如果就这个两个标签计算相似度,A与B的相似度为零。但这两部电视剧为同一套制作阵容,其相似度是非常高的。这时候可以应用词向量模型。

三、广电智能推荐系统的应用

1、广东省广电网络-节目推荐系统功能

2、广东省广电网络节目推荐总体架构

3、广东省广电网络-数据采集系统

系统能力:使用标准HTTP协议采集用户行为数据;支持覆盖300万互动电视用户;支持持久化存储2836亿条用户行为数据;支持采集开机记录、机顶盒心跳、直播行为、点播行为、页面浏览行为、增值业务访问、业务报错日志;支持实时和非实时向第三方系统分发数据。

4、广东省广电网络-节目推荐系统

系统能力:支持热度排行节目推荐;支持关联节目推荐;支持用户口味节目推荐;支持群体喜好节目推荐;输入媒资数据、用户行为数据、BOSS数据;输出推荐列表,支持300万用户规模,180万机顶盒同时在线。

5、广东省广电网络—节目推荐系统分层架构

基于Hadoop集群构建分布式存储和计算平台,对海量用户行为数据、直播、点播节目数据执行离线推荐算法;基于storm和NoSQL技术构建实时计算模块,对用户近期行为(分钟级别)进行实时入库、跟踪处理,通过执行近线推荐算法生成针对用户近期兴趣点的推荐结果;基于用memCached、nginx等技术,实现近线存储、在线分析和应用请求处理功能,根据推荐请求的时间、地域等上下文信息对推荐结果进行最终的拼装、过滤等在线处理;基于机器学习算法,实现学习反馈模块,不断调整推荐算法参数。

四、“智能”运营,赢在未来

1、人工智能,助力广电“智能”运营

2、运营智能化:适时收视率统计、收视分析

3、运营智能化:智能推荐,实现节目与广告的精准推

4、运营智能化:融合推荐引擎,简而精、优而新的新UE系统

5、运营智能化:建立用户流失预警模型,多维度维系和挽留用户

6、运营智能化:一体化智能营销体系,多触点自动化提升营销执行

通过各业务系统运营所产生的数据,为精准营销提供准确的支撑,提升营销目标客户、产品、时机、活动的有效组织和管理,直接为市场营销服务。营销管理平台作为重要桥梁将各类分析和挖掘结果充分应用到营销策划中,并将营销活动信息便捷快速的推送到各类触点渠道,实现营销活动在渠道的落地执行。

7、运营智能化:基于节目、用户、商品的三维关系,建立精准广告系统

2017亚太OTT/IPTV生态大会

大会将于5月17-18日在北京举办,大会由全球家庭互联网创新平台家庭互联网大会(GFIC)发起,是亚太地区规模最大、最具影响力的OTT/IPTV行业盛会。随着OTT/IPTV产业链的健全,OTT/IPTV大会将分别扩散到全国各大城市(上海、深圳、北京、天津、杭州、长沙、广州、)等地举办。

本次大会将由6个组成部分构成,包括“OTT主题报告、IPTV主题报告、视频创新论坛[OTT广告应用电视购物VR]、家庭硬件论坛[电视机、机顶盒、智慧家庭产品]、IPTV新业务发展论坛、IPTV产业投资论坛”,围绕整个OTT/IPTV生态链展开精彩讨论,大会规模也将从OTT、IPTV扩展到AI、4K、智慧家庭、直播等核心区域,这将是一场OTT+IPTV、OTT+AI、IPTV+4K的跨行业合作盛会。为探索OTT/IPTV生态、拓展新市场提供借鉴。

35分钟前

DVBCN,AsiaOTT

众视网:扫描二维码或点击阅读原文可获得主办方特邀门票哦!返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇