音频技术及行业的发展
音频技术的重要性:
在当今社会,工业科技革命的迅速崛起,大数据分析技术、物联网技术、音频技术等的相互融合快速发展,在生物、化学、人工智能等领域有了较大的市场和研究价值。对于音频技术在这之中起到了承上启下、不可或缺的一部分。对于音频技术在这之中起到了承上启下、不可或缺的一部分。虽然音频技术不是当下最热门、最主流的前沿技术,但在其前沿相关技术的使用,甚至是生活的方方面面都有音频技术的体现。
一、音频技术的讨论:1.感觉音频技术没有“大数据”、“云计算”、“物联网”技术火?
其实对于我们来说,就相当于我们平常的考试,如果能考到及格线或者到70-80分是相对容易的一件事,但是想要变得更加优秀,得到90分以上甚至说满分的情况,难度还是非常大的。所谓对于我们人来说金无足赤,人无完人,实际上对于社会生活中的每件事,我们可以相对做的很好但不可能每件事都做到非常完美。对于音频技术的发展来说,而对于音频视频技术的来说,最早可以追溯到1877年世界上第一台留声机的出现,其实在那个时候就已经开始了音频技术的发展。
任何事物的发展都不会呈现指数发展,事物的发展都符合否定之否定这一规律:事物变化发展的方向和道路是由肯定到否定再到否定之否定的循环往复的前进过程。从形式上看,事物变化发展是波浪式前进、螺旋式上升的一个过程。随着工业科技的一次次革命,音频技术逐渐发展,变得日益成熟。当下正值人工智能、大数据、云计算和物联网的迅速交互融合发展,音频技术在其中不可或缺,但是其中音频中很多新的技术很难在研究出来,甚至有阻碍更好的技术取代,当然也就没有当下前沿技术发展的这么”热“。
2.生活和学习中哪些方面我们接触到了音频技术?
在我们的生活和学习中,音频技术的体现随处可见。生活从来不缺乏声音,有声音的世界才是多姿多彩的。从几十年前收音机、电视机、“大头”电脑的出现,随后而来的MP3、MP4、彩色电视机、智能手机的出现,到现在的聊天工具、播放工具、车机系统、甚至是航空航天等等都有音频技术的参与。音频技术在实际应用中主要应用于电子产品中,为了时声音听起来更加立体,音频技术从2D时代进入了3D的音频阶段。早期的电话线只能进行电话通讯,而且会受到电话线和电话声音质量的约束。目前的通话早已不是电话线的通话形式,不仅可以进行移动通话,还可以进行多人线上的通话和视频。这足以体现音频技术在当今世界的发展和历史性变革。
我国的开国大典中,一直保存的黑白影视资料,一直都没有进行彩色视频的修复。随着近几年音频技术的发展,这个沉默多年,使那个曾经黯然失色的影视资料以崭新的一面重新回归到大众面前。这不仅只是修复了一部影视资料,而是体现了我国音频技术的提升,科技实力的和综合国力得到了很大的提高。在这个历史的大变革中,音频技术在这其中经历了一次次的变革,正因为有了音频技术,我们可以把历史长河中把一些美好的东西保留了下来。
二、音频行业的发展趋势:1.音频品质方面发展
随着娱乐产业的发展,其娱乐产业链条下的音频内容有着非常广范围的用户,其使其用户的基数非常之大。中国移动音频市场主要是由移动电台、有声阅读和音频直播构成,新的渠道正在不断的拓宽,所拥有的市场、用户的结构等都在不断壮大。通过政府和网络平台的合作和开放平台本身具有强大的吸引力和调动力,为主播或是直播提供了便利的渠道和更加开放的平台。随着高报酬、高用户量的提升,这也为音频社区的用户提供了一定的福利和高涨的激情,吸引了更多潜在的用户。
早期发展起来的网络音频设备早已不能满足当今用户的需求和满意度。随着科技革命的逐渐更新,网络音频的使用设备逐渐变得多元化,使真个行业快速地进入全场景时代。设备的多元化,不仅仅是设备的数量上的提升,更是音频本身品质上的提高。给用户带来的不仅仅是便捷性的作用,跟重要的是给用户带来了身心上的享受。这也是为什么我国音频用户的使用量逐渐攀升的其中一个重要的原因。当前音频的格式主要有CD格式、WAV、MP3、MID、WMA,不同行业领域对与音频的格式要求也不尽相同。随着音频行业的不断发展,不同层面和领域的人群、满足用户的各种需求和用户量的激增,这也为音频技术的带来了很多的问题,随时准备迎接更高的挑战。
2.音频使用会员制
通过音频本身所具有的优势,社会方方面都会与它来进行关联。各大音频技术的平台和公司进行合作商讨:喜马大学特训营、万人十亿新声计划、有声阅读、《声音画像》各类等一系列的活动或者APP进行线上线下的联动,进行品牌的推广,更重要的是保留、增加用户的基数,提升用户的收听体验以及使用体验。
各类的音频相关的平台推行会员制,提升用户的体验感受和使用的权益,给与更多的福利到会员手中。QQ音乐采用开通绿钻、付费音乐听书会员的权限,进行会员制的要求,将会员价值与硬件相结合,打造闭环式会员增值服务,让会员有不同的听觉享受。
三、音频的未来发展:未来音频技术的发展在各个领域的关系越来越紧密,5G网络和人工智能技术为音频实现全场景覆盖提供了“万物互联”的网络支持和“语音交互”的技术支持。5G网络传输能力大幅度提升,超高速、大容量、低时延、大流量密度、移动性更强的5G网络将使信息传播不再受时间和空间的场景限制。声音渠道不仅传递信号,同时也传递了所有随之而来的理解、深思、同情或宽容。声音中潜藏了能唤起感觉的信息,可以将音频技术带入更为广
人工智能的六个发展阶段,一起来看看吧
原标题:人工智能的六个发展阶段,一起来看看吧人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能从诞生以来,理论和技术日益成熟,应用领域不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能充满未知的探索道路曲折起伏,人工智能的发展历程基本划分为以下6个阶段:
1、起步发展期:1956年—20世纪60年代初人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
2、反思发展期:20世纪60年代—70年代初人工智能发展初期的突破性进展大大提升了人们对人工智能期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标落空使人工智能发展走入低谷。
3、应用发展期:20世纪70年代初—80年代中20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
4、低迷发展期:20世纪80年代中—90年代中随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
5、稳步发展期:20世纪90年代中—2010年由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。
6、蓬勃发展期:2011年至今随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长新高潮。
展开全文想学习云计算、大数据、新媒体的同学注意啦,博雅环球教育针对此次疫情特推出线上免费直播课程,同学们可以趁这个时期,好好充实一下自己,待到春暖花开时,学以致用,大展身手。想报名的同学快来联系我们吧!
北京|内蒙古|呼和浩特|IT计算机培训|云计算|大数据|新媒体|线上培训|免费课程|高薪就业
返回搜狐,查看更多
责任编辑:浅析人工智能生成内容的保护路径
原标题:浅析人工智能生成内容的保护路径随着人工智能技术的成熟,越来越多的行业开始将这项技术运用于商业生产中,如利用人工智能技术进行自动的图像、符号信息处理,进而产生有欣赏价值的绘画、文学内容等。那么,这些内容是否符合我国著作权法中对作品的定义?相关主体是否可以通过著作权法来进行保护?这些问题在司法实务界和理论学界均存有一定的争议。在笔者看来,分析这些问题应把握两个原则:第一,不能因为保护某些行业而采用功利主义来论断适用某项法律,即对人工智能投资者、使用者的保护不一定要通过著作权法的路径来实现;第二,在大陆法系中需要保障法律的稳定性,不能因出现新事物而轻易改变既有法律规则,因此不宜为人工智能创设新的民事主体类型。
功利主义分析的误区
作品的构成要件包括“属于智力成果”“具有独创性”“表达相对完整”等要素。笔者认为人工智能自动生成的内容难以符合第一个要件,即智力成果是由民法上的自然人或法人创作而产生。但是,从外在表现上看,人工智能生成内容有的难以和自然人或法人创作的作品相区分,如果有人把它当成自己的作品使用、寻求著作权法保护,能否得到支持?这就引发了人工智能生成内容是否应该获得著作权法保护的问题。部分学术和司法观点认为:人工智能生成内容从外在表现上难以与人类的作品区分开来,如果有人将其冒充为人类所创作的作品,事实上很难识别出来,因此区分是没有意义的。另外,如果不给予人工智能生成内容著作权保护,人工智能生成物的投资者就缺少对该内容的垄断性,这可能会损害其利益。基于上述理由,如果人工智能生成物外在表现上类似于人类的创作,那么该内容应该被认定为作品。但笔者认为这种推论存在一定逻辑缺陷,需要加以厘清。
思考人工智能生成内容是否应该获得著作权法保护,需要从两个层面思考问题:一是从本质主义的视角,人工智能生成内容是否满足作品的实质性要求;二是从功利主义角度,给予人工智能著作权有无必要。回答第一个问题,需要厘清我国法律对于作品的实质判断要件。其中,著作权法实施条例第三条所称的“创作”和人工智能生产过程是否等价?如果人工智能生成过程属于著作权法实施条例第三条所称的“创作”,那么人工智能生成物可以被认定为作品,但谁才是这一作品的作者和著作权人?这仍然是法律要解决的问题。从功利主义出发,则需要厘清人工智能生成内容是否值得保护。如果回答是肯定的,则需要研究应采取什么路径来进行保护。如果采取著作权法保护路径,该如何确定著作权归属?此时,无论从本质主义还是功利主义层面,都要解决人工智能的法律地位问题。
具体而言,人工智能生成内容的使用涉及人工智能研发者、人工智能使用者、生产内容使用者之间的利益平衡。例如,媒体斥资购买人工智能软件,使用人工智能生成新闻稿件或股市和金融市场快报,若其他媒体未经同意擅自使用该文稿,此类行为无疑会分流前者的受众,损害前者的商业利益。此时,如果将人工智能生成的新闻稿认定为作品,则前者的利益可以获得著作权法的保护。如果新闻稿的独创性较低,无法被认定为作品,还可以通过反不正当竞争法来保护前者的利益,因此,著作权法保护并非是唯一路径。功利主义分析常见的误区是:以保护人工智能使用者的利益来证明人工智能生成内容应当受著作权法保护,这在逻辑上是有缺陷的,两者不是必然的因果关系。
人工智能的法律属性
将人工智能生成内容认定为作品,还面临一个难以逾越的理论难题:人工智能生成的内容不是人类智力创作成果,不满足作品必须是由自然人或法人所创作、具有创造性这两个条件。为此,有人提出可以扩大受著作权法保护的主体的范围,将人工智能作为“赛博人”,即拟制的人加以保护,并且这方面有法人制度可供借鉴。然而,这种思路不仅会导致知识产权法的重大变化,而且也将影响民法有关主体的规定。
根据有关法律规定,法人和自然人一样,具有独立的民事权利能力和民事行为能力,法人以其独立的财产作为民事责任的承担。如果将“赛博人”拟制为新的民事主体,其权利由谁享有?义务和责任由谁负担?如果为其创设新的民事主体规制,那么法人制度的存在还有什么意义?显然,在可以预见的时期内,“赛博人”是无法自行负担其权利和义务的。但是“赛博人”产生的后果,需要由对应的自然人或法人来享受权益承担义务和责任,如此,为什么不采用类似动物致人损害、产品责任这样的传统民法制度来解决有关问题?
具体而言,在权利方面,将人工智能视为“无体物”,其生产的内容视为由“无体物”产生的“孳息”,由人工智能的投资者享有对于“孳息”的利益。责任方面,因人工智能进行的文本和数据挖掘、算法自动生成文字等内容,由此造成的民事责任、知识产权责任由财产的所有者、使用者承担无过错责任。因此,引入“赛博人”作为新的法律主体的必要性要画个大大的问号。更核心的问题是人工智能生成内容也不具备创造性,因为就目前的“弱人工智能”而言,其可以进行运算但是不会进行思考,遵循数理逻辑但不具备自然人或法人的理性。除此之外,人工智能更没有自然人非理性的情感机制。因此,人工智能不具备著作权法上作者的“人格”特质,其生成的内容也不具备创造性,而创造性是人类特有的能力,是人区别于物的根本属性之一。
“工具论”的合理性
人工智能不具备独立的民事主体资格,人工智能自动生成的内容不满足作品的“智力成果”要件,但是,这并不能排除人工智能生成内容可能受到著作权法的保护,只是著作权主体仍为自然人或法人,而该类人工智能生成内容是作为人利用技术辅助生成的作品加以保护的。创作作品是人的主体性的实现,是人的自由意志的运用,人可以直接创作作品,也可以借助一定的工具完成、甚至通过委托他人实现创作目的。就部分“弱人工智能”生成内容而言,本质上是创作者借助人工智能这一工具进行创作,而生成物是人意志发动的结果,是人的自由意志的实现,因而是人的意志的产物。人工智能生成内容的过程是运用一定的算法进行信息加工选择的过程,因此算法体现程序设计者的主体意志和选择,而程序的使用者某种程度上承认、接受了该算法,创作方向和人工智能设计方向有着高度的契合,这种对算法的接受也是使用者自由意志的选择。所以人工智能生成内容归根结底是人的自由意志的运用和实现。人工智能使用者运用人工智能生成的表达可以作为使用者的作品加以保护。
通过以上分析可得出初步的结论:人工智能不宜被视为独立的作者或著作权人,但部分内容可以作为人工智能使用者的作品得到著作权保护,也即有人参与创作的人工智能生成物可以被认定为作品。
从功利主义出发,论证人工智能生产内容应该以著作权法保护是有逻辑缺陷的。除此之外,部分观点反驳“工具论”的理由是:既然从内容本身无法分辨一项表达究竟出于人工智能还是自然人或法人,那么在司法实践中还有必要去进行分辨吗?但笔者认为,这实际上是一个证据的问题,应该从举证角度去考虑。即便一项表达事实上出自于人工智能,但由自然人对其进行署名并登记,那么如果无相反证据,法律应推定该表达属于人类智力成果,构成作品。以证据来推定事实是法律制度对现实生活的简化,追求法律的形式正义就需要接受应然层面和实然层面的一定脱节。
因此,在无法举证证明作品不是由人创作而是由人工智能生成的情况下,只能认定该表达构成作品,受到著作权法的保护。在总体上不对人工智能自动生成内容提供著作权保护的情形下,这将导致部分人工智能生成内容实际上可以冒充人类的创作而得到著作权保护,但并不能因此说明所有人工智能生成内容都可以作为作品受到保护,只要它形式上看起来类似人类的创作,这就好比某些假冒商标的商品无法被识别出来,不能因此主张所有的假冒该商标的商品都应该被认定为真品。(华东政法大学龙文懋龙明明)
(本文仅代表作者个人观点)
(责编:林露、李昉)分享让更多人看到
人工智能生成内容的发展历程与概念
人工智能生成内容的发展历程与概念曾理伟2023年5月17日来源:互联网110270繁体1950年,艾伦图灵(AlanTuring)在其论文《计算机器与智能(ComputingMachineryandIntelligence)》中提出了著名的“图灵测试”,给出了判定机器是否具有“智能”的试验方法,即机器是否能够模仿人类的思维方式来“生成”内容继而与人交互。某种程度上来说,人2
欲了解更多AIGC行业的未来发展前景,可以点击查看中研普华产业院研究报告《2022-2027年中国AI智能学习机行业市场全景调研及投资价值评估研究报告》
一、人工智能生成内容的发展历程与概念
1950年,艾伦图灵(AlanTuring)在其论文《计算机器与智能(ComputingMachineryandIntelligence)》中提出了著名的“图灵测试”,给出了判定机器是否具有“智能”的试验方法,即机器是否能够模仿人类的思维方式来“生成”内容继而与人交互。某种程度上来说,人工智能从那时起就被寄予了用于内容创造的期许。经过半个多世纪的发展,随着数据快速积累、算力性能提升和算法效力增强,今天的人工智能不仅能够与人类进行互动,还可以进行写作、编曲、绘画、视频制作等创意工作。2018年,人工智能生成的画作在佳士得拍卖行以43.25万美元成交,成为世界上首个出售的人工智能艺术品,引发各界关注。随着人工智能越来越多地被应用于内容创作,人工智能生成内容(ArtificialIntelligenceGeneratedContent,简称AIGC)的概念悄然兴起。(一)AIGC历史沿革结合人工智能的演进历程,AIGC的发展大致可以分为三个阶段,即:早期萌芽阶段(20世纪50年代至90年代中期)、沉淀积累阶段(20世纪90年代中期至21世纪10年代中期),以及快速发展阶段(21世纪10年代中期至今)。早期萌芽阶段(1950s-1990s),受限于当时的科技水平,AIGC仅限于小范围实验。1957年,莱杰伦希勒(LejarenHiller)和伦纳德艾萨克森(LeonardIsaacson)通过将计算机程序中的控制变量换成音符完成了历史上第一支由计算机创作的音乐作品——弦乐四重奏《依利亚克组曲(IlliacSuite)》。1966年,约瑟夫魏岑鲍姆(JosephWeizenbaum)和肯尼斯科尔比(KennethColby)共同开发了世界第一款可人机对话的机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组完成交互任务。80年代中期,IBM基于隐形马尔科夫链模型(HiddenMarkovModel,HMM)创造了语音控制打字机“坦戈拉(Tangora)”,能够处理约20000个单词。80年代末至90年代中,由于高昂的系统成本无法带来可观的商业变现,各国政府纷纷减少了在人工智能领域的投入,AIGC没有取得重大突破。沉淀积累阶段(1990s-2010s),AIGC从实验性向实用性逐渐转变。2006年,深度学习算法取得重大突破,同时期图形处理器(GraphicsProcessingUnit,GPU)、张量处理器(TensorProcessingUnit,TPU)等算力设备性能不断提升,互联网使数据规模快速膨胀并为各类人工智能算法提供了海量训练数据,使人工智能发展取得了显著的进步。但是AIGC依然受限于算法瓶颈,无法较好地完成创作任务,应用仍然有限,效果有待提升。2007年,纽约大学人工智能研究员罗斯·古德温装配的人工智能系统通过对公路旅行中的一切所见所闻进行记录和感知,撰写出小说《1TheRoad》。作为世界第一部完全由人工智能创作的小说,其象征意义远大于实际意义,整体可读性不强,拼写错误、辞藻空洞、缺乏逻辑等缺点明显。2012年,微软公开展示了一个全自动同声传译系统,基于深层神经网络(DeepNeuralNetwork,DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。快速发展阶段(2010s-至今),自2014年起,随着以生成式对抗网络(GenerativeAdversarialNetwork,GAN)为代表的深度学习算法的提出和迭代更新,AIGC迎来了新时代,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。2017年,微软人工智能少女“小冰”推出了世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》。2018年,英伟达发布的StyleGAN模型可以自动生成图片,目前已升级到第四代模型StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假。2019年,DeepMind发布了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景下表现突出。2021年,OpenAI推出了DALL-E并于一年后推出了升级版本DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。(二)AIGC的概念与内涵目前,对AIGC这一概念的界定,尚无统一规范的定义。国内产学研各界对于AIGC的理解是“继专业生成内容(ProfessionalGeneratedContent,PGC)和用户生成内容(UserGeneratedContent,UGC)之后,利用人工智能技术自动生成内容的新型生产方式”。在国际上对应的术语是“人工智能合成媒体(AI-generatedMedia或SyntheticMedia)”1,其定义是“通过人工智能算法对数据或媒体进行生产、操控和修改的统称”。综上所述,我们认为AIGC既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。为了帮助不同领域的受众群体更好的理解AIGC,我们从发展背景、技术能力、应用价值三个方面对其概念进行深入剖析。从发展背景方面来看,AIGC的兴起源于深度学习技术的快速突破和日益增长的数字内容供给需求。一方面,技术进步驱动AIGC可用性不断增强。在人工智能发展初期,虽然对AIGC进行了一些初步尝试,但受限各种因素,相关算法多基于预先定义的规则或者模板,还远远算不上是智能创作内容的程度。近年来,基于深度学习算法的AIGC技术快速迭代,彻底打破了原先模板化、公式化、小范围的局限,可以快速、灵活地生成不同模态的数据内容。另一方面,海量需求牵引AIGC应用落地。随着数字经济与实体经济融合程度不断加深,以及Meta、微软、字节跳动等平台型巨头的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。数字内容的生产取决于想象能力、制造能力和知识水平;传统内容生产手段受限于人力有限的制造能力,逐渐无法满足消费者对于数字内容的消费需求,供给侧产能瓶颈日益凸显。基于以上原因,AIGC在各行业中得到越来越广泛的应用,市场潜力逐渐显现。从技术能力方面来看,AIGC根据面向对象、实现功能的不同可分为三个层次。一是智能数字内容孪生,其主要目标是建立现实世界到数字世界的映射,将现实世界中的物理属性(如物体的大小、纹理、颜色等)和社会属性(如主体行为、主体关系等)高效、可感知地进行数字化。二是智能数字内容编辑,其主要目的是建立数字世界与现实世界的双向交互。在数字内容孪生的基础上,从现实世界实现对虚拟数字世界中内容的控制和修改,同时利用数字世界高效率仿真和低成本试错的优势,为现实世界的应用提供快速迭代能力。三是智能数字内容创作,其主要目标是让人工智能算法具备内容创作和自我演化的能力,形成的AIGC产品具备类似甚至超越人的创作能力。以上三个层面的能力共同构成AIGC的能力闭环。从应用价值方面来看,AIGC将有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。一方面,AIGC能够以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求;同时能够创新内容生产的流程和范式,为更具想象力的内容、更加多样化的传播方式提供可能性,推动内容生产向更有创造力的方向发展。另一方面,AIGC能够通过支持数字内容与其他产业的多维互动、融合渗透从而孕育新业态新模式,打造经济发展新增长点,为千行百业发展提供新动能。此外,2021年以来,“元宇宙”呈现出超出想象的发展爆发力;作为数实融合的“终极”数字载体,元宇宙将具备持续性、实时性、可创造性等特征,也将通过AIGC加速复刻物理世界、进行无限内容创作,从而实现自发有机生长。二、人工智能生成内容的技术体系及其演进方向AIGC作为人工智能技术和产业应用的要素之一,随着技术能力的不断迭代升级,正在降低内容创作门槛、释放创作能力,未来将推动数实融合趋势下内容创作的范式转变。探讨其能力体系的构成,即赋能内容创作的技术路径,对制定领域内标准、建立行业生态、争取更加广泛的开发者和应用场景具有十分重要的意义。(一)AIGC技术升级步入深化阶段人工智能算法的不断迭代是AIGC发展进步的源动力,从技术演进的角度出发,可将AIGC技术可大致划分为传统基于模板或规则的前深度学习阶段和深度神经网络快速发展的深度学习阶段。早期的AIGC技术主要依据事先指定的模板或者规则,进行简单的内容制作与输出,与灵活且真实的内容生成有较大的差距。该时期的人工智能算法并不具备强大的学习能力,而是大多依赖于预先定义的统计模型或专家系统执行特定的任务。通过巧妙地规则设计,早期AIGC技术可以完成简单线条、文本和旋律的生成。例如,通过定义复杂的函数方程组,计算机所绘出的函数曲线具备某种美学图样;通过记录大量的问答文本,在面对新的问题时,计算机可以通过检索和匹配的方式生成简单的答案,甚至于改写故事。但是由于缺乏对客观世界的深入感知和对人类语言文字等知识的认知能力,早期的AIGC技术普遍面临所生成的内容空洞、刻板、文不对题等问题。参考人类的内容创作过程,研究人员们提出,理想的AIGC算法需要具备对数据内容的学习能力,在理解数据的基础上进行知识与分布的学习,最终实现高质量的内容创作。深度神经网络在学习范式和网络结构上的不断迭代极大的提升了人工智能算法的学习能力,从而推动了AIGC技术的快速发展。不同于传统人工智能算法,深度学习中的损失函数和梯度下降算法可以灵活快速的调整深度神经网络中的参数,从而实现从数据中进行学习功能。2012年,卷积神经网络AlexNet1凭借优秀的学习能力,在当年的ImageNet大规模视觉识别挑战赛中一举夺魁,比第二名传统机器学习算法的错误率提升10.8个百分点,开启了深度学习时代的序幕。就在紧随其后的2013年,深度变分自编码器的提出让AIGC技术能力有了极大的进步。对于给定的神经网络,深度变分自编码器要求网络的输出是对于输入内容的重建,通过重参数化等技巧,网络在重建过程中学习训练数据的统计分布。在测试阶段,变分自编码器通过在学习到的统计分布中进行采样,首次能比稳定的生成从未观测过的低分辨率图像。2014年,一种新的博弈学习范式伴随着生成对抗网络[3]被提出。生成对抗网络由一个生成器和一个判别器组成,判别器致力于不断寻找生成数据和真实数据间的不同,生成器根据判别器的反馈不断完善自身,以求生成真假难辨的内容。得益于双方博弈的学习策略,生成内容的真实性和清晰度都得到了极大的提升,生成对抗网络也被应用于很多内容生成的具体应用。除了变分自编码器和生成对抗网络,强化学习[4、流模型5、扩散模型回等学习范式均取得了喜人的进展,这些模型范式在不同场景中各有优势,让AIGC技术可以快速地应用到不同的场景和任务中。深度神经网络的结构升级是推动AIGC快速发展的另一主要因素。一方面,实验证明,深度神经网络的学习能力和模型大小呈正相关,伴随着模型参数量的增加,相对应深度神经网络的能力一般会取得大幅提升。但是,随意地增加神经网络规模是行不通的,越大规模神经网络往往意味着更大的训练难度,因此深度神经网络的结构设计显得尤为关键。从早期的玻尔兹曼机,多层感知机,卷积神经网络,到深度残差网络和Transformer大模型,网络结构进化带来了深度学习模型参数量从几万到数千亿跃升,模型层数也从开始的个位数逐步发展到成百上千。深度学习模型规模上的量变引起了AIGC技术能力的质变,在新型网络结构的加持下,上述的生成对抗网络等算法开始能生成超高清晰度的视频,高质量的文本段落和优美灵动的乐曲旋律。另一方面,研究者们在深度神经网络结构的设计中引入包含语义的隐式表达和物理知识,以降低模型的训练难度、增强生成内容的丰富程度。例如,研究者发现通过在神经网络的每一层引入隐式表达,能够极大地提升内容生成算法的可控性和生成效果。另外,在三维数据的生成任务中,神经辐射场(8在网络结构设计时充分考虑了物理世界的固有约束,极大提升了三维渲染效率和效果。AIGC要真正发挥对不同行业的驱动作用,需要与各行各业的特异性场景深度融合。在处理这些实际应用中,深度学习算法在感知、认知、模仿、生成等方向的基础能力决定了AIGC技术所能创作的生产力。近些年中,这些算法技术齐头并进、百花齐放,并最终形成了AIGC应用于不同场景的底层支撑。通过人工智能支撑技术的不断升级,AIGC技术将持续赋能各类文化创意、生产生活、科学发现等各种场景。
关注公众号
免费获取更多报告节选
免费咨询行业专家
相关深度报告REPORTS2023-2028年国内监控摄像机行业发展趋势及发展策略研究报告
监控摄像机是用在安防方面的准摄像机,它的像素和分辨率比电脑的视频头要高,比专业的数码相机或dv低。监控摄像机大多只是单一的视频捕捉设备,很少具备数据保存功能。监控摄像机从外型上主要区...
查看详情
产业规划特色小镇产业园区规划产业地产可研报告商业计划书细分市场研究IPO上市咨询
人工智能生成内容AIGC
70延伸阅读1如何应对2020年新形势下中国监控摄像机行业的变化与挑战!12782中国经济基本面稳定,但动力和质量较为不足,激光照相机行业发展如何受限?9853经济数字化趋势突出,光缆电工器材行业如何借力发力,企业如何迈出更大一步?7854技术升级提升竞争力,行业转型增强优势,电脑芯片行业企业如何选择?5855投资与产出不成正比,显示器企业如何做出正确的投资规划和战略选择?3926行业集中度在不断提升,不进则退。体感游戏机情报分析把握有力发展方向!285推荐阅读电力市场用电需求与供给分析1、电力市场供给情况分析截至2022年底,全国全口径发电装机容量25.6亿千瓦,同比增长7.8%。从分类型投资、发电装机增...
大气污染防治行业技术发展情况一、主要脱硫技术发展现状分析1、烟气脱硫技术分类目前工业上的脱硫工艺主要用加氢脱硫技术(HDS),它在氧化的过程中...
2023中国监控摄像头线上销量大降14%监控摄像头行业向智能化方向发展监控摄像机是用在安防方面的准摄像机,它的像素和分辨率比电脑的视频头要高,比专业的数码相机或dv低。监控摄像机大多...
脱硝催化剂市场分析一、脱硝催化剂原材料市场分析“催化剂”是一种有助于改变物质的化学反应的物质,它可以改变反应的速率,但不会影响最...
白羽肉鸡苗价格小幅上涨白羽肉鸡祖整体呈增加趋势一季度白羽肉鸡祖代种鸡更新增加据卓创资讯数据统计,一季度国内白羽肉鸡祖代种鸡总更新量26.66万套,环比增加42.87%...
有机农产品企业发展分析欲了解更多有机农产品基地行业的未来发展前景,可以点击查看中研普华产业院研究报告《2022-2027年中国有机农产品基地2...
猜您喜欢2023工程机械设施建设需求应用前景
2023年医疗机器人市场现状及未来发展前景趋势分析
2023年生物柴油市场发展现状及前景分析
2023年橡胶市场发展现状及前景分析
2023年西药行业发展现状与趋势分析
2023年阿胶行业竞争现状与趋势分析
【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。中研网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。联系方式:jsb@chinairn.com、0755-23619058,我们将及时沟通与处理。