博舍

人工智能生成内容(AIGC)白皮书(2023年) 人工智能的关键技术包含哪些方面的内容

人工智能生成内容(AIGC)白皮书(2023年)

一、人工智能生成内容的发展历程与概念

(一)AIGC历史沿革

(二)AIGC的概念与内涵

二、人工智能生成内容的技术体系及其演进方向

(一)AIGC技术升级步入深化阶段

(二)AIGC大模型架构潜力凸显

(三)AIGC技术演化出三大前沿能力

三、人工智能生成内容的应用场景

(一)AIGC+传媒:人机协同生产,推动媒体融合

(二)AIGC+电商:推进虚实交融,营造沉浸体验

(三)AIGC+影视:拓展创作空间,提升作品质量

(四)AIGC+娱乐:扩展辐射边界,获得发展动能

(五)AIGC+其他:推进数实融合,加快产业升级

四、人工智能生成内容发展面临的问题

五、发展建议与展望

(一)发展建议

(二)未来展望

工业互联网的关键技术有哪些

工业互联网是新一代信息通信技术与工业制造领域深度融合的产物,将对工业基础设施、工业生态以及商业模式产生深远的影响和变革。通过人、机、物的全面互联,实现全要素、全产业链、全价值链的连接,将推动全新的工业生产制造和服务体系的形成。

站在“十四五”的起跑线上,我国工业互联网已驶入发展快车道。去年底,工业和信息化部印发《工业互联网创新发展行动计划(2021-2023年)》,对未来三年我国工业互联网领域的发展目标、发展重点等进行了全面阐述。2021至2023年将是我国工业互联网的快速成长期。未来三年,我国工业互联网将在基础设施建设、融合应用、技术创新、产业生态、安全保障等几方面得到长足发展。

其中,技术创新将是我国工业互联网发展的重要一环,那么,未来几年,工业互联网的发展对技术提出了哪些需求和挑战?将在工业互联网领域发展中起到重要作用的核心技术有哪些?

首当其冲当属5G。一方面,5G通信技术将对工业互联网发展提供重要支撑;另一方面来说,工业互联网领域将成为5G大展身手的重要舞台。5G技术具有的大带宽、低延时、高可靠的特性,在传统的个人通信领域并未显现出超越4G的质变,而在工业领域,可以说是如鱼得水,物尽其用。低延时、高可靠的特性补足了无线技术在工业场景应用的短板,并能给工业应用领域带来前所未有的灵活性、移动性、柔韧性。正因如此,在《工业互联网创新发展行动计划(2021-2023年)》中关于技术能力提升的内容中,“工业5G芯片/模组/网关”的研发被列为重要目标。

而另一个将在工业互联网中大展身手的将是边缘计算。在工业领域,云计算架构模式的一些不足之处日益显现:实时性难以保障、运维成本高、数据安全存在风险。这都催生了边缘计算技术的应运而生。边缘计算由于具有的低延迟、高实时性等优势,能满足未来工业互联网的建设需要,受到高度关注。借助边缘计算技术打通云、边、网、端等关键环节,可满足工业在敏捷连接、实时业务、数据聚合、应用智能等方面的关键需求。

而5G在工业互联网领域的落地,离不开一个新晋的热点技术——TSN。时间敏感网络(TSN)是工业互联实现低时延、高可靠和确定性传输的重要技术之一,5G+TSN是未来实现工业互联网无线化和柔性制造的重要基础。TSN在做数据转发时,可以针对工业互联网不同优先级的业务数据进行队列调度,从而实现质量差异化保证。在工业互联网场景下,TSN可以针对各类工业应用涉及的业务流特性进行建模和定义,并在此基础上提供不同的优先级与调度机制。

工业互联网的发展将带来爆炸式增长的数据,这也为另一项技术在工业领域的应用带来了重要基础和必然,那就是人工智能。工业领域的人工智能技术包括专家系统、机器学习、知识图谱、深度学习等,贯穿于设计、生产、管理、服务等工业领域的各个环节,实现了模仿甚至超越人类感知、分析、决策等能力的技术、方法、产品及应用系统。人工智能技术的应用,将对企业降低成本、提升效率、服务模式及业务模式创新带来新的动能。

此外,安全技术、区块链技术、数字孪生技术、AR/VR等都有望在工业互联网的发展中起到重要作用,赋能工业互联网的发展。

2021年4月9日至11日,第九届中国电子信息博览会(CITE2021)联合同期的第97届中国电子展将在深圳会展中心举办。届时,“CITE2021工业互联网发展与安全峰会”将于4月10日举办。本届峰会坚持“创新为核、安全为先、数据赋能、产业先行”为理念,旨在持续提升工业数据资产价值创造能力,不断提高工业互联网自主创新能力和网络安全水平,为“十四五”期间工业高质量发展保驾护航。

“CITE2021工业互联网发展与安全峰会”的主办单位为我国信息安全领域的国家队——中国电子信息产业集团有限公司,承办单位为中国电子信息产业集团有限公司第六研究所等,围绕工业互联网发展最新趋势和“十四五”工业互联网发展要求,特邀两院院士、知名专家、企业负责人、高校教授,针对工业互联网“发展”与“安全”两个维度,对工业互联网发展中面临的新技术、新要求、新变化、新趋势,以专题报告、学术征文、圆桌论坛、现场交流等形式,开展丰富多彩、内容翔实的系列峰会活动。峰会议题及学术征文选题征集方向包括:

(一)发展技术方向:

1.工业互联网体系架构研究;

2.工业互联网5G传输技术研究;

3.工业互联网智能感知与边缘计算研究;

4.工业互联网大数据技术;

5.工业互联网数字孪生技术;

6.工业互联网区块链技术应用研究;

7.工业自动化智能管控技术研究;

8.工业互联网智能制造、智能工厂规划与仿真技术研究;

9.工业机器人、工业智能装备与控制技术。

(二)安全技术方向:

1.工业互联网安全协议标准研究;

2.工业互联网入侵检测技术研究;

3.工业互联网的身份安全认证体系、权限控制机制;

4.工业互联网智能化的安全防护体系;

5.工业互联网软件监测安全研究;

6.工业互联网与区块链融合安全研究;

7.工业互联网中信息对抗技术研究;

8.工业互联网通信系统安全研究;

9.工业互联智能终端安全防护研究;

10.工业互联网中的大数据技术安全;

11.工业互联网中数据加密技术研究。

工业互联网的发展离不开产学研用各界的共同努力,“CITE2021工业互联网发展与安全峰会”(点击报名)的召开,为工业互联网领域专家学者提供了一个良好的交流学习平台,必将对我国工业互联网的发展起到巨大的促进和推动。

人工智能的五大核心技术

自然语言处理

自然语言处理是指计算机拥有的人类般的文本处理的能力。比如,从文本中提取意义,甚至从那些可读的、风格自然、语法正确的文本中自主解读出含义。一个自然语言处理系统并不了解人类处理文本的方式,但是它却可以用非常复杂与成熟的手段巧妙处理文本。例如,自动识别一份文档中所有被提及的人与地点;识别文档的核心议题;在一堆仅人类可读的合同中,将各种条款与条件提取出来并制作成表。以上这些任务通过传统的文本处理软件根本不可能完成,后者仅针对简单的文本匹配与模式就能进行操作。

自然语言处理像计算机视觉技术一样,将各种有助于实现目标的多种技术进行了融合。建立语言模型来预测语言表达的概率分布,举例来说,就是某一串给定字符或单词表达某一特定语义的最大可能性。选定的特征可以和文中的某些元素结合来识别一段文字,通过识别这些元素可以把某类文字同其他文字区别开来,比如垃圾邮件同正常邮件。以机器学习为驱动的分类方法将成为筛选的标准,用来决定一封邮件是否属于垃圾邮件。

因为语境对于理解“timeflies”(时光飞逝)和“fruitflies”(果蝇)的区别是如此重要,所以自然语言处理技术的实际应用领域相对较窄,这些领域包括分析顾客对某项特定产品和服务的反馈,自动发现民事诉讼或政府调查中的某些含义,自动书写诸如企业营收和体育运动的公式化范文,等等。

机器人

将机器视觉、自动规划等认知技术整合至极小却高性能的传感器、制动器以及设计巧妙的硬件中,这就催生了新一代的机器人,它有能力与人类一起工作,能在各种未知环境中灵活处理不同的任务。例如,无人机、可以在车间为人类分担工作的“cobots”等。

语音识别

语音识别主要是关注自动且准确地转录人类的语音技术。该技术必须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪声、区分同音异形/异义词(“buy”和“by”听起来是一样的)方面存在一些困难,同时还需要具有跟上正常语速的工作速度。语音识别系统使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列与语言中概率的声学模型等。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。比如Domino抯Pizza,最近推出了一个允许用户通过语音下单的移动APP。

上述5项技术的产业化,是人工智能产业化的要素。人工智能将是一个万亿级的市场,甚至是10万亿级的市场,将会为我们带来一些全新且容量巨大的子产业,比如机器人、智能传感器、可穿戴设备等,其中最令人期待的是机器人子产业。返回搜狐,查看更多

人工智能包含了哪些关键技术

自然语言处理技术是一门通过建立计算机模型、理解和处理自然语言的学科。是指用用计算机对自然语言的形、音、义等信息进行处理并识别的应用,大致包括机器翻译、自动提取文本摘要、文本分类、语音合成、情感分析等。

目前,自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

5、脑机接口技术

脑机接口是在人或动物脑与外部设备间建立的直接连接通道。通过单向脑机接口技术,计算机可以接受脑传来的命令,或者发送信号到脑,但不能同时发送和接收信号;而双向脑机接口允许脑和外部设备间的双向信息交换。

脑机接口信号来自中枢神经系统,传播中不依赖于外周的神经与肌肉系统。常用于辅助、增强、修复人体的感觉–运动功能或提升人机交互能力。

6、知识图谱

知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过关系相互联结,构成网状的知识结构。

7、人机交互

人机交互是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。

8、自主无人系统技术

自主无人系统是能够通过先进的技术进行操作或管理,而不需要人工干预的系统,可以应用到无人驾驶、无人机、空间机器人,无人车间等领域。

无人系统是由平台、任务载荷、指挥控制系统及天-空-地信息网络等组成,它集系统科学与技术、信息控制科学与技术、机器人技术、航空技术、空间技术和海洋技术等一系列高新科学技术为一体的综合系统,多门类学科的交叉融合与综合是无人系统构建的基础。

总之,人工智能的关键技术主要包括计算机视觉、机器学习、自然语言理解、深度学习和人机交互等。由于这些技术有着千丝万缕的联系,使得人工智能发展如日中天。

通过这些关键技术,我们可以构建更深层次,更智能化的人工智能系统来实现人工智能的发展。

以上就是数合宙为您整理的关于企业采购管理系统的内容,就为您介绍到这里。想了解更多科技资讯或企业数字化定制方案,请持续关注公众号【数合】“获取更多精彩内容。返回搜狐,查看更多

人脸识别的十个关键技术组成及原理

人脸识别技术已成为纳入研发参考的、给人们带来高质量生活的又一科技解决途径。日常生活中,人脸识别的应用已经常见,那么你知道它是如何做到如此智能吗?下面,我们就带大家了解人脸识别涉及的十个关键技术。

1、人脸检测(FaceDetection):是检测出图像中人脸所在位置的一项技术

人脸检测算法的输入是一张图片,输出是人脸框坐标序列(0个人脸框或1个人脸框或多个人脸框)。一般情况下,输出的人脸坐标框为一个正朝上的正方形,但也有一些人脸检测技术输出的是正朝上的矩形,或者是带旋转方向的矩形。

常见的人脸检测算法基本是一个“扫描”加“判别”的过程,即算法在图像范围内扫描,再逐个判定候选区域是否是人脸的过程。因此人脸检测算法的计算速度会跟图像尺寸、图像内容相关。开发过程中,我们可以通过设置“输入图像尺寸”、或“最小脸尺寸限制”、或“人脸数量上限”的方式来加速算法。

2、人脸配准(FaceAlignment):是定位出人脸上五官关键点坐标的一项技术

人脸配准算法的输入是“一张人脸图片”加“人脸坐标框”,输出五官关键点的坐标序列。五官关键点的数量是预先设定好的一个固定数值,可以根据不同的语义来定义(常见的有5点、68点、90点等等)。

当前效果的较好的一些人脸配准技术,基本通过深度学习框架实现,这些方法都是基于人脸检测的坐标框,按某种事先设定规则将人脸区域扣取出来,缩放的固定尺寸,然后进行关键点位置的计算。因此,若不计入图像缩放过程的耗时,人脸配准算法是可以计算量固定的过程。另外,相对于人脸检测,或者是后面将提到的人脸提特征过程,人脸配准算法的计算耗时都要少很多。

人脸配准结果举例(右图中的绿色点位人脸配准结果)

3、人脸属性识别(FaceAttribute):是识别出人脸的性别、年龄、姿态、表情等属性值的一项技术

一般的人脸属性识别算法的输入是“一张人脸图”和“人脸五官关键点坐标”,输出是人脸相应的属性值。人脸属性识别算法一般会根据人脸五官关键点坐标将人脸对齐(旋转、缩放、扣取等操作后,将人脸调整到预定的大小和形态),然后进行属性分析。

常规的人脸属性识别算法识别每一个人脸属性时都是一个独立的过程,即人脸属性识别只是对一类算法的统称,性别识别、年龄估计、姿态估计、表情识别都是相互独立的算法。但最新的一些基于深度学习的人脸属性识别也具有一个算法同时输入性别、年龄、姿态等属性值的能力。

人脸属性识别过程(最右侧文字为属性识别结果)

4、人脸提特征(FaceFeatureExtraction):是将一张人脸图像转化为一串固定长度的数值的过程

这个数值串被称为“人脸特征(FaceFeature)”,具有表征这个人脸特点的能力。

人脸提特征过程的输入也是“一张人脸图”和“人脸五官关键点坐标”,输出是人脸相应的一个数值串(特征)。人脸提特征算法都会根据人脸五官关键点坐标将人脸对齐预定模式,然后计算特征。

近几年来,深度学习方法基本统治了人脸提特征算法,这些算法都是固定时长的算法。早前的人脸提特征模型都较大,速度慢,仅使用于后台服务。但最新的一些研究,可以在基本保证算法效果的前提下,将模型大小和运算速度优化到移动端可用的状态。

人脸提特征过程(最右侧数值串为“人脸特征”)

5、人脸比对(FaceCompare):是衡量两个人脸之间相似度的算法

人脸比对算法的输入是两个人脸特征(注:人脸特征由前面的人脸提特征算法获得),输出是两个特征之间的相似度。人脸验证、人脸识别、人脸检索都是在人脸比对的基础上加一些策略来实现。相对人脸提特征过程,单次的人脸比对耗时极短,几乎可以忽略。

基于人脸比对可衍生出人脸验证(FaceVerification)、人脸识别(FaceRecognition)、人脸检索(FaceRetrieval)、人脸聚类(FaceCluster)等算法。

人脸对比过程(右侧的相似度为人脸比对输出的结果)

6、人脸验证(FaceVerification):是判定两个人脸图是否为同一人的算法

它的输入是两个人脸特征,通过人脸比对获得两个人脸特征的相似度,通过与预设的阈值比较来验证这两个人脸特征是否属于同一人(即相似度大于阈值,为同一人;小于阈值为不同)。

人脸验证过程说明(最右侧“是同一人”为人脸验证的输出)

7、人脸识别(FaceRecognition):是识别出输入人脸图对应身份的算法

它的输入一个人脸特征,通过和注册在库中N个身份对应的特征进行逐个比对,找出“一个”与输入特征相似度最高的特征。将这个最高相似度值和预设的阈值相比较,如果大于阈值,则返回该特征对应的身份,否则返回“不在库中”。

人脸识别过程(右侧身份“jason”为人脸识别结果)

8、人脸检索:是查找和输入人脸相似的人脸序列的算法

人脸检索通过将输入的人脸和一个集合中的说有人脸进行比对,根据比对后的相似度对集合中的人脸进行排序。根据相似度从高到低排序的人脸序列即使人脸检索的结果。

人脸检索过程(右侧绿框内排序序列为检索结果)

9、人脸聚类(FaceCluster):是将一个集合内的人脸根据身份进行分组的算法

人脸聚类也通过将集合内所有的人脸两两之间做人脸比对,再根据这些相似度值进行分析,将属于同一个身份的人划分到一个组里。

在没有进行人工身份标注前,只知道分到一个组的人脸是属于同一个身份,但不知道确切身份。另外假设集合中有N个人脸,那么人脸聚类的算法复杂度为O(N2)

人脸聚类过程(右侧绿框内按身份的分组结果为聚类结果)

10、人脸活体(FaceLiveness):是判断人脸图像是来自真人还是来自攻击假体(照片、视频等)的方法

和前面所提到的人脸技术相比,人脸活体不是一个单纯算法,而是一个问题的解法。这个解法将用户交互和算法紧密结合,不同的交互方式对应于完全不同的算法。鉴于方法的种类过于繁多,这里只介绍“人脸活体”的概念,不再展开。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇