博舍

人工智能的发展与未来 人工智能的应用包括哪些方面内容和技术

人工智能的发展与未来

随着人工智能(artificialintelligent,AI)技术的不断发展,各种AI产品已经逐步进入了我们的生活。

现如今,各种AI产品已经逐步进入了我们的生活|Pixabay

19世纪,作为人工智能和计算机学科的鼻祖,数学家查尔斯·巴贝奇(CharlesBabbage)与艾达·洛夫莱斯(AdaLovelace)尝试着用连杆、进位齿轮和打孔卡片制造人类最早的可编程数学计算机,来模拟人类的数理逻辑运算能力。

20世纪初期,随着西班牙神经科学家拉蒙-卡哈尔(RamónyCajal)使用高尔基染色法对大脑切片进行显微观察,人类终于清晰地意识到,我们几乎全部思维活动的基础,都是大脑中那些伸出细长神经纤维、彼此连接成一张巨大信息网络的特殊神经细胞——神经元。

至此,尽管智能的具体运作方式还依然是个深不见底的迷宫,但搭建这个迷宫的砖瓦本身,对于人类来说已经不再神秘。

智能,是一种特殊的物质构造形式。

就像文字既可以用徽墨写在宣纸上,也可以用凿子刻在石碑上,智能,也未必需要拘泥于载体。随着神经科学的启迪和数学上的进步,20世纪的计算机科学先驱们意识到,巴贝奇和艾达试图用机械去再现人类智能的思路,在原理上是完全可行的。因此,以艾伦·图灵(AlanTuring)为代表的新一代学者开始思考,是否可以用二战后新兴的电子计算机作为载体,构建出“人工智能”呢?

图灵在1950年的论文《计算机器与智能(ComputingMachineryandIntelligence)》中,做了一个巧妙的“实验”,用以说明如何检验“人工智能”。

英国数学家,计算机学家图灵

这个“实验”也就是后来所说的“图灵测试(Turingtest)”:一名人类测试者将通过键盘和显示屏这样不会直接暴露身份的方式,同时与一名人类和一台计算机进行“网聊”,当人类测试者中有七成都无法正确判断交谈的两个“人”孰真孰假时,就认为这个计算机已经达到了“人工智能”的标准。

虽然,图灵测试只是一个启发性的思想实验,而非可以具体执行的判断方法,但他却通过这个假设,阐明了“智能”判断的模糊性与主观性。而他的判断手段,则与当时心理学界崛起的斯纳金的“行为主义”不谋而合。简而言之,基于唯物主义的一元论思维,图灵和斯金纳都认为,智能——甚至所有思维活动,都只是一套信息处理系统对外部刺激做出反应的运算模式。因此,对于其他旁观者来说,只要两套系统在面对同样的输入时都能够输出一样的反馈,就可以认为他们是“同类”。

1956年,人工智能正式成为了一个科学上的概念,而后涌现了很多新的研究目标与方向。比如说,就像人们在走迷宫遇到死胡同时会原路返回寻找新的路线类似,工程师为了使得人工智能达成某种目标,编写出了一种可以进行回溯的算法,即“搜索式推理”。

而工程师为了能用人类语言与计算机进行“交流”,又构建出了“语义网”。由此第一个会说英语的聊天机器人ELIZA诞生了,不过ELIZA仅仅只能按照固定套路进行作答。

而在20世纪60年代后期,有学者指出人工智能应该简化自己的模型,让人工智能更好的学习一些基本原则。在这一思潮的影响下,人工智能开始了新一轮的发展,麻省理工学院开发了一种早期的自然语言理解计算机程序,名为SHRDLU。工程师对SHRDLU的程序积木世界进行了极大的简化,里面所有物体和位置的集合可以用大约50个单词进行描述。模型极简化的成果,就是其内部语言组合数量少,程序基本能够完全理解用户的指令意义。在外部表现上,就是用户可以与装载了SHRDLU程序的电脑进行简单的对话,并可以用语言指令查询、移动程序中的虚拟积木。SHRDLU一度被认为是人工智能的成功范例,但当工程师试图将这个系统用来处理现实生活中的一些问题时,却惨遭滑铁卢。

而这之后,人工智能的发展也与图灵的想象有所不同。

现实中的人工智能发展,并未在模仿人类的“通用人工智能(也称强人工智能)”上集中太多资源。相反,人工智能研究自正式诞生起,就专注于让计算机通过“机器学习”来自我优化算法,最后形成可以高效率解决特定问题的“专家系统”。由于这些人工智能只会在限定好的狭窄领域中发挥作用,不具备、也不追求全面复杂的认知能力,因此也被称为“弱人工智能”。

但是无论如何,这些可以高效率解决特定问题的人工智能,在解放劳动力,推动现代工厂、组织智能化管理上都起到了关键作用。而随着大数据、云计算以及其他先进技术的发展,人工智能正在朝着更加多远,更加开放的方向发展。随着系统收集的数据量增加,AI算法的完善,以及相关芯片处理能力的提升,人工智能的应用也将逐渐从特定的碎片场景转变为更加深度、更加多元的应用场景。

人工智能让芯片的处理能力得以提升|Pixabay

从小的方面来看,人工智能其实已经渐渐渗透进了我们生活的方方面面。比如喊一声就能回应你的智能语音系统,例如siri,小爱同学;再比如在超市付款时使用的人脸识别;抑或穿梭在餐厅抑或酒店的智能送餐机器人,这些其实都是人工智能的应用实例。而从大的方面来看,人工智能在制造、交通、能源及互联网行业的应用正在逐步加深,推动了数字经济生态链的构建与发展。

虽然脑科学与人工智能之间仍然存在巨大的鸿沟,通用人工智能仍然像个科幻梦,但就像萧伯纳所说的那样“科学始终是不公道的,如果它不提出十个问题,也永远无法解决一个问题。”科学总是在曲折中前进,而我们只要保持在不断探索中,虽无法预测是否能达到既定的目的地,但途中终归会有收获。

参考文献

[1]王永庆.人工智能原理与方法[M].西安交通大学出版社,1998.

[2]Russell,StuartJ.ArtificialIntelligence:AModernApproach[J].人民邮电出版社,2002.

[3]GabbayDM,HoggerCJ,RobinsonJA,etal.Handbookoflogicinartificialintelligenceandlogicprogramming.Vol.1:Logicalfoundations.,1995.

[4]胡宝洁,赵忠文,曾峦,张永继.图灵机和图灵测试[J].电脑知识与技术:学术版,2006(8):2.

[5]赵楠,缐珊珊.人工智能应用现状及关键技术研究[J].中国电子科学研究院学报,2017,12(6):3.

[6]GeneserethMR,NilssonNJ.LogicalFoundationofArtificialIntelligence[J].brainbroadresearchinartificialintelligence&neuroscience,1987

作者:张雨晨

编辑:韩越扬

[责编:赵宇豪]

人工智能领域技术,主要包含了哪些核心技术

从语音识别到智能家居,从人机大战到无人驾驶,人工智能的“演化”给我们社会上的一些生活细节,带来了一次又一次的惊喜,未来更多智能产品依托的人工智能技术会发展成什么样呢?让我们来看看2018人工智能标准化白皮书里面,对人工智能关键技术的定义。

人工智能技术关系到人工智能产品是否可以顺利应用到我们的生活场景中。在人工智能领域,它普遍包含了机器学习、知识图谱、自然语言处理、人机交互、计算机视觉、生物特征识别、AR/VR七个关键技术。

一、机器学习

机器学习(MachineLearning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法。

根据学习模式将机器学习分类为监督学习、无监督学习和强化学习等。

根据学习方法可以将机器学习分为传统机器学习和深度学习。

二、知识图谱

知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。

知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。

三、自然语言处理

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等。

机器翻译

机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展。

语义理解

语义理解技术是指利用计算机技术实现对文本篇章的理解,并且回答与篇章相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。随着MCTest数据集的发布,语义理解受到更多关注,取得了快速发展,相关数据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。

问答系统

问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有了不少应用产品出现,但大多是在实际信息服务系统和智能手机助手等领域中的应用,在问答系统鲁棒性方面仍然存在着问题和挑战。

自然语言处理面临四大挑战:

一是在词法、句法、语义、语用和语音等不同层面存在不确定性;

二是新的词汇、术语、语义和语法导致未知语言现象的不可预测性;

三是数据资源的不充分使其难以覆盖复杂的语言现象;

四是语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算

四、人机交互

人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术。

五、计算机视觉

计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。

目前,计算机视觉技术发展迅速,已具备初步的产业规模。未来计算机视觉技术的发展主要面临以下挑战:

一是如何在不同的应用领域和其他技术更好的结合,计算机视觉在解决某些问题时可以广泛利用大数据,已经逐渐成熟并且可以超过人类,而在某些问题上却无法达到很高的精度;

二是如何降低计算机视觉算法的开发时间和人力成本,目前计算机视觉算法需要大量的数据与人工标注,需要较长的研发周期以达到应用领域所要求的精度与耗时;

三是如何加快新型算法的设计开发,随着新的成像硬件与人工智能芯片的出现,针对不同芯片与数据采集设备的计算机视觉算法的设计与开发也是挑战之一。

六、生物特征识别

生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。从应用流程看,生物特征识别通常分为注册和识别两个阶段。注册阶段通过传感器对人体的生物表征信息进行采集,如利用图像传感器对指纹和人脸等光学信息、麦克风对说话声等声学信息进行采集,利用数据预处理以及特征提取技术对采集的数据进行处理,得到相应的特征进行存储。

识别过程采用与注册过程一致的信息采集方式对待识别人进行信息采集、数据预处理和特征提取,然后将提取的特征与存储的特征进行比对分析,完成识别。从应用任务看,生物特征识别一般分为辨认与确认两种任务,辨认是指从存储库中确定待识别人身份的过程,是一对多的问题;确认是指将待识别人信息与存储库中特定单人信息进行比对,确定身份的过程,是一对一的问题。

生物特征识别技术涉及的内容十分广泛,包括指纹、掌纹、人脸、虹膜、指静脉、声纹、步态等多种生物特征,其识别过程涉及到图像处理、计算机视觉、语音识别、机器学习等多项技术。目前生物特征识别作为重要的智能化身份认证技术,在金融、公共安全、教育、交通等领域得到广泛的应用。

七、VR/AR

虚拟现实(VR)/增强现实(AR)是以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近似真实环境的感受和体验,通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。

虚拟现实/增强现实从技术特征角度,按照不同处理阶段,可以分为获取与建模技术、分析与利用技术、交换与分发技术、展示与交互技术以及技术标准与评价体系五个方面。获取与建模技术研究如何把物理世界或者人类的创意进行数字化和模型化,难点是三维物理世界的数字化和模型化技术;分析与利用技术重点研究对数字内容进行分析、理解、搜索和知识化方法,其难点是在于内容的语义表示和分析;交换与分发技术主要强调各种网络环境下大规模的数字化内容流通、转换、集成和面向不同终端用户的个性化服务等,其核心是开放的内容交换和版权管理技术;展示与交换技术重点研究符合人类习惯数字内容的各种显示技术及交互方法,以期提高人对复杂信息的认知能力,其难点在于建立自然和谐的人机交互环境;标准与评价体系重点研究虚拟现实/增强现实基础资源、内容编目、信源编码等的规范标准以及相应的评估技术。

目前虚拟现实/增强现实面临的挑战主要体现在智能获取、普适设备、自由交互和感知融合四个方面。在硬件平台与装置、核心芯片与器件、软件平台与工具、相关标准与规范等方面存在一系列科学技术问题。总体来说虚拟现实/增强现实呈现虚拟现实系统智能化、虚实环境对象无缝融合、自然交互全方位与舒适化的发展趋势。人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:在网络大时代背景下,人工智能技术是如何应用的http://www.duozhishidai.com/article-15277-1.html未来人工智能技术,主要包含哪几种?http://www.duozhishidai.com/article-4938-1.html人工智能时代,你需要了解的9大技术领域http://www.duozhishidai.com/article-3845-1.html

————————————————版权声明:本文为CSDN博主「人工智能爱好者」的原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/zhinengxuexi/article/details/88716489

生成式人工智能的演变及其应用 – chatgpt中文站

在今天快速发展的人工智能领域中,生成式人工智能已经成为焦点并引起了技术爱好者和行业专业人士的关注。随着强大算法和高级机器学习技术的崛起,像chatgpt这样的应用成为了城里的谈资,在全球范围内引起了广泛的讨论。

生成式人工智能指的是人工智能领域,专注于创造新的原创内容而不仅是分析现有数据。它使机器能够生成逼真而富有创意的输出,例如文本、图像,甚至是音乐,模仿人类的行为和创造力。这项突破性技术在各行各业开启了无限可能,包括内容创作、虚拟助手、游戏等等。

像其他形式的人工智能一样,生成式人工智能学习如何从过去的数据中采取行动。它可以创建全新的内容,例如基于其训练的文本、图像或甚至计算机代码,而不仅仅是像其他人工智能那样对数据进行分类或标识。每个人都有那种不想再写电子邮件、文章或代码的日子。生成式人工智能正是为了支持你的创造性过程而诞生的。

使用无监督和半监督的学习算法,生成式人工智能处理大量的数据来生成自己的输出。一个例子是,使用大型语言模型,计算机程序现在可以轻易地理解文本并生成新的内容。生成式人工智能的核心神经网络可以捕捉特定图像或文本的特征,然后在需要时发挥作用。

OpenAI的ChatGPT是更广泛的生成式人工智能语言模型中最为知名的。在任何文本提示,如短语或句子中,ChatGPT会返回自然语言中序列中下一个最合乎逻辑的文本。开发人员可以通过展示几个范例或提示来编程ChatGPT。大多数与ChatGPT互动过的人都对其编写连贯、高质量语言的能力感到着迷。

生成式人工智能利用机器学习处理大量的视觉或文本数据,其中许多数据是从互联网上爬取的,然后确定哪些东西最有可能出现在其他东西附近。生成式人工智能的大部分编程工作都用于创建能够区分AI创作者感兴趣的“事物”的算法,例如ChatGPT类似聊天机器人中的单词和句子,或者DALL-E中的视觉元素。但实质上,生成式人工智能通过评估它所训练的大量数据集来创建它的输出,然后根据该数据集确定的概率范围内对提示做出回应。

生成式人工智能的激动人心之旅可以追溯到20世纪50年代和60年代,当时人工智能的先驱们开始探索这个发展中领域的可能性。AI研究人员最初集中于创建基于规则的系统,能够复制人类思维和决策过程。然而,生成模型的概念随着时间的推移开始形成,并彻底改变了许多行业,包括语音识别、图像处理和自然语言处理(NLP)。

新一代生成模型,如贝叶斯网络和马尔可夫模型,在千年之交变得可用,显著推动了机器人技术和计算机视觉的发展。然而,深度学习的发明和随后的进步提高了生成人工智能的门槛。深度神经网络技术使研究人员和创作者能够在生成人工智能方面取得重大进展。2014年生成性对抗网络(GAN)的发展是一个重大里程碑,它产生了极其逼真的图像、电影,甚至是类似于真实的人类生成内容的声音。

今天,生成式人工智能正在许多不同行业的众多应用中得到使用。它已经超越了传统艺术和创造力的范围,可以创作出令人心醉神迷的音乐作品和引人入胜的艺术品。此外,它还使企业能够创造新鲜的产品,增强医疗保健结果,并彻底改变我们使用技术的方式。随着技术的发展和数据可用性的提高,生成式人工智能领域将有望进一步发展,为创造力和发现开启无数机会。

1.文字生成

这是生成式人工智能应用中最负责内容创作领域愈益接纳人工智能的。个人和公司都经常使用像ChatGPT这样的生成式人工智能技术。使用生成式人工智能模型进行文本生成减少了制作新内容所需的时间和精力。这对于营销工作尤其有用,因为组织必须快速有效地制作大量内容。

此外,这些工具还可以帮助创建基于文本的报告并执行复杂的业务计算。上图展示了使用chatGPT通过提示计算广告支出回报的示例。同样,您也可以将其用于商业报告和计算。

2.情感分析

情感分析是生成式人工智能的另一种应用,它涉及文本分析以确定用户的情感或情绪。这对于希望监控客户对其产品或服务的情感的公司非常有用。情感分析也可以用于社交媒体监控、市场研究等领域。以一款帮助分析任何书面文本情感的生成式人工智能工具为例。它分析文本的语法和上下文,以提供情感是积极的还是消极的。

3.图像生成和增强

您可以使用生成式人工智能进行图像生成和增强。这些生成式人工智能工具使用机器学习算法创建的作品包括抽象艺术到逼真的风景仿真。此外,它们还可以通过改善图像质量(如去除噪点或改善色彩平衡)来增强图像。

4.视频制作

使用机器学习算法,生成式人工智能工具还可以根据您的文本提示或数据输入创建视频。视频创建功能对广告、娱乐和教育业务尤其有用。营销人员还可以使用基于AI模型的工具创建从短广告到全长的故事片的所有内容。

5.代码生成

代码生成是这项技术的另一个令人兴奋的应用。像GPT-3这样的生成式人工智能模型可以通过大量来自不同编程语言的代码进行训练,从而创建新的代码。AI辅助代码生成可用于自动化创建网站模板、构建API客户端,甚至开发整个软件应用程序的过程。最终,由生成式AI模型生成的代码可以加快开发过程,减少手动编码的需求。一个简单的例子是OpenAI的Playground,它可以通过文本提示来创建可编程命令。

6.语音转换成语音

语音转换是大多数生成式人工智能模型中具有重大影响的功能。它涉及实时将一种自然语言转换为另一种语言。这对于各种应用程序,例如语言翻译和口译,都非常有用。

7.文本转语音生成

文本转语音生成是指使用自然语言处理将书面文本转化为口语音频。该功能可以自动化任务,如创建有声书、建立语音助手等。

8.音频生成

使用机器和深度学习模型,您可以使用生成式人工智能来创建新的音频内容。只需几个点击,您就可以使用人工智能模型创建音乐、音效和配音等一切。

9.合成数据生成和增强

合成数据生成是从原始数据集的输入中创建独特数据的过程。当没有足够的数据来训练机器学习模型或难以获得新数据时,这是非常有用的。合成数据可以生成不存在于现实世界中的物体的图像,例如新型汽车或虚构生物。例如,Dall-E使用多个模型,包括Transformer、潜在表示模型和CLIP,将英语短语转化为代码。进一步,此代码生成图像并根据它们与给定短语的相似度对现有图像进行排名。

生成AI所使用的基本模型和它们所创建的输出需要人类的输入,无论你是将其用于改变你的业务还是构建生成AI工具,以确保它们的结果的质量和准确性。此外,生成AI解决方案需要人类经验来创建针对特定领域的解决方案,如法律、医疗和金融行业的应用程序。

TagX可以帮助确保您的生成AI解决方案具有高质量的数据,以为客户提供最佳体验。从收集任何类型的数据,如语音、文本、图像和视频,到按比例注释数据,我们提供解决方案,帮助使用映射到您的领域的多样化贡献者来管理偏见。我们还提供100%的数据质量保证,以确保我们满足您组织的质量标准。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇