为什么人工智能的未来是混合智能
作者|T.Ferguson
译者|平川
策划|刘燕
本文最初发布于T.Ferguson的个人博客。
混合智能是一种让人工智能和人类一起工作以实现预期结果并相互学习的方法。
图片来源:https://www.piqsels.com/en/public-domain-photo-zwfob/download
人工智能(AI)正迅速成为全球数据生态系统的主导趋势。而且,在经过十年的发展后,它预计还会继续增长。
数据社区对人工智能及其所能完成的任务了解得越多,IT系统和结构就能获得越多的赋能。
这就是为什么IDC预计到2024年市场规模将达到5000亿美元,它会渗透到几乎所有行业和数量庞大的应用程序和服务中,目的是提高工作效率。事实上,根据CBInsightsResearch的数据,在2021年第三季度末,人工智能公司的融资已经超过了2020年约55%,连续四个季度创造了全球纪录。
根据人工智能在复杂认知任务(如自然语言解释)方面的进展,我们预计,2022年,它在解决妨碍非结构化语言数据驱动的操作(NLU)方面将变得更加强大。同时,对人工智能的如何和为何的审查将越来越多。例如,美国国家标准与技术研究院(NIST)将继续采取措施,使人工智能更容易理解。这需要在不降低性能或增加成本的情况下,让人工智能的计算功能更加开放。
语言理解的挑战
理解语言是人工智能必须面对的最困难的问题之一。
虽然大多数人工智能系统可以在眨眼间处理大量的原始数值或结构化数据,但语言中有大量含义和细微差别,上下文不同,描述的故事可能就不同。
对人类思维来说简单而自然的事情,对软件来说却不那么简单。这就是为什么创建能够持续正确地理解语言的软件已经成为人工智能全面发展的一个重要方面。让人工智能可以获取和吸收几乎任何类型的知识,实现这种水平的计算能力将真正打开人工智能发展的闸门。
受限于挖掘大量语言数据的能力,NLU是这个难题的一个关键部分。由于语言遍及商业活动的各个方面,如果不能从这类数据中收集尽可能多的有价值的信息,人工智能战略就不完整。
基于知识或符号的人工智能方法利用了一个开放式的知识图谱。它的结构是人类设计用来模仿现实世界的,其中定义了概念,而概念之间通过语义关系相互关联。借助于知识图谱和NLU算法,你可以阅读和学习任何现成的资料,真正理解数据分析过程以及从那个解释形成的推论。这可以与我们人类获得特定领域知识的方式相媲美,让人工智能项目将算法输出与明确的知识表示联系起来。
我们应该看到,这种结合两种方法的人工智能战略是一种明显的趋势。混合人工智能采用了各种策略来提高整体性能,更好地解决高难度的认知问题。对于NLU和自然语言处理,混合人工智能正变得越来越流行(NLP)。针对如今企业提出的准确、快速、大规模解锁非结构化语言数据价值的需求,最有效的方法是将基于人工智能的知识或符号人工智能与学习模型(机器学习,ML)相结合。
知识、符号推理和语义理解不仅会产生更准确的结果和更高效、更有效的人工智能环境,而且还会减少在昂贵的高速数据基础设施上进行耗时的资源密集型训练所产生的浪费。主题专家和/或机器学习算法可以通过分析微小的定题训练数据集来增加特定领域的知识,从而快速有效地提供准确、可行的答案。
混合人工智能的世界
为什么现在会发生这种变化?为什么人工智能以前没有能够利用基于语言的知识?学习方法让我们相信,它们可以解决我们的任何困难。但也只是在某些情况下可以,因为ML在某些情况和上下文中表现良好,并不意味着它总是最佳选择。当涉及掌握和吸收语言的能力时,我们经常看到这种情况。只是在过去几年里,我们看到了基于混合(或复合)人工智能的NLU取得了重大进展。
我们现在不是使用单一类型的人工智能和一套有限的工具来解决一个问题,而是可以使用许多方式。每一种都可以从不同的角度来处理问题,在多上下文中,采用多个模型来评估和解决一个问题。而且,由于这些策略中的每一个都可以独立于其他策略进行检查,所以很容易弄清楚哪些策略生成的结果最好。
2022年,这种混合战略有望成为一项战略性努力,企业已经尝到了人工智能所带来的好处。它节省了时间和金钱,同时加快了分析和操作程序的速度,提高了准确性和效率。举例来说,考虑到训练的复杂性和成本,现在的标注过程是由少数专业人员进行的。通过整合适当的信息库和图,训练过程可能被大大简化,使其在整个知识工作队伍中实现民主化。
未来展望
当然,各种人工智能的发展是一个持续的过程。然而,由于企业一直面临着快速、低成本地使用大量数据的压力,我们将看到人们会对构建知识图谱和自动化ML和其他技术特别关注。
随着时间的推移,我们将看到企业利用这些混合模式在一些最关键的活动方面逐渐取得进展。电子邮件管理和搜索已经成为业务自动化的案例。例如,目前基于关键词的搜索方法本质上还无法吸收和理解整个文档,这就是为什么它只能检索到基本的、本质上没有语境的数据。同样地,自动化电子邮件管理系统也很少能够解释产品名称等数据点之外的意义。最终,用户不得不对大量的结果进行筛选,才能获得最重要的信息。流程被拖慢,决策被推迟,生产力和收入因此而受到影响。
所有以知识为基础的公司都将能够通过在混合架构中结合NLU工具和符号理解,在其智能、自动化流程中模仿人类理解整个文档的能力。
查看英文原文:
https://medium.com/@fergie19702004_40140/why-is-hybrid-intelligence-the-artificial-intelligence-of-the-future-7adb73fad130?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE2NjA3MzE1MTcsImZpbGVHVUlEIjoiemRreUI1MmFlNEh5bGJBNiIsImlhdCI6MTY2MDczMTIxNywiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjoyMDQxOTA5MH0.SF3jokywvRtkKezN5-B9IcL_DI3urlPw2mOuSMasYvY
你也「在看」吗?
什么是混合智能人机混合是否最终阶段
人工智能研究的重要方向之一是借鉴认知科学、计算神经科学的研究成果,使计算机通过直觉推理、经验学习将自身引导到更高层次。目前的机器智能仍然是以计算机为中心,并没有实现人们所希望的“以人为中心”。如何把人类认知模型引入到机器智能中,让它能够在推理、决策、记忆等方面达到类人智能水平,是目前科学界讨论的焦点。
人工智能(AI)到底会不会替代人类?英国知名物理学家史蒂芬·霍金、美国首富比尔·盖茨曾不止一次对这个问题抛出肯定回答,然而人工智能领域的科学家们却不这么认为。
“作为一种可以引领多个学科领域、有望产生颠覆性变革的技术手段,人工智能技术的有效应用,意味着价值创造和竞争优势。然而,人类社会还有许许多多脆弱的、动态的、开放的问题,人工智能还都束手无策。从这个意义上讲,任何智能机器都没有办法去替代人类。”在7月31日于西安举办的一场学术沙龙中,中国工程院院士、中国自动化学会理事长郑南宁谈到,因此有必要将人类的认知能力或人类认知模型引入人工智能系统中,来开发新形式的人工智能,这就是“混合智能”。
“这种形态的AI或机器智能将是一个可行而重要的成长模式。”郑南宁指出,智能机器与各类智能终端已经成为人类的伴随者,人与智能机器的交互、混合是未来社会的发展形态。
日前,在党中央、国务院统一部署和要求下,《新一代人工智能发展规划》(下简称《规划》)对我国人工智能发展战略做了全面部署,明确了我国人工智能发展的总体要求及“三步走”的战略目标。其中,在《规划》部署的5个重要方向中,“人机协同的混合增强智能”赫然在列。
什么是混合智能?
如何定义混合智能?“由这个字面来讲的话,混合智能应该是混合不同类型的智能。什么样的智能需要混合呢?人工智能、人类智能以及自然界的智能。”澳门大学科技学院院长、讲座教授陈俊龙告诉《中国科学报》记者,虽然人工智能在搜索、计算、存储和优化领域比人类有更高效的优势,但目前它的高级认知功能,例如感知、推理等方面还远远比不上人脑。
“毕竟机器的感知和推理还是由人类去设计的。”陈俊龙说,作为自然赋予人类的智能,目前在脑神经科学领域,人们要完全弄清楚人脑的工作原理还是任重道远。
“当前的人工智能系统在不同层次都依赖大量的样本训练完成‘有监督的学习’,而真正的通用智能会在经验和知识积累的基础上灵巧地‘无监督学习’。如果仅仅是利用各种人工智能计算模型或算法的简单组合,不可能得到一个通用的人工智能。”郑南宁解释说,因此,“人机协同的混合增强智能是新一代人工智能的典型特征”。
郑南宁指出,尽管在特定领域的人工智能系统如谷歌的AlphaGo、IBM的深蓝和Watson等依赖强大的计算能力在挑战人类智力方面取得了巨大进步,但这些系统还无法通过自身思考得到更高层次的智能——它们与具有高度自主学习能力的通用人工智能依然存在着差距。
“但是,人工智能在这些特定领域应用的巨大成功为我们研究与发展新一代人工智能提供了重要的借鉴和新的方法。”郑南宁将混合智能的形态分为两种基本实现形式:“人在回路的混合增强智能”和“基于认知计算的混合增强智能”。
混合智能的两种形态
“人在回路的混合增强智能”是将人的作用引入到智能系统中,形成人在回路的混合智能范式。在这种范式中人始终是这类智能系统的一部分,当系统中计算机的输出置信度低时,人主动介入调整参数给出合理正确的问题求解,构成提升智能水平的反馈回路。
“把人的作用引入到智能系统的计算回路中,可以把人对模糊、不确定问题分析与响应的高级认知机制与机器智能系统紧密耦合,使得两者相互适应,协同工作,形成双向的信息交流与控制,使人的感知、认知能力和计算机强大的运算和存储能力相结合,构成‘1+1>2’的智能增强智能形态。”郑南宁解释说。
而“基于认知计算的混合增强智能”则是指在人工智能系统中引入受生物启发的智能计算模型,构建基于认知计算的混合增强智能。
“这类混合智能是通过模仿生物大脑功能提升计算机的感知、推理和决策能力的智能软件或硬件,以更准确地建立像人脑一样感知、推理和响应激励的智能计算模型,尤其是建立因果模型、直觉推理和联想记忆的新计算框架。”郑南宁说,对当前人工智能而言,解决某些对人类来说属于智力挑战的问题可能是相对简单的,但是解决对人类来说习以为常的问题却非常困难。
他举例说,很少有三岁的孩童能下围棋(除非受过专门的训练),但所有的三岁孩童都能认出自己的父母,且不需要经过标注的人脸数据集的训练。
“人工智能研究的重要方向之一是借鉴认知科学、计算神经科学的研究成果,使计算机通过直觉推理、经验学习将自身引导到更高层次。”西安交通大学人工智能与机器人研究所教授薛建儒告诉《中国科学报》记者,目前的机器智能仍然是以计算机为中心,并没有实现人们所希望的“以人为中心”。如何把人类认知模型引入到机器智能中,让它能够在推理、决策、记忆等方面达到类人智能水平,是目前科学界讨论的焦点。
人机混合是否最终阶段?
AI之所以未能如人所愿,薛建儒提出,最大的问题就是科学家对人脑的认知模型还没有一个统一的认识,或者得到的模型还都是对大脑非常局部的理解。但是大脑是多层次化、有整体性,并且有各种各样耦合关系的有机体,目前暂时没有办法得到一个统一、通用的架构。
基于此,微软亚洲研究院主管研究员罗翀认为,“混合智能可能不是AI发展过程中的一个过渡阶段,有可能就是AI的最终阶段——我们不可能让机器自己去学习很多东西、学到很强的状态,AI最终可能就是一个人机混合的状态。”她转而说:“这个状态也没什么不好。”
对此,国家千人计划专家、兰州大学信息科学与工程学院院长胡斌略带质疑,他认为将混合智能当做AI的最终阶段略显“极端”。
“这的确很难去界定,或者应该表达为,我们不应该去担心有一天机器会完全取代人类。”罗翀回应道。
郑南宁补充说,人工智能的发展会始终伴随人类社会的进化,人类的进化也会不断地推进人工智能技术和理论的发展,而人工智能技术与理论的发展也不断催促着人类朝着更加文明的时代去进步。“换句话说,就算人类在地球上消失了,人工智能也能随之走向宇宙中非常深邃的地方。”
西安交通大学视觉信息处理国家工程实验室副主任龚怡宏进一步提出,要实现人机协同的混合智能,需要解决的第一个难题就是人和机器之间的交互问题。“当前随着语音识别、触控屏等技术的发展,我们在人机交互方面取得了一些进步,但是这还远远不够,人机之间需要更高效的交互。”
龚怡宏表示,目前人和机器之间的信息传递效率仍然非常低,远未能实现真正意义上的人机协同、互相促进。“信息传递的通路是混合智能一个关键问题,是未来必须解决的。”
什么是混合现实
什么是混合现实?项目03/21/2023混合现实是计算领域的下一波浪潮,紧随其后的是大型机、电脑和智能手机。混合现实正在消费者和企业之间成为主流。它提供与居住空间数据和好友之间的本能交互,将我们从受屏幕束缚的体验中解放出来。世界各地数以亿计的在线探索者通过他们的手持设备体验了混合现实。移动AR提供了目前社交媒体上最主流的混合现实解决方案。人们甚至可能没有意识到,他们在Instagram上使用的AR滤镜就是混合现实体验。WindowsMixedReality借助令人惊叹的人体全息影像、高保真全息3D模型及周围的现实世界,将所有这些用户体验提升到新的水平。
混合现实是物理世界和数字世界的混合,开启了人、计算机和环境之间的自然且直观的3D交互。这种新的现实基于计算机视觉、图形处理、显示技术、输入系统和云计算的进步。PaulMilgram和FumioKishino在其1994年发表的论文“ATaxonomyofMixedRealityVisualDisplays”(混合现实视频显示的分类法)中首次引入“混合现实”一词。该论文中探讨了“虚拟连续体”的概念以及视觉显示的分类法。从那此后,混合现实的应用程序包括以下各项,已经超越了显示内容:
环境理解:空间映射和定位点。人类理解:手动跟踪、目视跟踪和语音输入。空间音效。物理和虚拟空间中的位置和定位。混合现实空间中的3D资产协作。图像:混合现实是将物理世界与数字世界相融合的结果。
环境输入和感知近几十年来,人机关系持续通过输入方式变化得到发展。进而诞生了称作“人机交互”(HCI)的新学科。人类输入现可包括键盘、鼠标、触摸、笔迹、语音和Kinect骨骼跟踪。
传感器和处理能力的进步在于基于先进的输入方法创造出了计算机对环境的新感知。这就是Windows中显示环境信息的API称作感知API的原因。环境输入可以捕获:
某个人的身体在物理世界中的位置(头部跟踪)对象、表面和边界(空间映射和场景理解)环境照明和音效对象识别物理位置插图:计算机、人类与环境之间的交互。
这三个基本元素的组合为创建真正的混合现实体验奠定了基础:
由云提供支持的计算机处理先进的输入方法环境感知我们在物理世界中移动时,我们的运动将反映在数字现实中。物理边界影响混合现实体验,如游戏或生产设施中基于任务的指导。有了环境输入和感知,体验开始在物理现实与数字现实之间进行融合。
混合现实范围混合现实融合了物理世界和数字世界。这两种现实定义了称作“虚拟连续体”的范围的两个极端。我们将这一系列的现实称作“混合现实范围”。一端是人类所在的物理现实。另一端是相对应的数字现实。
增强现实与虚拟现实目前市场上的大多数手机几乎都不具备环境感知功能。这些手机提供的体验无法混合物理现实和数字现实。
在物理世界中叠加图形、视频流或全息影像的体验称为“增强现实”。遮挡视线以呈现全沉浸式数字体验的体验是“虚拟现实”。在增强现实和虚拟现实之间转换的体验形成了混合现实,通过它可以:
在物理世界中放置一个数字对象(如全息影像),就如同它真实存在一样。在物理世界中以个人的数字形式(虚拟形象)出现,以在不同的时间点与他人异步协作。当用户处于虚拟现实中时,他们周围的物理障碍物(例如墙和家具)在体验过程中以数字方式呈现,以免用户与这些物理障碍物发生碰撞。
图像:混合现实范围
当今的大部分增强现实和虚拟现实体验仅代表了混合现实的一小部分。Windows10的开发考虑到了整个范围,可以融合现实世界中人员、地点和物品的数字表示形式。
设备和体验有两种主要类型的设备可以提供WindowsMixedReality体验:
全息设备的特征是能够显示数字对象,就像是这些对象存在于真实世界中一样。沉浸式VR设备的特征是能够隐藏物理世界并将其替换为全沉浸式数字体验,从而创建“存在感”。特征全息设备沉浸式设备示例设备MicrosoftHoloLensSamsungHMDOdyssey+显示器看透显示内容。可让用户在戴上头戴显示设备时观看物理环境。不透明显示。在戴上头戴显示设备时阻挡物理环境。移动六度自由全方位运动,支持旋转和平移。六度自由全方位运动,支持旋转和平移。注意
设备是与单独的电脑保持连接(通过USB数据线或Wi-Fi)还是断开连接状态,并不能反映设备是全息设备还是沉浸式设备。可改善运动性的功能会提供更好的体验。全息设备和沉浸式设备都可以保持连接或断开连接状态。
混合现实体验是技术进步的结果。Windows10为设备制造商和开发人员提供了一个通用的混合现实平台。当今提供的任何设备都可以支持混合现实范围内的某个特定范围。未来有望出现支持范围更广的新设备:全息设备将变得更有沉浸感,而沉浸式设备也将变得更具全息感。
图像:设备在混合现实范围内所处的位置
作为应用程序或游戏开发人员,你要创建什么类型的体验?体验往往面向混合现实范围内的特定点或部分。你需要考虑希望面向的设备的功能。依赖于物理世界的体验最好是在HoloLens上运行。
向左(接近物理现实)。用户保留在其物理现实中,并且不相信他们已离开该现实。中间(完全混合现实)。这些体验融合了真实世界和数字世界。例如,在电影勇敢者的游戏中,故事发生地的房子与丛林环境融合后的物理结构。向右(接近数字现实)。用户将体验数字现实,但不会意识到其周围的物理现实。下一个发现检查点你正处于我们为你安排的探索之旅的起点,正在探索混合现实的基础知识。从这里,你可以进入下一基本主题:
什么是全息图?
什么是混合人工智能及其如何改变我们的生活
第三代AI-3-机器具有学习能力,或者说逐步提高学习成果的能力在21世纪初期,随着计算能力的增长,出现了所谓的机器学习的新概念。新的人工智能模型的实质称为AI-3,其归结为对与现象和过程相关的数据进行分析,并确定过去做出成功决策的主要趋势,从而创建当前用于控制和决策的主动算法。另外,基于该方法,假设可以预测反馈的动态和参数,或来自控制中心的命令响应。简单来说,该算法不仅保留了其灵活性,而且还能够移动约束条件,从而改变了可能的响应范围。
2000年代后期的突破性思想,AI-3+或深度学习以及新的-AI-3++增强了深度学习应该注意的是,AI-3和AI-3+的雏形存在于AI-1的阶段,但是计算系统的低功耗无法实现真正的结果。在过去的十年中,由于高性能计算系统的广泛使用,使用巨大的数据库和多层技术神经网络迫使机器学习并获得经验成为可能。此资源密集型过程称为深度学习或AI-3+。实际上,它是AI-3的一种高级版本。
要了解AI-3和AI-3+之间的区别,您需要查看几年前由Google创建的即时翻译系统的工作方式。创建新系统时,Google开发人员完全放弃了自然语言分析算法,而将其替换为一个更简单的模型,该模型仅使用对原始语言的现成版本的比较分析。这种新的简单方法的准确性和效率给人留下了深刻的印象。Google并未揭露和阐明自然语言结构中的逻辑联系,而是提出了一种新模型,该模型中的所有过程都遵循黑匣子原理。
DeepMind在创建能够与任何有经验的Go玩家平等竞争的AI“AlphaGo”时使用了类似的技术。AI“AlfaGo”的创造者走得更远,建立了一个同时使用两个神经网络的系统,该系统致力于AI-3+(深度学习)的原理,其中一个分析了位置,第二个分析了先前游戏协议中使用的策略。我们将这种方法称为AI-3++或增强型深度学习,它是当今时代最先进的概念。DeepMind公司将继续基于此原则创建新系统。
接下来会发生什么?新的混合动力AI-4将是一个根本不同的系统。在其中,活泼的大脑和计算机将成为单一的互补共生。从II-1到II-3++列出的所有系统都有其全部功能,它们有一个共同点-它们都是作为单一的电子复合体构建的,这些电子复合体使用复杂性不同的算法,试图对收到的请求形成最成功的响应。他们的弱点是它们只能作为一个垂直的系统来工作。
统一性或集中化是人为创造的任何电子计算系统不可抗拒的设计特征的结果。我们不知道该如何建造。
但是谁说下一个AI-4系统将完全是电子的呢?事实是,我们所知道的唯一真正的智能是人的大脑,它的工作方式似乎与计算机完全不同。
又为什么呢因为有大量证据表明,真正的人类智能不是单一系统,而是双重复合体,具有经典的共生功能。将神经系统清楚地分为意识活动和反射活动是支持该概念的最重要证据。
下一代人工智能或AI-4将是生物电子混合动力,其中人的大脑和机器将在单个系统中协同工作。新基础科学领域这是一个未知的技术和科学领域,在这里我们将讨论围绕一种新型神经计算机接口构建的与大脑互补的AI系统。
如今,为实现这一想法进行了数种尝试,其中一个生动的例子就是NeuralinkElonMusk。这些项目的弱点在于它们忽略了人脑的双重组织系统,因此不了解新皮层神经元中神经冲动启动的反射机制和智力机制之间的差异。
他们认为的单个系统实际上是一个复杂的有组织的共生关系,如果不了解其单独的(组成)组件如何相互作用,就不可能与之建立联系。
第二个主要问题是信号交叉点。基本上,这是正常的电子信号成为神经冲动的地方,反之亦然。
今天正在创造的美好新世界AI-4是一种混合系统,结合了增强的深度学习和新型的神经计算机接口。
AI-4在单词的字面意义上不会有信号转换点,但是机器和神经组织之间将有如此清晰,快速的通信,以至于左半球的神经元使用新的接口比通常通过体的方式更容易和更快地将信号传输到右半球。身体。
结果,由于突触可塑性,人脑的神经元将自己参与与电子计算机组件的界面进行动态交互的结构的形成。而不是单词和字母-只有紧张的冲动大脑和计算机将能够直接交换数据,而无需使用诸如语音或字母字符之类的复杂通信协议。与机器进行交互将比与电子设备进行交互更加直观。大脑和计算机将使用一组立即意义的冲动来交换信息,而无需进行符号解释。
视觉,听觉,嗅觉和触觉将成为感官信息的次要和延迟流。而且用手的动作通常会变成残酷的状态。一段时间后,大脑将能够无须手或声音就能执行所有命令功能。计算机系统将失去键盘,麦克风和扬声器。
您的大脑将进行自我搜索,进行调整,从而找到传播所需命令冲动的机会,但最矛盾的是,随着时间的流逝,即使如此也将变得多余。您的个人人工智能系统将比您更准确,更清楚地了解您,您的个性,您的要求和偏好。因此,控制命令将成为例外而不是规则,并且您自己的AI将通过理解您的思想来学习满足您的所有需求,而不是依靠口头或手动输入的单词和符号。互补性将达到这样的程度,即使在通过电话交流或与某人虚拟地发短信时,您也将永远无法确定正在讨论的人是该人本人还是他的个人人工智能。
在完全沉默的情况下,闭上眼睛,并且不移动身体的单个肌肉,您将能够工作,交流,学习新闻甚至获得性快感。
如果您认为这太棒了,那就不要急着批评。我所写的一切都将在未来3-4年内发生,因此,如果您现在40岁或更年轻,您将有机会亲自了解这个惊人的新世界。返回搜狐,查看更多