博舍

人工智能基础部分1 人工智能的应用基础的理解与认识

人工智能基础部分1

1.1人工智能     人工智能(ArtificialIntelligence)就是让机器具有人类的一样的智慧,有人类的视觉、听觉、阅读、写作等能力。人类大脑是经过了上亿年的进化才形成的复杂结构,但我们至今仍然没有完全了解其工作机理。虽然随着神经科学、认知心理学等学科的发展,人们对大脑的结构有了初步的了解,但对大脑的智能究竟是怎么产生的还是未知。我们并不理解大脑的运作原理,以及如何产生意识、情感、记忆等功能.因此,通过“复制”人脑来实现人工智能在目前阶段还不切实际。    阿兰·图灵(AlanTuring) 在1950年发表了一篇有着重要影响力的论文《ComputingMachineryandIntelligence》,阐述一种“智能机器”的可能性.由于“智能”一词比较难以定义,他提出一个著名测试,后人称之为图灵测试。

图灵测试:“一个人在不接触对方的情况下,通过一种特殊的方式和对方进行一系列的问答.如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的”.图灵测试是促使人工智能从哲学探讨到科学研究的一个重要因素,引导了人工智能的很多研究方向.

   我们要使得计算机能通过图灵测试,计算机就必须具备理解语言、学习、记忆、推理、决策等能力.这样,人工智能就延伸出了很多不同的子学科,例如机器感知(计算机视觉、语音信息处理)、学习(模式识别、机器学习、强化学习)、语言(自然语言处理)、记忆(知识表示)、决策(规划、数据挖掘)等.所有这些研究领域都可以看成是人工智能的研究范畴。

   目前,人工智能的主要领域大体上可以分为以下几个方面:1.感知:模拟人的感知能力,对外部刺激信息(视觉和语音等)进行感知和加工.主要研究领域包括语音信息处理和计算机视觉等.2.学习:模拟人的学习能力,主要研究如何从样例或从与环境的交互中进行学习.主要研究领域包括监督学习、无监督学习和强化学习等.3.认知:模拟人的认知能力,主要研究领域包括知识表示、自然语言理解、推理、规划、决策等.1.2机器学习机器学习是指从有限的观测数据中学习(或“猜测”)出具有一般性的规律,并利用这些规律对未知数据进行预测的方法.机器学习是人工智能的一个重要分支,并逐渐成为推动人工智能发展的关键因素.传统的机器学习主要关注如何学习一个预测模型.一般需要首先将数据表示为一组特征,特征的表示形式可以是连续的数值、离散的符号或其他形式.然后将这些特征输入到预测模型,并输出预测结果.这类机器学习可以看作浅层学习.浅层学习的一个重要特点是不涉及特征学习,其特征主要靠人工经验或特征转换方法来抽取.  在实际任务中使用机器学习模型一般会包含以下几个  1.数据预处理:对原始形式的数据进行初步的数据清理(例如去掉一些冗余的数据特征等)和加工(对相关数值进行缩放和归一化等),并构建成可用于训练机器学习模型的数据集.  2.特征提取:从数据的原始特征中提取一些对特定机器学习任务有用的价值高的特征.比如在图像分类中提取边缘特征、尺度不变特征、变换特征,在文本分类任务中去除停用词等.  3.特征转换:对特征进行进一步的加工,比如降维和升维.降维包括特征抽取和特征选择两种途径.常用的特征转换方法有主成分分析、线性判别分析等.1.3深度学习   为了让机器学到更好的特性,需要构建具有一定“深度”的模型,并通过学习算法来让模型自动学习出好的特征表示(从底层特征,到中层特征,再到高层特征),从而最终提升预测模型的准确率.所谓“深度”是指原始数据进行非线性特征转换的次数.如果把一个表示学习系统看作一个有向图结构,深度也可以看作从输入节点到输出节点所经过的最长路径的长度.这样我们就需要一种学习方法可以从数据中学习一个“深度模型”,这就是深度学习.深度学习是机器学习的一个子问题,其主要目的是从数据中自动学习到有效的特征表示.

学习深度学习需要掌握以下内容:

1、学习深度学习,首先要掌握线性代数、概率论和数理统计等基础知识,这样才能理解深度学习算法的原理;

2、学习深度学习,要掌握神经网络、卷积神经网络(CNN)、循环神经网络(RNN)、深度强化学习等深度学习模型;

3、学习深度学习,要掌握深度学习框架,如TensorFlow、Pytorch等;

4、学习深度学习,要掌握数据预处理、模型训练和评估等技术。

全部作品:

 一、人工智能基础部分

1.人工智能基础部分1-人工智能的初步认识

2.人工智能基础部分2-一元一次函数感知器

3.人工智能基础部分3-方差损失函数的概念

4.人工智能基础部分4-梯度下降和反向传播

5.人工智能基础部分5-激活函数的概念

6.人工智能基础部分6-神经网络初步认识

7.人工智能基础部分7-高维空间的神经网络认识

8.人工智能基础部分8-深度学习框架keras入门案例

9.人工智能基础部分9-深度学习深入了解

10.人工智能基础部分10-卷积神经网络初步认识

11.人工智能基础部分11-图像识别实战

12.人工智能基础部分12-循环神经网络初步认识

13.人工智能基础部分13-LSTM网络:自然语言处理实践

十分钟了解人工智能AI的基础运作原理

人工智能是如何运作的

收听音频课程

        人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以预见未来几年将会进入“人工智能时代”。

        目前AI已经遍布我们的世界并且在日常生活中产生了巨大的变化。这些AI并不是科幻电影中的那些有自我意识,计划毁灭世界邪恶的机器人。而是像我们的智能手机、智能家居、银行信用卡管家和智能汽车这些围绕我们每天生活的产品和服务都在使用AI。

        AI将通过推动自动驾驶汽车的发展、改善医学图像分析、促进更好的医疗诊断和个性化医疗,从而带来社会的重大转变。AI 也将是支撑未来技术发展的基础资源,就像电力和网络一样。但对大部分人来说,AI 还是很诡异而且充满神秘感。

    那么我们今天就来聊一聊AI最重要的功能——模式识别的工作原理。希望通过简明扼要的介绍帮助大家了解这个领域。

    AI是一门严谨科学而不是无所不能神话故事,媒体过分夸大报道AI的功能,鼓吹威胁论都是不负责任的。AI目标是设计具有智能的机器,其中的算法和技术部分借鉴了当下对人脑的研究成果。今天许多流行的AI系统使用人工神经网络来模拟由非常简单的互相连接单元组成的网络,有点像大脑中的神经元。这些网络可以通过调整单元之间的连接来学习经验,这个过程类似人类和动物的大脑通过修改神经元之间的连接来进行学习。神经网络可以学习模式识别、翻译语言、学习简单的逻辑推理,甚至创建图像或者形成新设计。其中,模式识别是一项特别重要的功能,因为AI十分擅于识别海量数据中的隐藏的模式,而这对于依赖经验和知识的人类来说就没有那么容易。这些程序运行的神经网络具有数百万单位和数十亿的连接。我们现在所能创造出来的“智能”就是由这些电子神经元网络组成的。

    机器不像人类具有感知器官和大脑,并且能够很好地协调工作,比如当我们看到一只狗的时候,就会很快的判断出来这是什么动物,并且具体什么种类。这个看似简单的过程对于机器来说都是十分困难的。而人类获得这样的能力,也是源自于生物上亿年的进化过程。而机器认识世界的方式是通过模型,需要通过复杂的算法和数据来构建模型,从而使机器获得很简单的感知和判断的能力。

    下面介绍一下深度学习系统中一个最重要算法——卷积神经网络。如果你之前对AI相关知识有所了解的话,那你一定听说这个概念。这种算法参考了生物学研究人类和其他动物大脑视觉皮层的结构。简单介绍一下这种特定类型的人工神经网络,它使用感知器、机器学习单元算法,用于监督学习分析数据。适用于图像处理、自然语言处理和其他类型的认知任务。与其他类型的人工神经网络一样,卷积神经网络具有输入层、输出层和各种隐藏层。其中一些层是卷积的,使用数学模型将结果传递给连续的层。这过程模拟了人类视觉皮层中的一些动作,所以称为卷积神经网路,也就是CNN。

举例子来看,当我们人类看到一只猫和一只狗时,尽管它们的体型很类似,但我们还是马上能够区分它们分别是猫和狗。对计算机而言,图像仅   仅只是一串数据。在神经网络的第一层会通过特征检测物体的轮廓。神经网络的下一层将检测这些简单图案的组合所形成的简单形状,比如动物眼睛和耳朵。再下一层将检测这些形状组合所构成的物体的某些部分,例如猫和狗的头或者腿。神经网络的最后一层将检测刚才那些部分的组合:一只完整的猫、一只完整的狗等等。每一层的神经网络都会目标进行图像组合分析和特征检测,从而进行判断和组合,并将结果传递给下一层神经网络。实际使用的神经网络的层次深度会比这个例子多很多,所以神经网络能够以这种分层的方式进行复杂的模式识别。

   只要有大量被标记的样本数据库,就可以对神经网络进行特征训练。它对于识别图像、视频、语音、音乐甚至文本等信息特别有用。为了很好地训练AI的机器视觉,我们需要提供给这些神经网络被人标记的大量图像数据。神经网络会学习将每个图像与其相应的标签并相互关联起来。还能将以前从未见过的图像及其相应的标签配对。这样的系统可以梳理各种各样的图像,并且识别照片中的元素。同时神经网络在语音识别和文本识别中也非常有用,自动驾驶汽车和最新医学图像分析系统中也是关键组成部分,所以你可以看到神经网络的运用是非常广泛而且有效的。原来需要依赖人工标记大量有效数据来完成知识的输入,现在通过运行海量数据,让神经网络进行自我学习。大大提升的人工智能的应用范围,降低了使用的门槛。

   人类大脑与动物远远不同,在进化过程中高度特化并且具有明显的适应性。而当前的AI系统远远不具有人类拥有的看似一般的智能。人工智能更高级的发展将会在后面进行讨论,我们这里还是关注现在实现的AI的基本原理。

AI最常见的三种学习方式

强化学习 这是关于机器应该如何行动以获得最大化奖励的问题,它受行为心理学理论的启发。在特定场景下,机器挑选一个动作或一系列动作并获得奖励。机器行为每一步骤都会被标记,并且记录结果和赋予权重。强化学习通常用于教机器玩游戏和赢得比赛,比如国际象棋、围棋或简单的视频游戏。强化学习的问题是,单纯地强化学习需要海量的试错,才能学会简单的任务。好处是只要你提出一个有价值的问题,提供足够的数据输入,理论上来说强化学习最终会找到那个最优解。

监督学习就是需要我们告诉机器特定输入的正确答案:这是一幅汽车的图像,正确答案是“汽车”。它之所以被称为监督学习,是因为算法是从带标签数据学习的。这个过程类似于向年幼的孩子展示图画书。成年人预先知道正确的答案,孩子根据前面的例子做出推测。这也是训练神经网络和其他机器学习体系结构最常用的技术。

   无监督学习 人类和大多数其他动物的学习过程,特别是刚生下来的时候,是以没有人监督的方式来进行学习的:我们通过观察和认知我们行动的结果来了解世界如何运作。没有人告诉我们刚开始所看到的每一个物体的名称和功能。但我们仍然学会非常基本的概念,当前我们还不知道如何在机器身上实现这一点,至少无法达到人类和其他动物的水平。缺乏用于无监督学习的AI技术,也是当前AI发展问题之一。

    概括来说当前AI技术原理是:将大量数据与超强的运算处理能力和智能算法三者相结合起来,建立一个解决特定问题的模型,使程序能够自动地从数据中学习潜在的模式或特征,从而实现接近人类的思考方式。下面补充介绍三个AI研究领域重要的理论方法和技术以便理解:

 一、机器学习自动化分析建模。

    它使用来自神经网络、统计、数学和物理学的方法来发现数据中的隐藏模型,并且无需明确编程查找具体目标和范围。理论基础是这样的:假如我们为了研究某个复杂的科学问题,需要创建海量的机器学习模型、使用大量的算法、使用不同的参数配置,在这种情况下,我们就可以使用自动化的方式进行建模。发展自动化机器学习是为了向科学家提供帮助,而不是代替他们。这些方法使数据科学家摆脱了令人厌烦和复杂耗时的任务(比如详细的参数优化和调试),机器可以更好地解决这些任务。而后面的数据分析与结论的工作仍然需要人类专家来完成。在未来,理解行业应用领域的数据科学家,也就是数据业务架构师,仍然极其的重要。而这一项人工智能技术,将会辅助数据科学家建立模型并且加速验证的速度,从而减轻科学家的压力,让他们将精力放在那些机器无法完成的任务上面,通过更加合理的分工协作,大大加快科学技术研发速度。

二、深度学习领域

    这是应用非常广的技术,它使用具有多层处理单元的巨大神经网络,利用强大计算能力和改进的训练技术来学习大量数据中的复杂模式。原理是计算机在学习特定问题时,需要大量输入这个问题相关的学习材料也就是数据,然后在计算机通过算法和模型来构建对这个具体问题的认知,也就是总结出一个规律,那么在以后遇到相似问题时,计算机会把收集的数据转成特征值,如果这个特征值符合这前面规律里面的特征值,那么这个事物、行为或者模式,就可以被识别出来。常见的应用太多了,这里大概举一些例子:

   计算机视觉,这就像是机器的“眼睛”。依赖于模式识别和深度学习来识别图片或视频中的内容。当机器可以分析和理解图像时,他们可以实时捕捉图像或视频并解读周围环境。感知周围环境、识别可行驶区域以及识别行驶路径,这也是无人驾驶的基础技术。其中图像识别原理是通过识别图片中的对象,然后建立标签,实现对海量图片进行分类,也可以对图像中的人脸或者其他目标进行识别,运用在安防监控等领域;

   自然语言处理中语音识别技术就像是机器的“耳朵”:这是计算机分析、理解和生成人类语言和语音的能力。运用语音采集的技术和方法,对音频中的语言内容进行提取和识别,实现语音实时转文字的功能;下一阶段将会是自然语言交互,人们将可以使用普通的日常语言与计算机进行交流和执行任务。这也是AI语音助手和语音控制交互技术的基础。

    机器翻译:模仿人脑理解语言的过程,形成更加符合语法规则同时更加容易被人理解的翻译,谷歌在线翻译功能就是运用了深度学习技术,让机器的翻译水平大大提升;

    情感识别:通过识别新闻、社交媒体、论坛等文本内容中所包含的情感因素,及时了解网络舆论对新闻事件的反应情况;

    医疗诊断:比如通过对各个阶段的肿瘤诊断这类医疗图像数据进行学习,总结出恶性肿瘤形状、纹理、结构等“特征”模型,从而使机器可以进行判断。

    可以看到深度学习在神经元网络的基础上,发展出了非常多的应用案例,并且当下各个行业的人工智能辅助工具和软件都在大力开发中,各种数据都在被大量采集、清洗、输入模型训练,一旦训练成功就可以大规模部署,带来巨大的商业价值。具体有多大呢?参考一下人脸识别领域的独角企业估值和号称千亿的市场规模就知道了。如果这样的市场再乘以百倍、千倍呢,这里面的蕴含商业机会有多少呢?

 三、认知计算

这也是人工智能的子领域,目标是与机器进行自然的、类似人类的交互。使用人工智能和认知计算,最终目标是让机器获得理解图像和语音的能力,模拟人类交流过程,从而实现与人类的自然对话。也是根据神经网络和深度学习来构建的,应用来自认知科学的知识来构建模拟人类思维过程的系统。它涵盖多个学科,包括机器学习、自然语言处理、视觉和人机交互。IBMWatson 就是认知计算的一个例子,在美国答题竞赛节目上Watson 展现了它先进的问答交互能力,并且打败了人类。与此,同时Watson这些服务应用接口也进行了开放,可提供其他组织用于视觉识别、语音识别、语言翻译以及对话引擎等等。

就像AI的产生是多学科发展的综合成果一样,当下AI的快速发展也是多方面技术进步综合起来取得的成果,总结里面重要的三个方面:

1.硬件方面:

     直到本世纪初研究人员才意识到,为视频游戏设计的GPU(图形处理单元)可以被用作硬件加速器,以运行比以前更大的神经网络。这要归功于这些芯片能够进行大量并行计算,而不是像传统CPU那样按顺序处理它们。这对于同时计算构成深度学习神经网络的数百个神经元的权重特别有用。

2.通用算法:

    AI这么快就流行起来,在很大程度上是因为开放的软件工具(也称为框架),使得构建和训练一个神经网络实现目标应用程序变得容易起来,即使是使用各种不同的编程语言。对于已知的识别目标,可以离线定义和训练一个神经网络。一旦训练完成,神经网络可以很容易地部署到嵌入式平台上,也可以迁移到各种软件程序和硬件平台中。这是一个聪明的架构,允许借助PC或云的能力训练神经网络,而低功耗的嵌入式处理器只需使用训练好的数据来进行识别。人体和物体的能力与流行的应用密切相关,比如工业机器人和自动驾驶汽车。

3.其他技术支持:

    ​ 图形处理单元是AI的关键,因为它们提供了迭代处理所需的大量计算能力。训练神经网络需要大数据和计算能力。而物联网从连接的设备生成大量数据,其中大部分未经分析。 使用AI自动化模型将允许我们使用更多的物联网数据进行分析,将物流和信息流更好的结合起来。还有就是AI应用程序接口,可以将AI功能添加到现有产品和软件中。比如它们可以为安防视频系统中添加图像识别功能;也可以在我们观看网络视频时,自动创建翻译和字幕;或者是在拍照程序中自动识别人物性别和年龄甚至是表情和情绪等等,应用将会非常广泛。

    总之,这都是 AI 经常使用的方法,即使我们创造了单个项目拥有超越人类智慧的机器,这些机器仍然能力有限。短期来看,人工智能将提供接近人类交互体验,并为特定任务提供辅助支持,但它还不能成为人类的替代品,有自我意识的AI还不会很快出现。

  本篇是老张创作的课程《人工智能进化论课程》基础篇内容,转载需授权。

    读完了觉得有帮助请转发和评论~   

      想要了解全部课程内容,加入圈子和老张讨论的请点击下面“加入圈子”,订阅“人工智能进化论”课程。或者加wx:AI61825

加入圈子​​​

人工智能导论——人工智能学科研究的基本内容及主要研究领域

一、人工智能研究的基本内容

(1)知识表示

人工智能研究的目的是要建立一个能模拟人类智能行为的系统,但知识是一切智能行为的基础,因此首先要研究知识表示方法。只有这样才能把只是存储到计算机中去,供求解现实问题使用。知识表示方法可分为两类:符号表示法(用各种包含具体含义的符号以各种不同的方式和顺序组合起来表示知识的方法)和连接机制表示法(用神经网络表示知识)。

(2)机器感知

所谓机器感知就是使机器(计算机)具有类似于人的感知能力,其中以机器视觉和机器听觉为主。机器感知是机器获取外部信息的基本途径。

(3)机器思维

所谓机器思维是指通过感知得来的外部信息及机器内部的各种工作信息进行有目的的处理。

(4)机器学习

机器学习就是研究如何使计算机具有类似于人的学习能力,使它能通过学习自动的获取知识。

(5)机器行为

机器行为主要是指计算机的表达能力,即“说”、“写”、“画”等能力。对于智能机器人,它还应具有人的四肢功能,即能走路、能取物、能操作等。

二、人工智能的主要研究领域

目前,随着智能科学和技术的发展和计算机网络技术的广泛应用,人工智能技术应用到越来越多的领域。下面简要介绍几个主要领域:

(1)自动定理证明

自动定理证明是人工智能中最先进行研究并得到成功应用的一个研究领域,同时它也为人工智能的发展起到了重要的推动作用。实际上,除了数学定理证明以外,医疗诊断、信息检索、问题求解等许多非数学领域问题,都可以转化为定理证明问题。

(2)博弈

诸如下棋、打牌、战争等一类竞争性的智能活动称为博弈(gameplaying)。人工智能研究博弈的目的并不是为了让计算机与人进行下棋、打牌之类的游戏,而是通过对博弈的研究来检验某些人工智能技术是否能实现对人类智慧的模拟,促进人工智能技术的深入研究。

(3)模式识别

模式识别(patternrecognition)是一门研究对象描述和分类方法的学科。分析和识别的模式可以是信号、图象或者普通数据。模式是对一个物体或者某些其他感兴趣实体定量的或者结构的描述,而模式类是指具有某些共同属性的模式集合。

模式识别方法有统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别等。

(4)机器视觉

机器视觉(machinevision)或者计算机视觉(computervision)是用机器代替人眼进行测量和判断,是模式识别研究的一个重要方面。计算机视觉通常分为低层视觉和高层视觉两类。

(5)自然语言理解

自然语言理解(naturallanguageunderstanding)就是研究如何让计算机理解人类自然语言,是人工智能中十分重要的一个研究领域。它是研究能够实现人与计算机之间用自然语言进行通讯的理论与方法。

(6)智能信息检索

数据库系统是存储大量信息的计算机系统。随着计算机应用的发展,存储的信息量越来越大,研究智能信息检索系统具有重要的理论意义和实际应用价值。智能信息检索系统应具有下述功能:能理解自然语言、具有推理能力、系统拥有一定的常识性知识。

(7)数据挖掘与知识发现

知识发现系统通过各种学习方法,自动处理数据库中大量的原始数据,提炼出具有必然性的、有有意义的知识,从而揭示出蕴涵在这些数据背后的内在联系和本质规律,实现知识的自动获取。知识发现是从数据库中发现知识的全过程,而数据挖掘则是这个全过程的一个特定的、关键的步骤,数据挖掘的目的是从数据库中找出有意义的模式。

(8)专家系统

专家系统是一个智能的计算机程序,运用知识和推理步骤来解决只有专家才能解决的疑难问题,是目前人工智能最活跃、最有成效的一个研究领域。可以这样定义,专家系统是一种具有特定领域内大量知识和经验的程序系统,它应用人工智能技术模拟人类专家求解问题的思维过程求解领域内的各种问题,其水平可以达到甚至超过人类专家的水平。

(9)自动程序设计

自动程序设计是将自然语言描述的程序自动转换可执行程序的技术,包括程序综合和程序正确性验证两个方面的内容。

(10)机器人

机器人是指可模拟人类行为的机器。它可分为三代:程序控制机器人(第一代)、自适应机器人(第二代)、智能机器人(第三代)。

(11)组合优化问题

组合优化问题一般是NP完全问题。NP完全问题是指:用目前知道的最好的方法求解,问题求解需要花费的时间(称为问题求解的复杂性)是随问题规模增大以指数关系增长。组合优化问题的求解方法已经应用于生产计划与调度、通信路由调度、交通运输调度等。

(12)人工神经网络

人工神经网络是一个用大量简单处理但愿经广泛连接而组成的人工网络,用来模拟大脑神经系统的结构与功能。

(13)分布式人工智能与多智能体

分布式人工智能(DAI)是分布式计算与人工智能结合的结果。分布式人工智能的研究目标是要建立一种描述自然系统和社会系统的模型。

(14)智能控制

智能控制就是把人工智能技术引入控制领域,建立智能控制系统。

(15)智能仿真

智能仿真就是将人工智能技术引入仿真领域,建立智能仿真系统。

(16)智能CAD

智能CAD就是将人工智能技术引入计算机辅助设计领域,建立智能CAD系统。

(17)智能CAI

智能CAI就是将人工智能技术引入计算机辅助教学领域,简历智能CAI系统即ICAI。

(18)智能管理与智能决策

智能管理就是将人工智能技术引入管理领域,建立智能管理系统,研究如何提高计算机管理系统的智能水平,以及智能管理系统的设计理论、方法和实现方法。智能决策就是将人工智能技术引入决策过程,建立智能决策支持系统。

(19)智能多媒体系统

智能多媒体实际上是人工智能与多媒体技术的有机结合。

(20)智能操作系统

智能操作系统就是将人工智能技术引入计算机的操作系统之中,从质上提高操作系统的性能和效率。

(21)智能计算机系统

智能计算机系统就是人们正在研制的新一代计算机系统,它将全面支持智能应用开发,且自身就具有智能。

(22)智能通信

智能通信就是将人工智能技术引入通信领域,建立智能通信系统,在通信系统的各个层次和环节上实现智能化。

(23)智能网络系统

智能网络系统就是将人工智能技术引入计算机网络系统。

(24)人工生命

人工生命是以计算机为研究工具,模拟自然界的生命现象,生成表现自然生命系统行为特点的仿真系统。

 

 

----内容来自于《人工智能导论(第四版)》

人工智能与自然语言处理技术

随着人工智能技术的发展,我们生活中的许多应用都带上了“AI”的色彩,比如可以用计算机帮翻译外文文档。但有时候人工智也能会出一些小故障,变得不那么智能,尤其在语言处理方面。那么我们怎样才能让人工智能变成真正的“智能”呢?自然语言处理技术就是一个重要的方式。

自然语言处理技术(即natural language processing,简称NPL)是人工智能的一个重要分支,其目的是利用计算机对自然语言进行智能化处理。基础的自然语言处理技术主要围绕语言的不同层级展开,包括音位(语言的发音模式)、形态(字、字母如何构成单词、单词的形态变化)、词汇(单词之间的关系)、句法(单词如何形成句子)、语义(语言表述对应的意思)、语用(不同语境中的语义解释)、篇章(句子如何组合成段落)7个层级。这些基本的自然语言处理技术经常被运用到下游的多种自然语言处理任务中,如机器翻译、对话、问答、文档摘要等。

科学家研究自然语言处理技术(NLP)的目的是让机器能够理解人类语言,用自然语言的方式与人类交流,最终拥有“智能”。AI时代,我们希望计算机拥有视觉、听觉、语言和行动的能力,其中语言是人类区别于动物的最重要特征之一,语言是人类思维的载体,也是知识凝练和传承的载体。在人工智能领域,研究自然语言处理技术的目的就是让机器理解并生成人类的语言,从而和人类平等流畅地沟通交流。

但现在的人工智能常常和我们的人工评价有很大的出入,这也是基于AI算法的自动评测面临的最大挑战:如何与人工评价保持一致?应对这个挑战需要解决很多问题。以智能阅卷为例:如何制定电脑适用的评测标准?人工智能如何应对语言的千变万化?如何设计阅卷综合性的评测指标?有科学家认为,大数据与富知识双轮驱动或许能成为解决问题的关键,即在大数据驱动的基础上加入富知识驱动,可以突破现在智能语言处理技术上的瓶颈。

总而言之,自然语言技术的发展说明人工智能技术的核心还是在“人”。“人工智能和机器学习带给决策过程的支撑和信心将使创新加速,但这并不意味着人类的缺席。人们仍然需要定义分析的起点、标注主题并从收集的信息中提取所需数据。”

本文由北京市第六十五中学一级教师李岩进行科学性把关。

科普中国中央厨房

新华网科普事业部

科普中国-科学原理一点通

联合出品

更多精彩内容,请下载科普中国客户端。

作者:和卓琳 [责任编辑:魏承瑶]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇