人工智能基础人工智能的应用基础包括哪些内容呢

发表时间：2023-07-04 04:36:39

人工智能基础

本课程推荐教材及与课程学习目标对应关系如下：

1. 授课教材：《人工智能》丁世飞编著电子工业出版社 2020年第三版ISBN：9787121363955。

（1）教材特点：《人工智能导论（第3版）》主要阐述人工智能的基本原理、方法和应用技术。全书共13章，除第1章讨论人工智能基本概念、第13章讨论人工智能的争论与展望外，其余11章按照“基本智能+典型应用+计算智能”三个模块编排内容。一个模块为人工智能经典的三大技术，分别为知识表示技术、搜索技术和推理技术，主要包括知识表示、确定性推理、搜索策略、不确定性推理；第二个模块为人工智能的典型应用领域，包括机器学习、支持向量机和专家系统；第三个模块为计算智能与群智能，包括神经计算、进化计算、模糊计算和群智能。

本课程主要选用了本教材的第一稿模块，即知识表示技术、搜索技术和推理技术中相关的内容。

（2）使用方法：本教材对应课程学习目标1-5，可以做到对课程内容前半部分的全覆盖，请同学们学习完视频之后，一定要详细阅读教材中的对应部分，并针对课后习题进行联系，能够有效提高学习质量；

2、本课程参考了大量网络上的课程。对应课程学习目标6-8，包括：

https://stanford-cs221.github.io/spring2021/

https://cse.iitkgp.ac.in/~dsamanta/courses/da/

百度飞桨师资培训的机器学习和深度学习的内容。

https://easyai.tech

此外还有参考百度百科、B站、以及知乎和CSDN等各类科技网站。

在此表示感谢！

6大人工智能应用关键技术，终于有人讲明白了

导读：我国《人工智能标准化白皮书（2018年）》中也给出了人工智能的定义：“人工智能是利用数字计算机或者由数字计算机控制的机器，模拟、延伸和扩展人类的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。”

人工智能的核心思想在于构造智能的人工系统。人工智能是一项知识工程，利用机器模仿人类完成一系列的动作。根据是否能够实现理解、思考、推理、解决问题等高级行为。

在未来，人工智能应用主要会体现如下几大核心技术特点。

作者：达观数据

来源：大数据DT（ID：hzdashuju）

01机器人流程自动化（RoboticProcessAutomation，RPA）

RPA（RoboticProcessAutomation，机器人流程自动化）的定义：通过特定的、可模拟人类在计算机界面上进行操作的技术，按规则自动执行相应的流程任务，代替或辅助人类完成相关的计算机操作。

与大家通常所认为的具备机械实体的“机器人”不同，RPA本质上是一种能按特定指令完成工作的软件，这种软件安装在个人计算机或大型服务器上，通过模拟键盘、鼠标等人工操作来实现办公操作的自动化。

▲图1-1RPA是未来办公创新和发展的趋势

RPA也被形象地称为数字化劳动力（DigitalLabor），是因为其综合运用了大数据、人工智能、云计算等技术，通过操纵用户图形界面（GUI）中的元素，模拟并增强人与计算机的交互过程，从而能够辅助执行以往只有人类才能完成的工作，或者作为人类高强度工作的劳动力补充。

自2015年以来，人工智能技术和RPA在同一时间大幅度发展和进步，恰好相辅相成，汇合在了一起。自然而然地，RPA和AI两者的结合运用，带来了一股非常独特的智能化应用的发展潮流，我们称之为智能RPA技术，或者IPA技术（IntelligentProcessingAutomation），即智能流程自动化技术（如图1-2所示）。

▲图1-2智能RPA的构成：RPA+AI=IPA

换句话说就是，RPA是基础，需要与其他技术手段整合在一起，方能实现IPA及其优势。

商业社会对流程自动化的功能的期望将与日俱增，将机器学习等AI技术运用到RPA中，将人工智能功能集成到产品套件中，以提供更多类型的自动化功能，已经成为未来RPA发展的主流趋势。

02光学字符识别（OpticalCharacterRecognition，OCR）

OCR技术是指利用电子设备（例如扫描仪或数码相机）将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。通俗地说就是，对文本资料进行扫描，然后对图像文件进行分析处理，以获取文字及版面信息的技术。

OCR技术一般可分为如图3-1所示的5个阶段。

▲图3-1OCR技术的5个阶段

下面具体说明OCR的识别流程。

1.图像处理

针对图像的成像问题进行修正。常见的图像预处理过程包括：几何变换（透视、扭曲、旋转等）、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。

2.文字检测

检测文本所在位置、范围及其布局，通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字，文字的范围有多大。

文字检测采用的处理算法一般包括：Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。

3.文字识别

在文本检测的基础上，对文本内容进行识别，将图像中的文本信息转化为计算机可识别和处理的文本信息。文字识别主要解决的问题是每个文字是什么。

文字识别常采用的处理算法包括：CRNN、AttentionOCR、RNNLM、BERT。

4.文本抽取

从文字识别结果中抽取出需要的字段或要素。

文本抽取常采用的处理算法包括：CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。

5.输出

输出最终的文字识别结果或者文本抽取结果。

03机器学习/大数据分析

机器学习/大数据分析是一种用于设计复杂模型和算法并以此实现预测功能的方法，即计算机有能力去学习，而不是依靠预先编写的代码。它能够基于对现有结构化数据的观察，自行识别结构化数据中的模型，并以此来输出对未来结果的预测。

机器学习是一种通过“监督”和“无监督”学习来识别结构化数据中的模式（例如日常性能数据）的算法。监督算法是指在根据自己的输入做出预测之前，会从输入和输出的结构化数据集来进行学习。无监督算法是指观察结构化数据，并对已识别的模式提供相关见解。

机器学习和高级分析可能会改变保险公司的游戏规则，例如，在提高合规性、降低成本结构，以及从新的见解中获得竞争优势。高级分析已经在领先的人力资源部门中得到了广泛应用，主要用于确定和评估领导者和管理者的核心品质，以便更好地预测行为、规划职业发展道路和下一任领导岗位归属。

04自然语言生成（NaturalLanguageGeneration，NLG）

计算机具有与人一样的表达能力和写作能力，它遵循某种规则，将从数据中观察到的信息转换成高质量的自然语言文本。例如，自动识别会议邮件中的主题、数字地名、人名地址并生成行程表备忘录，或者识别出合同条款的关键内容并将摘要的重点生成列表。

关于自然语言生成及自然语言处理的详细介绍，请阅读《详解自然语言处理5大语义分析技术及14类应用（建议收藏）》

05智能工作流（SmartWorkflow）

智能工作流是一种用于流程管理的软件工具，其中集成了由人和机器共同执行的工作，允许用户实时启动和跟踪端到端流程的状态，以便于管理不同组之间的切换，包括机器人与人类用户之间的切换，同时还能提供瓶颈阶段的统计数据。

随着社会和科技的不断进步，各个领域都开始逐步朝着自动化、智能化的方向快速发展。工作流相关技术的研究也越来越受重视，并广泛地应用于制造业、软件开发、银行金融、生物医学等不同领域。

工作流不但能够自动化地处理相关的活动和任务，减少人机交互处理过程中带来的潜在错误，而且能够精确化每一个处理步骤，最大化地提高生成效率，并且将工作流应用到动态、可变且灵活的应用场景当中。

近年来，在大数据、人工智能的背景下，工作流中的业务流程日趋复杂，所面临的环境和数据也日趋复杂，由需求分析引起的业务过程重新建模或由维护升级引起的过程模式变更和改进也变得越来越频繁。

在这种动态多变的复杂环境下，如何快速识别出任务，然后快速高效并有针对性地处理工作流问题，已成为目前工作流任务研究的关键问题。

RPA软件机器人在工作过程中，也会遇到很多类似的情况。工作流的复杂多变，会导致RPA作业流程的复杂多变，使其无法做到自适应，这将会大大影响RPA软件机器人的作业效率。

因此，需要通过智能工作流的技术，实现动态地调整RPA里的任务设定，以及RPA业务流程的自动变更和自动升级，在智能工作流的指导下实现自适应作业模式。

实现智能工作流的方法有很多，比如，美国J.H.Holland教授提出的基于遗传算法的工作流调度，PandeyS等提出的基于粒子群优化算法的启发式算法（PSO）可用于不同资源的智能调度。除此之外，还有很多基于自然界和仿生学的智能算法，比如，混合蛙跳算法、布谷鸟搜索算法、蝙蝠算法、人工蜂群算法等。

目前比较常见的方法是实现一种基于智能规划的工作流处理模式，该模式不再是单纯地将不同的活动当作对彼此没有影响的单独事件，而是有针对性地考虑多个事件的共同影响。

该模式充分考虑了工作流和智能规划之间的相似之处，通过智能规划推导出不同工作流任务之间的内在逻辑关系，并从其他的渠道和外部信息中充分挖掘潜在的关系。

逐步改进传统工作流中的问题，使用全新的智能规划的手段，从表面动作中挖掘出潜在的信息，过滤噪声数据，进而实现流程的自动修正，最后，通过前面得出的结论，有针对性地修改之前的RPA作业流程，实现自适应性的作业模式和作业过程。

06认知智能体（CognitiveAgent）

认知智能体是一种结合了机器学习和自然语言生成的技术，并在此基础上加入情感检测功能以做出判断和分析，使其能够执行任务，交流沟通，从数据集中学习，甚至根据情感检测结果作出决策。换句话说，机器会像人一样产生“情感共鸣、精神共振”，真正成为一个完全虚拟的劳动力（或者智能体）。

在客服领域，英国某汽车保险公司通过使用认知智能体技术，将客户转化率提高了22%，验证错误率降低了40%，整体投资回报率达到了330%。

当然，德勤、安永等咨询公司也坦然表示，就现阶段许多企业的流程管理与系统的基础能力来看，仍存在着大量的基础建设工作有待开展。而打造智能流程自动化所需的部分核心技术（例如认知智能体等）也还停留在雏形阶段。

智能包含三个方面，分别是计算智能、感知智能和认知智能。

在计算智能方面，计算机的速度早已远远超过人工的效率。

在感知智能方面，随着OCR、NLP等技术的发展，目前也已经能够实现很多的效果。

但是在认知智能方面，即使在某些特定领域，自然语言的处理也已经可以得到比人工更好的成绩，但是在某些领域，特别是知识理解、知识推理、知识判断等方面，还有很多需要逐步积累、逐步完善的地方。

按照机器能否产生自我认知和机器人的适用范围，人工智能分为弱人工智能和强人工智能，其中弱人工智能里的机器没有自我意识，不具备真正的推理和独立解决问题的能力，通常只适用于解决特定条件下的某种问题。当前人工智能的研究主要在弱人工智能领域。

而在强人工智能方面，机器具有一定的自我意识，能够通过学习拓展功能。对于当前不具备的功能或者当前不了解的知识，能通过自行学习获得。

当前条件下，全面的强人工智能还面临技术能力、社会伦理等多方面的挑战，但是在某些领域的特定场景下，具备认知智能能力和学习能力的人工智能软件，不仅能够优化作业流程、快速响应、覆盖更多不同的情况，同时还能够最大限度地避免技术风险和应用风险，是一个非常有价值的研究方向。

认知智能有很多种定义，其中，复旦大学肖仰华教授曾经提到过，所谓让机器具备认知智能是指让机器能够像人一样思考，而这种思考能力具体体现在如下几个方面。

第一，机器具备能够理解数据、理解语言进而理解现实世界的能力。

第二，机器具备能够解释数据、解释过程进而解释现象的能力。

第三，机器具备推理、规划等一系列人类所独有的认知能力，也就是说认知智能需要解决推理、规划、联想、创作等一系列复杂任务。

智能体是指驻留在某一环境下，能够持续自主地发挥作用，具备驻留性、反应性、社会性、主动性特征的计算实体。根据著名人工智能学者，美国斯坦福大学Hayes-Roth教授的理论“智能体能够持续执行三项功能：感知环境中的动态条件、执行动作影响环境、进行推理以解释感知信息、求解问题和决定动作”。

从前面的定义我们可以看出，认知智能体能够感知到环境中的动态条件，然后根据这些条件执行相应的动作来影响现有的环境，同时其还能够用推理来解释感知信息，求解相关问题，决定后续动作。

将认知智能体与RPA相结合，我们能够得到一个具备认知智能的机器人，它可以根据所涉及的应用系统和其他环境的变化动态感知下一步需要做的事情，同时执行相应的动作来影响对应的环境信息，实现智能录入、智能监控、智能文档处理和辅助判定。

与此同时，认知智能体通过RPA技术在处理业务的同时，还能够学习到相关的经验和知识，逐步掌握识别重点的能力。

认知智能体的研究包含了多种不同的方法，近年来，随着分布式人工智能、信息科学和网络科学的不断发展，面向动态环境下的分布式协同决策已经成为认知智能体的一个重要的研究方式。这种方式在以多无人机系统、多机器人系统为代表的典型无中心式多智能体系统中得到了广泛的应用。

与此同时，受限于自身设计，智能体对所在环境和系统常呈现出信息的部分可观测特征，而有限的智能体之间的交互和外部的约束也使得获得全局信息需要付出极高的代价。

同时，无中心式的多智能体系统在应用中呈现出了与社会网络相类似的自组结构和相应的复杂网络特征，即网络中单个智能体通常仅能连接/交互所在局部网络中的小部分智能体，传统的集中式协同模型则不再适用。

此外，类似于社会网络中人与人之间的有限信息交换便可大大提升个体的决策效率，同样的方法能否应用到相应的研究当中，也处于不断的尝试过程中。

关于作者：达观数据，中国智能RPA领域的龙头企业，独立开发了全套“RPA+AI”系统，拥有核心知识产权。达观智能RPA产品是业界不依赖微软底层开发框架、未使用第三方开源框架的RPA产品。

本文摘编自《智能RPA实战》，经出版方授权发布。

人工智能入门（二）（简述、理论基础、历史和发展现状）

人工智能的八个理论基础：哲学、数学、经济学、神经科学、心理学、计算机工程、控制理论和控制论、语言学。

数学对人工智能的理论支撑包括三个方面：（1）逻辑学：得出正确结论的形式规则。发展：命题逻辑，即布尔逻辑——一阶逻辑，扩展布尔逻辑，增加了对象和关系——指称理论，揭示如何将逻辑中的对象与对象相关联。（2）计算：研究什么是可计算的。发展：描述可计算的函数——提出计算的易处理性概念——提出了NP完全性理论。NP完全性理论：P（确定多项式时间的问题）、NP（不确定性多项式时间的问题）、NPC（NP完全性问题，是NP中最难的问题）。它是计算复杂性理论中的一个重要概念，它表征某些问题的固有复杂度。一旦确定一类问题具有NP完全性时，就可知道这类问题实际上是具有相当复杂程度的困难问题。（3）概率：研究如何根据不确定信息进行推理。发展：将概率描述为博弈事件中可能的结果——推进这一理论，并引入了新的统计学方法——提出贝叶斯规则，成为不确定性推理的现代方法基础。

神经科学研究大脑如何处理信息：神经科学研究神经系统，尤其是大脑。大脑在记性决策方面（预测和仿真是决策关键）非常优越，且不像软件那样模块化。大脑中神经元的数量基本上固定的，计算机中处理单元的数量每五年增加十倍。

认知心理学研究人类如何思考与行动：把大脑看作是信息处理设备，是研究心智过程的学科。研究方面：注意机制（意识集中在某个有用的感知信息子集的状态）、语言应用（研究语言习得、语言形成的组件、语言使用的语气及其他相关领域）、记忆（包括三个子集：过程、语义和情景）、感知（研究人类物理感知及认知过程）、问题求解、创造力、思考。元感知是关于认知的认知，有两个组成部分：关于认知的知识，以及认知的调节。认知心理学是研究人脑如何接受外部世界的输入，如何处理以及作用等；认知科学则是研究如何在大脑中形成以及转录过程的跨领域学科，关注于通过研究收集数据。

控制理论与控制论研究机器如何能在自身的控制下运行：控制理论是工程与数学的交叉学科分支，研究处理动态系统对输入的行为，以及该行为如何通过反馈进行调整。控制论是跨学科的研究途径，探索调控系统的结构、约束和可能性，1948年被定义为“研究动物与机器的控制与通信的科学”，21世纪被简单解释为“用技术控制任何系统”。

人工智能导论——人工智能学科研究的基本内容及主要研究领域

一、人工智能研究的基本内容

（1）知识表示

人工智能研究的目的是要建立一个能模拟人类智能行为的系统，但知识是一切智能行为的基础，因此首先要研究知识表示方法。只有这样才能把只是存储到计算机中去，供求解现实问题使用。知识表示方法可分为两类：符号表示法（用各种包含具体含义的符号以各种不同的方式和顺序组合起来表示知识的方法）和连接机制表示法（用神经网络表示知识）。

（2）机器感知

所谓机器感知就是使机器（计算机）具有类似于人的感知能力，其中以机器视觉和机器听觉为主。机器感知是机器获取外部信息的基本途径。

（3）机器思维

所谓机器思维是指通过感知得来的外部信息及机器内部的各种工作信息进行有目的的处理。

（4）机器学习

机器学习就是研究如何使计算机具有类似于人的学习能力，使它能通过学习自动的获取知识。

（5）机器行为

机器行为主要是指计算机的表达能力，即“说”、“写”、“画”等能力。对于智能机器人，它还应具有人的四肢功能，即能走路、能取物、能操作等。

二、人工智能的主要研究领域

目前，随着智能科学和技术的发展和计算机网络技术的广泛应用，人工智能技术应用到越来越多的领域。下面简要介绍几个主要领域：

（1）自动定理证明

自动定理证明是人工智能中最先进行研究并得到成功应用的一个研究领域，同时它也为人工智能的发展起到了重要的推动作用。实际上，除了数学定理证明以外，医疗诊断、信息检索、问题求解等许多非数学领域问题，都可以转化为定理证明问题。

（2）博弈

诸如下棋、打牌、战争等一类竞争性的智能活动称为博弈(gameplaying)。人工智能研究博弈的目的并不是为了让计算机与人进行下棋、打牌之类的游戏，而是通过对博弈的研究来检验某些人工智能技术是否能实现对人类智慧的模拟，促进人工智能技术的深入研究。

（3）模式识别

模式识别（patternrecognition）是一门研究对象描述和分类方法的学科。分析和识别的模式可以是信号、图象或者普通数据。模式是对一个物体或者某些其他感兴趣实体定量的或者结构的描述，而模式类是指具有某些共同属性的模式集合。

模式识别方法有统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别等。

（4）机器视觉

机器视觉（machinevision）或者计算机视觉（computervision）是用机器代替人眼进行测量和判断，是模式识别研究的一个重要方面。计算机视觉通常分为低层视觉和高层视觉两类。

（5）自然语言理解

自然语言理解（naturallanguageunderstanding）就是研究如何让计算机理解人类自然语言，是人工智能中十分重要的一个研究领域。它是研究能够实现人与计算机之间用自然语言进行通讯的理论与方法。

（6）智能信息检索

数据库系统是存储大量信息的计算机系统。随着计算机应用的发展，存储的信息量越来越大，研究智能信息检索系统具有重要的理论意义和实际应用价值。智能信息检索系统应具有下述功能：能理解自然语言、具有推理能力、系统拥有一定的常识性知识。

（7）数据挖掘与知识发现

知识发现系统通过各种学习方法，自动处理数据库中大量的原始数据，提炼出具有必然性的、有有意义的知识，从而揭示出蕴涵在这些数据背后的内在联系和本质规律，实现知识的自动获取。知识发现是从数据库中发现知识的全过程，而数据挖掘则是这个全过程的一个特定的、关键的步骤，数据挖掘的目的是从数据库中找出有意义的模式。

（8）专家系统

专家系统是一个智能的计算机程序，运用知识和推理步骤来解决只有专家才能解决的疑难问题，是目前人工智能最活跃、最有成效的一个研究领域。可以这样定义，专家系统是一种具有特定领域内大量知识和经验的程序系统，它应用人工智能技术模拟人类专家求解问题的思维过程求解领域内的各种问题，其水平可以达到甚至超过人类专家的水平。

（9）自动程序设计

自动程序设计是将自然语言描述的程序自动转换可执行程序的技术，包括程序综合和程序正确性验证两个方面的内容。

（10）机器人

机器人是指可模拟人类行为的机器。它可分为三代：程序控制机器人（第一代）、自适应机器人（第二代）、智能机器人（第三代）。

（11）组合优化问题

组合优化问题一般是NP完全问题。NP完全问题是指：用目前知道的最好的方法求解，问题求解需要花费的时间（称为问题求解的复杂性）是随问题规模增大以指数关系增长。组合优化问题的求解方法已经应用于生产计划与调度、通信路由调度、交通运输调度等。

（12）人工神经网络

人工神经网络是一个用大量简单处理但愿经广泛连接而组成的人工网络，用来模拟大脑神经系统的结构与功能。

（13）分布式人工智能与多智能体

分布式人工智能（DAI）是分布式计算与人工智能结合的结果。分布式人工智能的研究目标是要建立一种描述自然系统和社会系统的模型。

（14）智能控制

智能控制就是把人工智能技术引入控制领域，建立智能控制系统。

（15）智能仿真

智能仿真就是将人工智能技术引入仿真领域，建立智能仿真系统。

（16）智能CAD

智能CAD就是将人工智能技术引入计算机辅助设计领域，建立智能CAD系统。

（17）智能CAI

智能CAI就是将人工智能技术引入计算机辅助教学领域，简历智能CAI系统即ICAI。

（18）智能管理与智能决策

智能管理就是将人工智能技术引入管理领域，建立智能管理系统，研究如何提高计算机管理系统的智能水平，以及智能管理系统的设计理论、方法和实现方法。智能决策就是将人工智能技术引入决策过程，建立智能决策支持系统。

（19）智能多媒体系统

智能多媒体实际上是人工智能与多媒体技术的有机结合。

（20）智能操作系统

智能操作系统就是将人工智能技术引入计算机的操作系统之中，从质上提高操作系统的性能和效率。

（21）智能计算机系统

智能计算机系统就是人们正在研制的新一代计算机系统，它将全面支持智能应用开发，且自身就具有智能。

（22）智能通信

智能通信就是将人工智能技术引入通信领域，建立智能通信系统，在通信系统的各个层次和环节上实现智能化。

（23）智能网络系统

智能网络系统就是将人工智能技术引入计算机网络系统。

（24）人工生命

人工生命是以计算机为研究工具，模拟自然界的生命现象，生成表现自然生命系统行为特点的仿真系统。

----内容来自于《人工智能导论(第四版)》

人工智能基础 人工智能的应用基础包括哪些内容呢