人工智能导论(5
大题在2-5章,其他章节记重要名词和重要算法。(eg.遗传算法步骤,专家系统组成及各部分功能,PSO算法和蚁群算法)
五.搜索求解策略1.搜索的定义:按照一定策略或规则从知识库中寻找可利用的知识构造,解决问题的推理路线的过程。
搜索的方向:
数据驱动:从初始状态出发的正向搜索。目的驱动:从目的状态出发的逆向搜索。双向搜索。两个方向同时进行。盲目搜索:在不具有对特定问题的任何有关信息的条件下,按固定的步骤(依次或随机调用操作算子)进行的搜索。
启发式搜索:考虑特定问题领域可应用的知识,动态地确定调用操作算子的步骤,优先选择较适合的操作算子,尽量减少不必要的搜索,以求尽快地到达结束状态。
2.状态空间表示法
状态空间
状态集合/操作算子的集合/包含问题的初始状态/包含问题的目的状态
求解路径:从S0结点到S结点的路径。
状态空间的一个解:有限的操作算子序列。
3.八数码问题(重排九宫格)
状态空间:所有的摆法,数目为9!
操作集合:将空格向上下左右移动4个。
有向图描述:
如果S10为目标状态,那么O2,O6,O10就是一个解。
4.盲目的图搜索策略
图搜索思想:
问题初始状态作为当前状态,选择算符进行操作,生成子状态,检查目标状态是否出现。若出现,则搜索成功,找到问题解;否则,从已生成状态中再选一个状态作为当前状态。重复上述过程,直到目标状态出现或不再有可供操作状态及算符(操作)为止。数据结构:OPEN表、CLOSED表
OPEN表:记录待扩展的节点用于存放刚生成的节点作为待考察对象。
“有进有出”动态数据结构。
节点进入OPEN表的顺序由搜索策略决定。
CLOSED表:记录已扩展的节点存放将要扩展或已经扩展的节点,记录求解信息。
“有进无出”动态数据结构。
当前节点进入closed表的最后。
回溯策略:从初始状态出发,不停地、试探性地寻找路径,直到它到达目的或“不可解结点”,即“死胡同”为止。若它遇到不可解结点就回溯到路径中最近的父结点上,查看该结点是否还有其他的子结点未被扩展。若有,则沿这些子结点继续搜索;如果找到目标,就成功退出搜索,返回解题路径。回溯搜索算法
(1)PS(pathstates)表:保存当前搜索路径上的状态。
(2)NPS(newpathstates)表:新的路径状态表。
(3)NSS(nosolvablestates)表:不可解状态集。
宽度优先搜索策略BFS:数据结构:
OPEN表(NPS表):已经生成出来但其子状态未被搜索的状态。
CLOSED表(PS表和NSS表的合并):记录了已被生成扩展过的状态。
搜索次序:
宽度优先搜索算法的OPEN表是队列结构,后进先出。
深度优先搜索策略DFS:深度优先搜索算法的OPEN表是堆栈结构,后进先出。
两个例题重点看!!!
5.启发式图搜索策略
启发式策略:利用与问题有关的启发信息进行搜索。
关键:如何寻找一个h(n)构造f(n),以f(n)大小来排列待扩展状态,以最小者进行扩展。
估价函数(evaluationfunction):估算节点“希望”程度的量度。
g(n):从初始节点S0到节点n的实际代价;
h(n):从节点n到目标节点Sg的最优路径的估计代价,称为启发函数。
A搜索算法
在图搜索算法中,如果能在搜索的每一步都利用估价函数
对open表中的节点(带扩展的节点)进行评价、排搜索次序,则该搜索算法为A算法。
A*算法
A*算法能保证一定能找到一条最短路径。
限制:
g(n)是对最小代价g*(n)的估计,且g(n)≥g*(n)
h(n)是最小代价h*(n)的下界,即对任意节点n均有h(n)≤h*(n)。
六.智能计算及其应用1.受自然界和生物界规律的启迪,人们根据其原理模仿设计了许多求解问题的算法,包括人工神经网络、模糊逻辑、遗传算法、DNA计算、模拟退火算法、禁忌搜索算法、免疫算法、膜计算、量子计算、粒子群优化算法、蚁群算法、人工蜂群算法、人工鱼群算法以及细菌群体优化算法等,这些算法称为智能计算也称为计算智能
2.进化算法EA:是基于自然选择和自然遗传等生物进化机制的一种搜索算法,包括遗传算法,遗传规划,进化策略,进化规划。通过选择、重组(交叉)和变异这三种操作实现优化问题的求解。
5个设计原则
适用性原则可靠性原则收敛性原则稳定性原则生物类比原则3.遗传算法(GA):借鉴生物界自然选择和自然遗传机制的随机搜索算法。
遗传算法的步骤(20级考题简答)
基本思想:在求解问题时从多个解开始,然后通过一定的法则进行逐步迭代以产生新的解。
1965霍兰德首次提出遗传算法。
基本要素:
参数编码(遗传编码)初始群体的设定(初始化种群)适应度函数的设计遗传操作设计(选择、交叉、变异)控制参数设定(算法参数)编码
位串编码一维染色体编码方法:将问题空间的参数编码为一维排列的染色体的方法。
二进制编码:用若干二进制数表示一个个体,将原问题的解空间映射到位串空间B={0,1}上,然后在位串空间上进行遗传操作。
Gray编码:将二进制编码通过一个变换进行转换得到的编码。
实数编码采用实数表达法不必进行数制转换,可直接在解的表现型上进行遗传操作。
多参数级联编码把每个参数先进行二进制编码得到子串,再把这些子串连成一个完整的染色体。
种群规模一般取20-100,模式定理表明:若群体规模为M,则遗传操作可从这M的三次个个体中生成和检测 个模式,并在此基础上能够不断形成和优化积木块,直到找到最优解。
适应度函数:区分群体中个体好坏的标准。
适应度函数尺度变换(定标):对适应度函数值域的某种映射变换。
线性变换
幂函数变换法:
指数变换法:
欺骗问题:将所有妨碍适应度值高的个体产生,从而影响遗传算法正常工作的问题统称为欺骗问题过早收敛:缩小这些个体的适应度,以降低这些超级个体的竞争力。停滞现象:改变原始适应值的比例关系,以提高个体之间的竞争力。4.选择操作:从当前群体中按照一定概率选出优良的个体,使它们有机会作为父代繁殖下一代子孙。(个体适应度越高,其被选择的机会就越多。 )
交叉:
部分匹配交叉PMX
变异:
可行调度:
A:784|239|165
B:891|567|243
5.遗传算法的改进
(1)双倍体遗传算法
采用显性和隐性两个染色体同时进行进化。
(2)双种群遗传算法
使用多个种群同时进化,交换种群之间最好个体所携带的遗传信息。
(3)自适应遗传算法AGA
交叉概率和变异概率可以随适应度自动改变
6.粒子群优化算法PSO
基本原理:PSO初始化为一群随机粒子,然后通过迭代找到最优解。在每一次迭代中,粒子通过跟踪两个“极值”来更新自己。第一个就是粒子本身所找到的最优解,这个解称为个体极值。另个一是整个种群目前找到的最优解,
7.蚁群算法一种应用于组合优化问题的启发式搜索算法。
要知道信息素挥发度,过大和减小都会负面影响算法性能。
七.专家系统与机器学习1.专家系统:一类包含知识和推理的智能计算机程序。
2.专家系统的特点
(1)具有专家水平的专业知识。
(2)能进行有效的推理。
(3)启发性。
(4)灵活性。
(5)透明性。
(6)交互性。
3.专家系统与传统程序的最大区别:专家系统是依据知识和推理来求解
4.专家系统的组成(六部分)
5.知识获取
过程:抽取知识、知识的转换、知识的输入、知识的检测。
模式:非自动知识获取、自动知识获取、半自动知识获取。
6.机器学习使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善。
学习系统:一个学习系统一般应该有环境、学习、知识库、执行与评价等四个基本部分组成。
7.机器学习按学习能力分类:
强化学习(激励学习/再励学习/增强学习-评价反馈
监督学习-响应反馈
非监督学习(无教师学习)-无反馈
8.示例学习:从例子中学习
指导式学习:向系统提供一般性的指示或建议进行学习
机械式学习:通过直接记忆或者存储外部环境所提供的信息达到学习的目的
9.知识发现:KDD,从数据库中发现知识。
知识发现过程分为3步:数据准备(数据选取、数据预处理和数据变换)、数据挖掘以及结果的解释评估。
知识发现方法:统计方法,粗糙集,可视化,传统机器学习方法
聚类:根据数据的不同特征,将其划分为不同的类。
分类:提出一个分类函数或分类模型
10.专家系统的开发步骤。
11.专家系统的开发工具:
通用知识表达语言OPS5。OPS5的组成:产生式规则库、推理机、数据库。
程序设计语言:PROLOG语言,LISP语言
八.人工神经网络及其应用1.人工神经网络ANN是一个用大量简单处理单元经广泛连接而组成的人工网络,是对人脑或生物神经网络若干基本特性的抽象和模拟。
2.决定人工神经网络性能的三大要素:
神经元的特性。神经元之间相互连接的形式——拓扑结构。为适应环境而改善性能的学习规则。神经网络的结构有前馈型和反馈型;工作方式有同步和异步
神经网络知识表示是一种隐式的表示方法。
Hebb学习规则:当某一突触两端的神经元同时处于兴奋状态,那么该连接的权值应该增强。
神经元的数学模型(三部分):加权求和,线性动态系统,非线性函数映射。
4.BP神经网络(多层前向网络)(输入层、隐层、输出层)
层与层的连接是单向的,信息的传播是双向的。
BP学习算法:
正向传播:输入信息由输入层传至隐层,最终在输出层输出。
反向传播:修改各层神经元的权值,使误差信号最小。
5.Hopfield神经网络是单层全互联反馈神经网络,每个神经元互相连接。
离散型Hopfield神经网络连续型Hopfield神经网络及其VLSI实现随机神经网络6.卷积神经网络是深度学习的基础
4个关键技术:局部连接,权值共享,多卷积核,池化。
卷积运算(乘积之和):
7.生成对抗网络GAN使用对抗训练机制对两个神经网络进行训练
最成功的领域:计算机视觉
九.智能体与多智能体系统1.智能体(Agent)是一个程序或者一个实体,它嵌入在环境中,通过传感器(sensors)感知环境,通过效应器(effectors)自治地作用于环境并满足设计要求。(Agent看做人,眼睛耳朵为传感器,手脚嘴为效应器)
体系结构:反应/慎思/复合
特性:自主性,反应性,社会性,进化性
2.智能体的结构:接受传感器的输入,然后运行Agent程序,并把执行的结果传送到效应器进行动作。
结构的分类:反应式体系结构、慎思式体系结构和混合式体系结构。
Agent=体系结构+程序
3.多智能体系统MAS:多个智能体构成的系统。
MAS的体系结构:网络结构,联盟结构,黑板结构
MAS的基本类型:BDI模型,协商模型,协作规划模型,自协调模型
MAS的通信过程:
发送方将自己的思想翻译成通信所用语言的格式;发送方将语言格式加载到通信传播媒体,如声音、文字和图像;传播载体到达接收方;接收方读取载体中的语言代码;接收方在思维空间中将语言代码按其格式翻译为思想,从而熟悉发送方的意识状态。MAS的通信类型:Tell和Ask,形式语言
通信方式:黑板系统(知识源,黑板,监控机制)和消息/对话系统
通信语言:知识交换格式语言KIF和知识查询操纵语言KQML
MAS的协调协作协商
人工智能导论(第4版)
本书是一本基础性强、可读性好、适合讲授的人工智能教材。读者通过学习本书,能够掌握人工智能的基本知识,并能了解人工智能研究的一些前沿内容,为进一步学习人工智能理论与应用奠定基础。
全书共11章。第1章绪论;第2章知识表示;第3章确定性推理方法;第4章不确定性推理方法;第5章搜索求解策略;第6章智能计算及其应用;第7章专家系统与机器学习;第8章人工神经网络及其应用;第9章智能体与多智能体系统;第10章自然语言处理及其应用;第11章人工智能在游戏设计中的应用。附录中给出了本书部分习题的简要解答和实验指导书。
本书可作为电气信息类、机械类、电子信息科学类以及其他专业的本科生学习人工智能课程的教材。由于书中几大部分内容相对独立,教师可以根据课程计划灵活选择相关内容。
人工智能(第一章 绪论)
一、人工智能的定义人工智能的定义最早可以追溯到1956年夏天,由人工智能早期研究者JohnMcCarthy等人提出的;人工智能就是让机器的行为看起来像是人所表现的智能行为一样,但迄今为止尚难给出人工智能的确切定义。
下面是为不同学者从不用的角度,不同层面给出的人工智能的定义:
二、人工智能的发展历史1.孕育阶段人工智能的孕育阶段大致可以认为是1956年以前的时期。这段漫长的时期中,数理逻辑、自动控制理论、信息论、仿生学、电子计算机、心理学等科学技术的发展为后续人工智能的诞生奠定了思想、理论和物质基础。
2.形成阶段人工智能的形成阶段大约为1956-1969年。除了1956年在美国的达特茅斯学院召开的研讨会提出了“人工智能”的术语外,这一时期的成就还包括定理机器证明、问题求解、LISP语言以及模式识别等。
3.发展阶段从20世纪70年代开始,人工智能的研究进入高速发展时期,在这期间,世界各国都纷纷展开对人工智能领域的研究工作,主要是从知识工程、人工神经网络和智能主体3个方开。
三、人工智能的三大学派1.符号主义符号主义又称逻辑主义、心里学派或计算机学派,其基本原理基于两点:物理符号系统假设和有限合理性原理。物理符号系统假设是Newell和Simon在1976年提出,该假设认为:物理符号系统具有必要且足够的方法来实现普通的智能行为。Newell和Simon把人类的-切精神活动、智能问题归结为计算问题。
有限合理性原理是Simon提出的观点。他的观点强调:人类之所以能在大量不确定、不完全信息的复杂环境下解决难题,原因在于人类采用了启发式搜索的试探性方法来感得问题的有限合理解。
2.连结主义连接主义又被称为仿生学派或生理学派,是基于神经元及神经元之间的网络连接机制来模拟和实现人工智能。
人类智能的物质基础是神经系统,其基本单位是神经元。这也就是说,连接主义用人工神经网络来研究人工智能。
3.行为主义行为主义又被称为进化主义或控制论学派,是基于控制论和“感知——动作”控制系统的人工智能学派。
其基本观点是:智能取决于感知和行为,取决于对外界复杂环境的适应。
四、人工智能的研究内容与应用领域1.问题求解人工智能的最早应用实践就是问题求解。该领域最有名的例子就是下棋程序。
问题求解是指通过搜索的方法寻找目标解的一个合适的操作序列,并同时满足问题的各种约束。问题求解的核心是搜索技术。
2.专家系统专家系统是一个具有大量专门知识与经验的程序系统,它应用人工智能技术,根据某个领域一个或多个人类专家提供的知识和经验进行推理和判断,模拟人类专家的决策过程,以解决那些需要专家决定的复杂问题。
专家系统通常由知识库、推理机、综合数据库、人机交互界面、解释器和知识获取等部分构成。
专家系统在医疗诊断、故障诊断、资源勘探、贷款损失评估和教学等领域中得到了广泛应用。
3.机器学习学习能力无疑是人工智能研究上最突出和最重要的一个方面。机器学习(自动获取新的事实及新的推理算法)是使计算机具有智能的根本途径。正如香克(R.Shank)所说:“一台计算机若不会学习,就不能称为具有智能的。”此外,机器学习还有助于发现人类学习的机理和揭示人脑的奥秘。
4.神经网络人工神经网络简称神经网络,其研究始于1943年McCulloch和Pitts提出的神经元数学模型(MP模型)人工神经网络是以对人脑和自然神经网络的生理研究成果为基础,抽象和模拟人脑的某些机理、机制实现某方面的功能。
Nielsen给出的人工神经网络定义为:人工神经网络是由人工建立的以有向图为拓扑结构的动态系统,它通过对连续或断续的输入作状态响应而进行信息处理。
5.模式识别模式识别-般指应用电子计算机及外部设备对给定.事物进行鉴别和分类,将其归入与之相同或相似的模式中。其一般过程包括对待识别事物采集样本、数字化样本信息、提取数字特征、学习和识别。其核心是特征提取和学习过程。针对不同的识别对象,可分为以下几种类型:语音识别;图形、图像识别;信号识别;染色体识别。
6.数据挖掘与知识发现数据挖掘和知识发现起源于20世纪90年代初期,在早期,它侧重于构建数据仓库,然后运用切片、下钻、上卷等操作从海量数据中发现有用信息。
如今的数据挖掘包括半结构和无结构的文本数据、音频、视频、图像等多媒体数据,通过综合运用统计学、粗糙集、模糊数学、机器学习和专家系统等多种学习手段和方法,从大量的数据中提炼出抽象的知识,揭示隐含在数据背后的客观世界的内在联系和本质规律,实现知识的自动获取。
7.计算机视觉计算机视觉是一门用计算机实现或模拟人类视觉功能的新兴学科。研究目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力不仅包括对三维环境中物体形状、位置、姿态、运动等几何信息的感知,而且还包括对这些信息的描述、存储、识别与理解。主要应用领域包括:
图形图像识别:指纹识别、染色体识别等。
航空航天:卫星图像处理、飞行器跟踪等。
医学:脏器的图像重建、医学图像分析等。
工业:监测和监控系统。
8.智能控制智能控制是一类无需或尽可能少的人的干预就能独立完成任务的自动控制。智能控制涉及的领域很多,主要有以下方面:智能机器人规划与控制;智能过程规划;智能过程控制;专家控制系统;语言控制;智能仪器等
9.计算智能计算智能主要借鉴仿生学的思想,应属于智能学习部分,目前没有统一定义,美国科学家贝兹德克认为不具有计算适应性、计算容错力、接近人的计算速度和近似人的误差率这几个特性,就不能称之为计算智能。涉及的主要领域:模糊计算;神经计算;进化计算;免疫计算等。
10.其他自然语言处理分布式人工智能;人工生命;
机器人学智能检索;大数据;深度学习等。
五、人工智能的发展趋势1.多学科交叉研究与信息科学、生物学、数学、心里学等学科的交叉研究。
2.智能应用和智能产业智能技术将进一步与主流信息技术融合,应用于人类社会的各个领域和人类生活的方方面面。智能产业将成为第四产业。