人工智能 7专家系统
7.1 专家系统的产生和发展 7.2 专家系统的概念 7.3 专家系统的工作原理7.4 知识获取的主要过程与模式7.5 机器学习7.6 知识发现与数据挖掘7.7 专家系统的建立7.8 专家系统实例7.9 专家系统的开发工具
特点:高度的专业化。 专门问题求解能力强。 结构、功能不完整。 移植性差。 缺乏解释功能。
专家系统的定义:
1、具有专家水平的专业知识。2、能进行有效的推理。 3、启发性。4、灵活性。5、透明性。6、交互性。
专家系统与传统程序的比较:
1、编程思想
传统程序=数据结构+算法
专家系统=知识+推理
2、传统程序关于问题求解的知识隐含于程序中。
专家系统知识单独组成知识库,与推理机分离。
3、处理对象
传统程序数值计算和数据处理。
专家系统符号处理。
4、传统程序不具有解释功能。
专家系统具有解释功能。
5、传统程序产生正确的答案。
专家系统通常产生正确的答案,有时产生错误的答案。
6、系统的体系结构不同。
工作原理抽取知识、知识的转换、知识的输入、知识的检测。
知识获取的模式:非自动知识获取、自动知识获取、半自动知识获取。
机器学习机器学习Machinelearning、使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善。
一个学习系统一般应该有环境、学习、知识库、执行与评价(à学习)等四个基本部分组成。
“示例空间”是所有可对系统进行训练的示例集合。
“搜索”的作用是从示例空间中查找所需的示例。
“解释”是从搜索到的示例中抽象出所需的有关信息形成知识。
“形成知识”是把解释得到的信息综合、归纳形成一般性的知识。
“验证”的作用是检验所形成的知识的正确性。
知识发现与数据挖掘31 知识发现和数据挖掘的目的:从数据集中抽取和精化一般规律或模式。
知识发现过程分为数据准备、数据挖掘以及结果的解释评估等三步。
数据准备数据选、数据预处理和数据变换。数据选取就是根据用户的需要从原始数据库中抽取的一组数据。
数据预处理一般可能包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换等。
数据变换是从初始特征中找出真正有用的特征以减少数据开采时要考虑的特征或变量个数
数据挖掘数据挖掘阶段首先要确定挖掘的任务或目的是什么,如数据总结、分类、聚类、关联规则或序列模式等。
确定了挖掘任务后,就要决定使用什么样的挖掘算法。同样的任务可以用不同的算法来实现。
选择实现算法有两个考虑因素:
一是不同的数据有不同的特点,因此需要用与之相关的算法来挖掘
二是用户或实际运行系统的要求,有的用户可能希望获取描述型的、容易理解的知识,而有的用户系统的目的是获取预测准确度尽可能高的预测型知识。
结果解释和评价数据挖掘阶段发现的知识模式中可能存在冗余或无关的模式,所以还要经过用户或机器的评价。
若发现所得模式不满足用户要求,则需要退回到发现阶段之前,如重新选取数据,采用新的数据变换方法,设定新的数据挖掘参数值,甚至换一种挖掘算法。
由于KDD最终是面向人的,因此可能要对发现的模式进行可视化,或者把结果转换为用户易懂的另一种表示,如把分类决策树转换为“if-then…”规则。
知识发现的任务:
数据总结:对数据进行浓缩,给出它的紧凑描述。
概念描述:从学习任务相关的数据中提取总体特征。
分类:提出一个分类函数或分类模型也常常称作分类器,该模型能把数据库中的数据项映射到给定类别中的一个。
聚类:根据数据的不同特征,将其划分为不同的类。包括统计方法、机器学习方法、神经网络方法和面向数据库的聚类方法等。(聚类-无监督学习)
相关性分析:发现特征之间或数据之间的相互依赖关系。
偏差分析:寻找观察结果与参照量之间的有意义的差别。
建模:通过数据挖掘,构造出能描述一种活动、状态或现象的数学模型。
知识发现的主要方法:1.统计方法:从事物的外在数量上的表现去推断事物可能的规律性。常见的有回归分析、判别分析、聚类分析以及探索分析等。2.粗糙集:粗糙集是具有三值隶属函数的模糊集,即是、不是、也许。常与规则归纳、分类和聚类方法结合起来使用。3.可视化:把数据、信息和知识转化为图形等,使抽象的数据信息形象化。信息可视化也是知识发现的一个有用的手段。4.传统机器学习方法:包括符号学习和连接学习。
知识发现的对象1.数据库当前研究比较多的是关系数据库的知识发现。2.数据仓库数据挖掘为数据仓库提供深层次数据分析的手段,数据仓库为数据挖掘提供经过良好预处理的数据源。3.Web信息Web知识发现主要分内容发现和结构发现。内容发现是指从Web文档的内容中提取知识;结构发现是指从Web文档的结构信息中推导知识。4.图像和视频数据图像和视频数据中也存在有用的信息。比如,地球资源卫星每天都要拍摄大量的图像或录像。
专家系统的建立什么情况下开发专家系统是可能的
1,主要依靠经验性知识,不需运用大量常识性知识就可解决的任务。2,存在真正的领域专家。3,有明确的开发目标且任务不太难实现。
什么情况下开发专家系统是合理的
1,具有较高的经济效益。 2,人类专家奇缺但在许多地方又十分需要。3,人类专家经验不断丢失。 4,危险场合需要专业知识。
什么情况下开发专家系统是合适的
1,本质问题能通过符号操作和符号结构进行求解且需使用启发式知识、经验规则才能得到答案。 2,复杂性。 3,范围所选任务的大小可驾驭、任务有实用价值。
专家系统的设计原则与开发步骤
专家系统的评价
1. 正确性 1,系统设计的正确性: 系统设计思想的正确性。 系统设计方法的正确性。 设计开发工具的正确性。 2,系统测试的正确性: 测试目的、方法、条件的正确性。 测试结果、数据、记录的正确性。3系统运行的正确性 推理结论、求解结果、咨询建议的正确性。 推理解释及可信度估算的正确性。 知识库知识的正确性。
2. 有用性
专家系统实例
专家系统的开发工具骨架型工具
骨架型工具是从被实践证明了有实用价值的专家系统中,抽出了实际领域的知识背景,并保留了系统中推理机的结构所形成的一类工具。EMYCIN、EXPERT和PC等均属于此类型。EMYCIN疾病诊断专家系统MYCIN的基础上,抽去了医疗专业知识,修改了不精确推理,增强了知识获取和推理解释功能之后构造而成的世上最早的专家系统工具之一。EXPERT是从石油勘探和计算机故障诊断专家系统中抽象并构造出来的,适用于开发诊断解释型专家系统。
通用型知识表达语言OPS5
专家系统开发环境:AGEattempttogeneralize)一种典型的模块组合式开发工具。
专家系统程序设计语言
符号处理语言(面向AI的语言或AI语言PROLOG语言LISP语言
2. 面向问题的语言C语言、C++语言。
人工智能期末试题及答案
一单项选择题(每小题2分,共10分)1.首次提出“人工智能”是在(D)年
A.1946 B.1960 C.1916 D.1956
2.人工智能应用研究的两个最重要最广泛领域为:B
A.专家系统、自动规划 B.专家系统、机器学习
C.机器学习、智能控制 D.机器学习、自然语言理解
3.下列不是知识表示法的是 A 。
A:计算机表示法 B:“与/或”图表示法
C:状态空间表示法 D:产生式规则表示法
4.下列关于不确定性知识描述错误的是 C 。
A:不确定性知识是不可以精确表示的
B:专家知识通常属于不确定性知识
C:不确定性知识是经过处理过的知识
D:不确定性知识的事实与结论的关系不是简单的“是”或“不是”。
5.下图是一个迷宫,S0是入口,Sg是出口,把入口作为初始节点,出口作为目标节点,通道作为分支,画出从入口S0出发,寻找出口Sg的状态树。根据深度优先搜索方法搜索的路径是 C 。
A:s0-s4-s5-s6-s9-sg B:s0-s4-s1-s2-s3-s6-s9-sg
C:s0-s4-s1-s2-s3-s5-s6-s8-s9-sg D:s0-s4-s7-s5-s6-s9-sg
二 填空题(每空2分,共20分)1.目前人工智能的主要学派有三家:符号主义、 进化主义 和 连接主义 。
2.问题的状态空间包含三种说明的集合, 初始状态集合S、操作符集合F以及目标状态集合G。
3、启发式搜索中,利用一些线索来帮助足迹选择搜索方向,这些线索称为 启发式(Heuristic)信息。
4、计算智能是人工智能研究的新内容,涉及 神经计算、模糊计算和 进化计算等。
5、不确定性推理主要有两种不确定性,即关于 结论的不确定性和关于 证据的不确定性。
三名称解释(每词4分,共20分)人工智能 专家系统 遗传算法 机器学习 数据挖掘
答:
(1)人工智能
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等
(2)专家系统
专家系统是一个含有大量的某个领域专家水平的知识与经验智能计算机程序系统,能够利用人类专家的知识和解决问题的方法来处理该领域问题.简而言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统
(3)遗传算法
遗传算法是一种以“电子束搜索”特点抑制搜索空间的计算量爆炸的搜索方法,它能以解空间的多点充分搜索,运用基因算法,反复交叉,以突变方式的操作,模拟事物内部多样性和对环境变化的高度适应性,其特点是操作性强,并能同时避免陷入局部极小点,使问题快速地全局收敛,是一类能将多个信息全局利用的自律分散系统。运用遗传算法(GA)等进化方法制成的可进化硬件(EHW),可产生超出现有模型的技术综合及设计者能力的新颖电路,特别是GA独特的全局优化性能,使其自学习、自适应、自组织、自进化能力获得更充分的发挥,为在无人空间场所进行自动综合、扩展大规模并行处理(MPP)以及实时、灵活地配置、调用基于EPGA的函数级EHW,解决多维空间中不确定性的复杂问题开通了航向
(4)机器学习
机器学习(MachineLearning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎
(5)数据挖掘
数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。数据挖掘的过程也叫知识发现的过程。
四 简答题(每小题5分,共30分)1. 人工智能有哪些研究领域和应用领域?
答:(1)研究领域
自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计,软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法
(2)应用领域
智能控制,机器人学,语言和图像理解,遗传编程
2. 简述模式识别的基本过程
答:(1)信息获取
(2)预处理:对获取信号进行规范化等各种处理(3)特征提取与选择:将识别样本构造成便于比较、分析的描述量即特征向量(4)分类器设计:由训练过程将训练样本提供的信息变为判别事物的判别函数(5)分类决策:对样本特征分量按判别函数的计算结果进行分类
3.状态空间法、谓词逻辑法和语义网络的要点分别是什么?
答:(1)状态空间法是以状态和算符为基础来表示和求解问题的,三个要点是:状态,算符,问题的状态空间
(2)谓词逻辑法要点:命题真值,论域与谓词,连接词和量词,项与合式公式,自由变元和约束变元
(3)语义网络要点:类属关系,包含关系,属性关系,时间关系,位置关系,相近关系,推论关系
4.简述Agent的定义和基本特征
答:(1)Agent定义:Agent指的是一种实体,而且是一种具有智能的实体。这种实体可以是智能软件、智能设备、智能机器人或智能计算机系统等等,甚至也可以是人
(2)Agent基本特征:
a.自主性
Agent具有属于其自身的计算资源和局部于自身的行为控制机制,能够在没有外界直接操纵的情况下,根据其内部状态和感知到的环境信息,决定和控制自身的行为。例如,SNMP中的agent就是独立运行在被管理单元上的自主进程。
b.交互性
Agent能够与其他Agent(包括人),用Agent通信语言实施灵活多样的交互,能够有效地与其他Agent协同工作。例如,一个Internet上的用户需要使用Agent通信语言向主动服务Agent陈述信息需求。
c.反应性
Agent能够感知所处的环境(可能是物理世界,操纵图形界面的用户,或其他Agent等),并对相关事件作出适时反应。例如,一个模拟飞机的Agent能够对用户的操纵作出适时反应。
d.主动性
Agent能够遵循承诺采取主动行动,表现出面向目标的行为。例如,一个Internet上的主动服务Agent,在获得新的信息之后能够按照约定主动将其提交给需要的用户;一个工作流管理Agent,能够按照约定将最新的工作进展情况主动通报给有关的工作站
5. 根据自己的理解给出人工神经网络的定义,并指出其特征。
答:(1)人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型 (2)特征:a.非线性非线性关系是自然界的普遍特性。大脑智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性 关系。具有阈值的神经元构成的网络具有更好的性能,可以提高容错性和存储量
b.非局限性一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子
c.非常定性人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程
d.非凸性一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性
6. 有一个农夫带一只狐狸、一只小羊和一篮菜过河。假设农夫每次只能带一样东西过河,考虑安全,无农夫看管时,狐狸和小羊不能在一起,小羊和菜篮不能在一起。试设计求解该问题的状态空间,并画出状态空间图。
答:以变量m、f、s、v分别指示农夫、狐狸、小羊、菜,且每个变量只可取值1(表示在左岸)或0(表示在右岸)。问题状态可以四元组(m、f、s、v)描述,设初始状态下均在左岸,目标状态下都到达右岸。从而,问题求解任务可描述为(1,1,1,1)->(0,0,0,0)
由于问题简单,状态空间中可能的状态总数为2×2×2×2=16,由于要遵从安全限制,合法的状态只有(除初、目状态外): 1110,1101,1011,1010,0101,0001,0010,0100;不合法状态有:0111,1000,1100,0011,0110,1001
设计二类操作算子:Lx、Rx,x为m、f、s、v时分别指示农夫独自,带狐狸,带小羊,带菜过河;状态空间图如下所示.由于Lx和Rx是互逆操作,故而解答路径可有无数条,但最近的只有二条;都是7个操作步
五.综述题(20分)1.(本题10分)对于八数码难题按下式定义估价函数:
f(x)=d(x)+h(x)
其中,d(x)为节点x的深度;h(x)是所有棋子偏离目标位置的曼哈顿距离(棋子偏离目标位置的水平距离和垂直距离和),例如下图所示的初始状态S0:8的曼哈顿距离为2;2的曼哈顿距离为1;1的曼哈顿距离为1;6的曼哈顿距离为1;h(S0)=5。
(1)用A*搜索法搜索目标,列出头三步搜索中的OPEN、CLOSED表的内容和当前扩展节点的f值。
(2)画出搜索树和当前扩展节点的f值。
解:(1)如下表
(2)搜索树如下图,右上角的数字是其估价函数值
2.(本题10)您认为《人工智能》课程的哪一部分内容对您的毕业设计或者您以后的工作特别有用?如果有,请叙述其原理;如果没有,请您谈谈人工智能的发展对人类有哪些的影响?
答:我认为人工智能的发展对人类的影响主要有以下五个方面
(1)劳务就业问题。由于人工智能能够代替人类进行各种脑力劳动,例如用专家系统代替管理人员或医生进行决策或诊断与治疗病人疾病,所以,将会使一部分人不得不改变他们的工种,甚至造成失业。人工智能在科技和工程中的应用,会使一些人失去介入信息处理活动(如规划、诊断、理解和决策等)的机会,甚至不得不改变自己的工作方式。
(2)社会结构变化。人们一方面希望人工智能和智能机器能够代替人类从事各种劳动,另一方面又担心它们的发展会引起新的社会问题。实际上,近十多年来,社会结构正在发生一种静悄悄的变化。
(3)思维方式与观念的变化。人工智能的发展与推广应用,将影响到人类的思维方式和传统观念,并使它们发生改变。过分地依赖计算机的建议而不加分析地接受,将会使智能机器用户的认知能力下降,并增加误解。
(4)心理上的威胁。人工智能还使一部分社会成员感到心理上的威胁,或叫做精神威胁。人们一般认为,只有人类才具有感知精神,而且以此与机器相别。如果有一天,这些人开始相信机器也能够思维和创作,那么他们可能会感到失望,甚至感到威胁。他们担心:有朝一日,智能机器的人工智能会超过人类的自然智能,使人类沦为智能机器和智能系统的奴隶。
(5)技术失控的危险。任何新技术最大危险莫过于人类对它失去了控制,或者是它落入那些企图利用新技术反对人类的人手中