博舍

《模式识别》期末考试考题汇总带答案 人工智能期末考试题及答案2021级

《模式识别》期末考试考题汇总带答案

目录

一、名词解释

二、填空题

三、简答题

四、计算题

一、名词解释

样本(sample):所研究对象的一个个体。

样本集(sampleset):若干样本的集合。

类或类别(class):在所有样本上定义的一个子集,处于同一类的样本在我们所关心的某种性质上是不可区分的,即具有相同的模式。

特征(features):指用于表征样本的观测。

已知样本(knownsamples):指事先知道类别标号的样本。

未知样本(unknownsamples):指类别标号未知但特征已知的样本。

模式识别(patternrecognition):就是用计算的方法根据样本的特征将样本划分到一定的类别中去。

统计模式识别:用概率统计的观点和方法来解决模式识别问题。

贝叶斯决策(统计决策理论):是统计模式识别的基本方法和基础;是“最优分类器”:使平均错误率最小。

最小风险贝叶斯决策:最小错误率只考虑了错误,进一步可考虑不同错误所带来的损失(代价)。

Neyman-Pearson决策规则:限定一类错误率为常数而使另一类错误率最小的决策。

参数估计(parametricestimation):已知概率密度函数的形式,只是其中几个参数未知,目标是根据样本估计这些参数的值。

非参数估计:在一些情况下我们无法实现判断数据的分布情况。

统计量(statistics):样本的某种函数,用来作为对某参数的估计。

参数空间(parametricspace):待估计参数的取值空间。

估计量(estimation):。

贝叶斯估计:思路与贝叶斯决策类似,只是离散的决策状态变成了连续的估计。

最优超平面:一个超平面,如果它能够将训练样本没有错误地分开,并且两类训练样本中离超平面最近的样本与超平面之间的距离是最大的,则我们把这个超平面称作最优分类超平面(OptimalSeperatingHyperplane),简称最优超平面(OptimalHyperplane)。两类样本中离分类面最近的样本到分类面的距离称作分类间隔(margin),最优超平面也称作最大间隔超平面。

特征形成(特征获取、提取):直接观测到的或经过初步运算的特征——原始特征。

特征选择:从  个特征中选择 个,(人为选择、算法选择)。

特征提取(特征变换,特征压缩):将 个特征变为 个新特征——二次特征。

特征的评价准则:特征选择与提取的任务是找出一组对分类最好的特征。

二、填空题

1、解决模式识别的方法可以归纳为基于知识的方法和基于数据的方法两大类。

2、一个模式识别问题往往包括以下五个阶段:问题的提出和定义、数据获取和预处理、特征提取和选择、分类器设计和性能评估、分类及结果解释。

3、模式识别应用举例:语音识别、说话人识别、字符与文字识别、复杂图像中特定目标的识别、根据地震勘探数据对地下储层性质的识别、利用基因表达数据进行癌症分类。

4、统计决策基本原理:根据各类特征的概率模型来估算后验概率,通过比较后验概率进行决策。

5、第一类错误率(Type-Ierrorrate)=假阳性率=假阳性样本数/总阴性样本数    第二类错误率(Type-IIerrorrate)=假阴性率=假阴性样本数/总阳性样本数

6、ROC曲线(ROCCurve)纵坐标:真阳性率(灵敏度);横坐标:假阳性率(1-特异度)。

7、估计概率密度的两种基本方法:参数方法(parametricmethods)和非参数方法(nonparametricmethods)。

8、贝叶斯估计基本思想:把待估计参数看作具有先验分布的随机变量,其取值与样本集有关,根据样本集估计。

9、从基于概率密度(估计)的分类器设计到基于样本的直接分类器设计思路:首先选定判别函数类和一定的目标(准则),利用样本集确定出函数类中的某些未知参数,使所选的准则最好。

10、基于样本直接设计分类器需要确定三个基本要素:一是分类器即判别函数的类型、二是分类器设计的目标或准则、三是在前两个要素明确后,如何设计算法利用样本数据搜索到最优的函数参数(即选择函数集中的函数)。

11、非线性分类器包括分段线性分类器、二次判别函数、神经网络和支持向量机等。

12、线性分类器包括Fisher线性判别器、感知器、最小平方误差判别器、最优分类超平面、线性支持向量机。

13、主成分分析目的:出发点是从一组特征中计算出一组按重要性从大到小排列的新特征,它们是原有特征的线性组合,并且相互之间是不相关的。

三、简答题

1、简述模式识别系统的典型构成。

有已知样本情况:监督模式识别(supervisedPR):已知要划分的类别,并且能够获得一定数量的类别已知的训练样本,这种情况下建立分类器的问题属于监督学习问题,程总做监督模式识别,因为我们有训练样本来作为学习过程的"导师"。

处理监督模式识别问题的一般步骤:·分析问题:深入研究应用领域的问题,分析是否属于模式识别问题,把所研究的目标表示为一定的类别,分析给定数据或者可以观测的数据中哪些因素可能与分类有关。·原始特征获取:设计实验,得到已知样本,对样本实施观测和预处理,获取可能与样本分类有关的观测向量(原始特征)。·特征提取与选择:为了更好地进行分类,可能需要采用一定的算法对特征进行再次提取和选择。·分类器设计:选定一定的分类器方法,用已知样本进行分类器训练。·分类决策:利用一定的算法对分类器性能进行评价;对未知样本实施同样的观测、预处理和特征提取与选择,用所设计的分类器进行分类,必要时根据领域知识进行进一步的后处理。

无已知样本情况:非监督模式识别(unsupervisedPR):非监督模式识别称作聚类,在很多非监督模式识别问题中,答案并不一定是唯一的,特点是由于没有类别已知的训练样本,在没有其他额外信息的情况下,采用不同的方法和不同的假定可能会导致不同的结果。处理非监督模式识别问题的一般步骤:·分析问题:深入研究应用领域的问题,分析研究目标能否通过寻找适当的聚类来达到;如果可能,猜测可能的或希望的类别数目;分析给定数据或者可以观测的数据中哪些因素可能与聚类有关。·原始特征获取:设计实验,得到待分析的样本,对样本实施观测和预处理,获取可能与样本聚类有关的观测向量(原始特征)。·特征提取与选择:为了更好地进行聚类,可能需要采用一定的算法对特征进行再次提取和选择。·聚类分析:选定一定的非监督模式识别方法,用样本进行聚类分析。·结果解释:考察聚类结果的性能,分析所得聚类与研究目标之间的关系,根据领域知识分析结果的合理性,对聚类的含义给出解释;如果有新样本,把聚类结果用于新样本分类。

2、简述最大似然函数的假设条件和基本思想

假设条件:①参数是确定的未知量,(不是随机量)②各类样本集  中的样本都是从密度为 的总体中独立抽取出来的,(独立同分布,)③ 具有某种确定的函数形式,只其参数  未知④各类样本只包含本类分布的信息其中,参数  通常是向量,比如一维正态分布 ,未知参数可能是 ,此时 可写成  或。基本思想:如果在参数下 最大,则 应是“最可能”的参数值,它是样本集的函数,记作 。称作最大似然估计量。为了便于分析,还可以定义对数似然函数。

3、简述求贝叶斯估计的方法(平方误差损失下)

(1)确定 的先验分布 (2)求样本集的联合分布 (3)求 的后验概率分布 (4)求 的贝叶斯估计量 

4、简述概率密度估计的非参数方法

①直方图方法   非参数概率密度估计的最简单方法(1)把 的每个分量分成 个等间隔小窗,(若 ,则形成 个小舱)(2)统计落入各个小舱内的样本数(3)相应小舱的概率密度为(:样本总数,:小舱体积)②  -近邻估计   通过控制小区域内的样本数 来确定小区域大小。③窗法  (1)超立方体窗(方窗)(2)正态窗(高斯窗)(3)超球窗

5、简述Fisher准则函数

把线性分类器的设计分为两步:一是确定最优的方向,二是在这个方向,上确定分类阈值。两类的线性判别问题可以看做是把所有样本都投影到一一个方向上,然后在这个一维空间中确定一个分类的阈值。过这个阈值点且与投影方向垂直的超平面就是两类的分类面。思想:选择投影方向,使投影后两类相隔尽可能远,而同时每一-类内部的样本又尽可能聚集。Flsher判别函数最优解本身只是给出了-一个投影方向,并没有给出我们所要的分类面。要得到分类面,需要在投影后的方向(一维空间)上确定一个分类阈值,并采取决策规则当样本是正态分布且两类协方差矩阵相同时,最优贝叶斯分类器是线性函数当样本为正态分布且两类协方差相同的情况下,如果把算数平均作为均值的估计,把样本协方差矩阵当做是真实协方差矩阵的估计,则Fisher线性判别所得的方向实际就是最优贝叶斯决策的方向。

6、简述固定增量法

(1)初值 任意(2)对样本,若,则 (3)对所有样本重复,直至 

7、简述特征的评价准则

①基于类内类间距离的可分性判据   特点:   直观,易于实现(用样本计算),较常用。   不能确切表明各类分布重叠情况,与错误率无直接联系。   当各类协差相差不大时,用此种判据较好。②基于概率分布的可分性判据   考查两类分布密度之间的交叠程度   考查联合分布密度    如 与  独立,,即    则 不能提供对分类 的信息   因此可定义 与  之间关系的一个函数作为判据:称作概率相关性判据。③基于熵的可分性判据  熵:事件不确定性的度量。A事件的不确定性大(熵大),则对A事件的观察所提供的信息量大。  思路:把各类  看作一系列事件        把后验概率  看作特征 上出现  的概率        如从 能确定 ,则对  的观察不提供信息量,熵为 。——特征 有利于分类。        如从 完全不能确定 ,则对 的观察信息量大,熵大。——特征 无助于分类。④用统计检验作为可分性判据  选择在两类间有显著差异的特征。   基本做法:   把两类样本混合在一起,按所考查的特征从小到大排序;   如果一类样本排序序号之和(秩和)显著地比另一类样本小(或大),则两类样本在所考查的特征上有显著差异。

8、简述分支定界算法

从顶向下,有回溯应用条件:准则函数有单调性基本思想:按照一定的顺序将所有可能的组合排成一棵树,沿树进行搜索,避免一些不必要的计算,使找到最优解的机会最早。特点:①最优搜索算法,所有可能的组合都被考虑到       ②前提:准则函数单调性(注:实际中可能不满足,因是估计值)       ③节约计算与存储       ④  时最经济算法要点:根结点为第0级,包含全体特征          每个结点上舍弃一个特征,各个叶结点代表选择的各种组合          避免在整个树中出现相同组合的树枝和叶结点          记录当前搜索到的叶结点的最大准则函数值(界限B),初值置0          每级中将最不可能被舍弃(即舍弃后值最小)的特征放在最左侧          从右侧开始搜索         从左侧同级中将舍弃的特征不在本结点以下各级中舍弃          搜索到叶结点后,更新B值,然后回溯到上一分支处         如果结点上,则不向下搜索,向上回溯          每次回溯将已舍弃的特征放回(放回待舍弃之列)          如已回溯到顶(根)而不能再向下搜索,则的叶结点即为解。

四、计算题

哈工大2023人工智能期末考试复习

选择,填空,判断(可选)主要是各章的基础知识,比如:

建议大家复习的时候好好看一下老师发的PPT。

大题部分,根据对于19年的习题推测,范围应该是下面的几个,但是只是博主估计,自己复习的时候,尽量全面一点儿:

知识的表示(一阶谓词逻辑,产生式系统。。。)归结原理课上讲的几种搜索策略。α-β剪枝贝叶斯网络,决策网络计算,这个我前面博客有讲。三种采样:优先采样,拒取式采样,似然采样。机器学习部分应该是不考的,有余力的同学可以看一下。

老师不让分享考试题,所以2019年的考试题链接失效了。由于博主时间精力有限,有些私信和评论也没有回复。总之,大家把老师的PPT看好,把书上课后习题做好,考试应该问题不大。祝大家20号的时候考试顺利。

下面是课件,有需要的自取链接:https://pan.baidu.com/s/1Q5pL-6COu3qkTmkd_RvHSg提取码:y864

人工智能期末试题

1.:【单选题】下面关于八皇后问题说法错误的是A.初始状态为空的棋盘B.目标状态为棋盘上摆了八个皇后,并且任意两个皇后都不能互相攻击。目标状态不确定,但是当前状态是否为目标状态是可以检测的C.搜D.一行可以同时摆放两个皇后答案:D

2:【单选题】下面关于搜索过程描述错误的是A.对CLOSED表上的节点进行排序的准则,以便选出一个“最好”的节点作为扩展使用B.对OPEN表上的节点进行排序的准则,以便选出一个“答案:对CLOSED表上的节点进行排序的准则,以便选出一个“最好”的节点作为扩展使用

3:【其他】下面关于博弈论的叙述中,不正确的是:A、博弈论是研究下棋的理论B、博弈论研究如何赢得竞争C、博下面关于博弈论的叙述中,不正确的是:A、博弈论是研究下棋的理论B、博弈论研究如何赢得竞争C:正确答案:A,B,D

4:【单选题】以下关于博弈理论说法错误的是A.具有竞争或对抗性质的行为称为博弈行为B.博弈论研究博弈行为斗争各方是否存在着最合理的行为方案C.博弈双方均力图选取对自己最为合理的方案D.博弈:博弈双方均力图选取对自己最为不利的方案

:【单选题】以下关于博弈问题描述错误的是A.博弈问题可以用与/或表示的状态空间图描述B.多对多关系就是博弈树C.一对多关系就是博弈树D.多对多关系就是博弈图:多对多关系就是博弈树

:【单选题】以下关于说法错误的是A.极小化极大过程中节点数会随着搜索深度的增加呈指数增长B.剪枝就是在搜索深度不变的情况下,利用已有的搜索信息增加生成的节点数C.α剪枝:如果一个MIN节点的:剪枝就是在搜索深度不变的情况下,利用已有的搜索信息增加生成的节点数

:【单选题】关于鲁滨逊归结原理叙述错误的是A.谓词公式不可满足的充要条件是其子句集不可满足B.空子句是不可满足的C.若子句集S包含空子句,则子句集S不可满足D.若子句集S不包含空子句,则:若子句集S不包含空子句,则称子句集S是可满足的

:【单选题】下面关于概率分配函数说法错误的是A.概率分配函数的值大于等于0小于等于1B.空集的概率分配函数值为0C.样本空间的概率分配函数值为0D.所有子集的概率分配函数值和为1:样本空间的概率分配函数值为0

:【单选题】以下关于模糊集合的运算说法错误的是A.A包含B,表示元素对A的隶属度大于等于对B的隶属度B.A交B的隶属度等于对应元素隶属度的大者C.A并B的隶属度等于对应元素隶属度的大者D.:A交B的隶属度等于对应元素隶属度的大者

:【单选题】以下不是常用的模糊推理模式的是A.模糊假言推理B.模糊拒取式推理C.模糊因果推理D.模糊三段论推理:模糊因果推理

:【单选题】以下哪一项不属于专家系统知识库的建立环节A.知识抽取B.知识转换C.知识排序D.知识输入:知识排序

:【多选题】下列属于人工智能的知识表示方法的有A.逻辑表示法B.状态空间表示法C.产生式表示法D.本体表示法:逻辑表示法;状态空间表示法;产生式表示法;本体表示法

:【其他】请写出用状态空间表示法表示问题的一般步骤。请写出用状态空间表示法表示问题的一般步骤。请帮忙给出正确答案和分析,谢谢!:正确答案:用状态空间方法表示问题时的步骤如下:(1)定义状态的描述形式。(2)用所定义的状态描述形式把问题的所有可能的状态都表示出来并确定问题的初始状态集合描述和目标状态集合描述。(3)定义一组算符。使得利用这组算符可把问题由一种状态转变为另一种状态。用状态空间方法表示问题时的步骤如下:(1)定义状态的描述形式。(2)用所定义的状态描述形式把问题的所有可能的状态都表示出来,并确定问题的初始状态集合描述和目标状态集合描述。(3)定义一组算符。使得利用这组算符可把问题由一种状态转变为另一种状态。

:【多选题】状态空间表示法用()和()来表示问题A.状态B.向量C.算符D.路径:状态;算符

:【多选题】一个好的生成器应该是A.完备的B.知情的C.动态的D.非冗余的:完备的;知情的;非冗余的

:【多选题】以下情况首选广度优先搜索的有A.分支因子不是太大B.问题的解出现在相对较浅的水平C.没有一条路径是特别深的D.问题的解出现在树的深处:分支因子不是太大;问题的解出现在相对较浅的水平;没有一条路径是特别深的

:【多选题】搜索技术章节介绍的搜索算法有A.广度优先搜索B.深度优先搜索C.迭代加深的广度优先搜索D.迭代加深的深度优先搜索:广度优先搜索;深度优先搜索;迭代加深的深度优先搜索

:【单选题】下面关于爬山法的说法中错误的是:A.爬山法是一种贪心算法。B.爬山法是一种局部择优的方法。C.爬山法需要保存未选择路径的记录。D.爬山法没有能力从错误中或错误路径中恢复。:爬山法需要保存未选择路径的记录。

:【多选题】下面关于爬山法叙述正确的是A.随机选择一个登山的起点B.每次拿相邻点与当前点进行比对,取两者中较优者,作为爬坡的下一步C.重复直至该点的邻近点中不再有比其大的点D.选择最大点:随机选择一个登山的起点;每次拿相邻点与当前点进行比对,取两者中较优者,作为爬坡的下一步;重复直至该点的邻近点中不再有比其大的点;选择最大点作为本次爬山的顶点,即为该算法获得的最优解

:【单选题】下面不是动态规划算法特点的是()A.自底向上计算B.最优子结构C.从大到小计算D.重叠子问题:从大到小计算

:【多选题】动态规划算法的特点包括A.使用最优化原理B.完备搜索C.无后效性D.有重叠子问题:使用最优化原理;无后效性;有重叠子问题

:【多选题】搜索算法的评价指标包括A.完备性B.最优性C.可接受性D.单调性:完备性;最优性;可接受性;单调性

:【多选题】常用的连接词有A.析取B.合取C.否定D.蕴含:析取;合取;否定;蕴含

:【多选题】推理过程中常用的等价性包括A.交换律B.分配律C.结合律D.德摩根律:交换律;分配律;结合律;德摩根律

:【单选题】下列不属于正向推理需要解决的问题是A.确定匹配的方法B.按什么策略搜索知识库C.冲突消解策略D.确定推理的逻辑:确定推理的逻辑

:【多选题】一个良好的规则库应该具有以下哪些特性A.知识完整B.知识一致C.表达灵活D.组织合理:知识完整;知识一致;表达灵活;组织合理

:【多选题】模糊集可用的描述方式有A.函数表示法B.图示表示法C.向量表示法D.扎德表示法:函数表示法;图示表示法;向量表示法;扎德表示法

:【单选题】专家系统中知识库知识获取的来源是()A.开发者B.用户C.专家D.管理员:专家

:【多选题】专家系统中的知识包括A.数据级知识B.知识库级知识C.控制级知识D.应用级知识:数据级知识;知识库级知识;控制级知识

:【多选题】专家系统包括A.知识库B.机械臂C.推理机D.综合数据库:知识库;推理机;综合数据库

:【多选题】以下哪些情况适合开发为专家系统A.问题可以通过符号操作和符号结构进行求解B.问题需要使用启发式知识、经验规则才能得到答案C.问题相对较为复杂D.问题有一定的实用价值:问题可以通过符号操作和符号结构进行求解;问题需要使用启发式知识、经验规则才能得到答案;问题相对较为复杂;问题有一定的实用价值

:【判断题】如果所求序列可以使得总代价最低,则问题称为最优搜索问题。A.正确B.错误:正确

:【判断题】迭代加深的深度优先搜索结合了广度优先和深度优先搜索两者的优点A.正确B.错误:正确

:【判断题】分支定界法按照非递减代价制订搜索路径A.正确B.错误:正确

:【单选题】囚徒困境中的均衡解是:A.甲乙都不招供B.甲乙都招供C.一方招供D.不存在均衡解:甲乙都招供

:【判断题】囚徒困境中的均衡状况是两个囚徒都选择合作A.正确B.错误:错误

:【判断题】博弈树全评估过程中会遇到组合爆炸A.正确B.错误:正确

:【判断题】负极大值评估法中父节点的值是各个子节点的负数的极小值A.正确B.错误:错误

:【判断题】用关系数据库表示的知识也可以用谓词表示A.对B.错:对

:【判断题】归结反演过程中归结不出空子句就认为结论不成立A.对B.错:错

:【判断题】运用删除策略可以缩小寻找范围,减少比较次数,提高效率A.对B.错:对

:【判断题】当组合证据时多个单一证据的析取时,其可信度为单一证据的最小值A.对B.错:错

:【判断题】带有阈值限度的不确定性推理中结论的可信度等于知识的可信度乘以证据的可信度A.正确B.错误:正确

:【判断题】A的似然函数等价于对A为假的信任程度A.对B.错:对

:【判断题】集合与特征函数具有一一对应的关系A.对B.错:对

:【判断题】模糊矩阵是关于主对角线对称的对称矩阵A.对B.错:错

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇