博舍

产生式系统的基本概念 人工智能什么是产生式技术的基础和核心

产生式系统的基本概念

(1)正向推理 -优点:算法简单,容易实现。-缺点:盲目搜索,可能会求解许多与总目标无关的子目标,每当工作存储器内容更新后都要遍历整个规则库,推理效率低-主要用于已知初始数据,而无法提供推理目标,或解空间很大的一类问题。

从已知事实出发,通过规则库求得结论,也称为自底向上(bottom-up)或数据驱动方式。以问题的初始状态作为初始数据库,仅当数据库中的事实满足某条规则的前提时,该规则才能被使用。从一组事实出发,使用一组规则,来证明目标的成立。例子,已知事实A,规则库中有规则A->B,B->C,C->D 则正向推理过程表示为A->B->C->D.

(2)反向推理-优点:搜索的目的性强,推理效率高。-缺点:目标的选择具有盲目性,可能会求解许多为假的目标,当目标空间很大时,推理效率不高。-主要用于结论单一或用于已知目标结论,而要求证实的系统。
从目标出发,反向使用规则,求得已知事实,也称自顶向下(top-down)推理方式,或称为目标驱动方式。基本原理:从表示目标的谓词或命题出发,使用一组规则证明事实谓词或命题是成立的,即使用一批假设(目标),然后逐一验证这些假设。先假设一个可能的目标,系统试图证明它。看此假设是否在数据存储器中存在。

(3)双向推理既自顶向下(top-down)又自底向上(bottom-up),直到达到某一个中间环节两个方向的结果相符便成功结束的推理方法。-优点:推理网络较小,效率也较高。

《人工智能》之《知识表示方法》

教材:《人工智能及其应用》,蔡自兴等,2016m清华大学出版社(第5版)

参考书:

《人工智能》之《知识表示方法》1状态空间法(StateSpaceRepresentation)1.1问题状态描述1.2状态图示法1.3示例:修道士(Missionaries)和野人(Cannibals)问题2问题归约法(ProblemReductionRepresentation)2.1问题归约描述2.2示例:梵塔难题(TowerofHanoiPuzzle)2.3与或图表示2.4问题归约的描述3谓词逻辑法(PredicateLogicMethod)3.1一阶谓词逻辑表示的逻辑学基础3.2谓词演算(predicatecaculus)3.3谓词公式3.4谓词逻辑表示方法3.5置换与合一置换(Substitution)合一(Unification)置换与合一的作用3.6谓词逻辑法的优缺点主要优点主要缺点4语义网络法(SemanticNetworkMethod)4.1一元语义网络的表示4.2二元语义网络的表示4.3多元语义网络的表示4.4命题运算4.5概念节点与实例节点4.6语义网络的推理过程继承匹配4.7语义网络法的优缺点主要优点主要缺点:5框架表示(Frame)5.1框架的构成5.2框架的推理5.3框架表示法的优缺点6本体技术6.1背景知识6.2本体(Ontology)6.3本体建模方法7知识图谱8小结

知识是一个抽象的术语,用于尝试描述人对某种特定对象的理解。

知识的定义

知识的一般概念:知识是人们在改造客观世界的实践中积累起来的认识和经验。

知识的代表性定义:

知识是经过裁剪、塑造、解释、选择和转换的信息(Feigenbaum);知识由特定领域的描述、关系和过程组成(Bernstein);知识=事实+信念+启发式(HeyesRoth)。

知识、信息、数据的关系:知识的类型

按知识的性质:概念、命题、公理、定理、规则和方法。

按知识的作用域:

常识性知识:通用通识的知识,人们普遍知道的、适用于所有领域的知识;领域性知识:面向某个具体专业领域的知识。

按知识的作用效果:

事实性知识:用于描述事物的概念、定义、属性等,或用于描述问题的状态、环境、条件等的知识;过程性知识:用于问题求解过程的操作、演算和行为的知识,或指出如何使用那些与问题有关的事实性知识的知识;控制性知识:(元知识或超知识)。是关于如何使用过程性知识的知识。例如:推理策略、搜索策略、不确定性的传播策略。

按知识的确定性:

确定性知识:可说明其真值为真或为假的知识;不确定性知识:包括不精确、模糊、不完备知识。1.不精确:知识本身有真假,但由于认识水平限制却不能肯定其真假;表示:用可信度、概率等描述2.模糊:知识本身的边界就是不清楚的。例如:大,小等;表示:用可能性、隶属度来描述3.不完备:解决问题时不具备解决该问题的全部知识。例如:医生看病。

知识表示

对知识的一种描述;一种计算机可以接受的用于描述知识的数据结构;表示方法不唯一;是人工智能的核心。

知识表示的要求

表示能力:能否正确、有效地表示问题。包括:表达范围的广泛性领域知识表示的高效性对非确定性知识表示的支持程度可利用性:可利用这些知识进行有效推理。包括:对推理的适应性:推理是根据已知事实利用知识导出结果的过程对高效算法的支持程度:知识表示要有较高的处理效率可实现性:要便于计算机直接对其进行处理可组织性:可以按某种方式把知识组织成某种知识结构可维护性:便于对知识的增、删、改等操作自然性:符合人们的日常习惯

知识表示存在的问题

人是如何表示知识,存储知识的仍然是个迷;目前用计算机来进行知识处理面临三大难题:1.“Clear-Cut”问题:主要处理可形式化的边界清晰问题;2.知识获取瓶颈:很难把现实中的知识转化为计算机可理解的知识;3.知识窄台阶:多为专家系统知识,缺乏常识性知识。

如何让机器理解下面的故事?主人让小马托着两袋盐巴过河,他不小心把一部分浸到了河里。于是盐巴融化在河里一部分,盐袋子也变轻了。小马很开心,得意洋洋地回家了。第二次,主人又给小马托起棉花过河。小马想起来上次,故意把棉花都浸到了河里。结果,小马沉得要死,死扛着回家了。

如何让机器理解如此场景?

我们不是音频分析的手段来实现对贝多芬音乐的欣赏,也不是用视频分析的手段来实现对梵高油画的欣赏”(杨雄里院士)。这其中蕴含深刻的整合过程,因此必然涉及大量的背景知识和感知经验。

人的概念系统

人的概念系统是非任务特定性的,具有很强的通用性。正是这种不局限于特定目标的特性,使人可以处理各种各样问题(通用人工智能的目标);Nisson认为“人工智能最重要的部分就是发现一个适用的概念化知识结构。”(建立一套基于统一认知理论的计算模型,即基于单一结构上多个程序的认知模型)。

1状态空间法(StateSpaceRepresentation)

许多问题的求解方法是试探搜索方法。这些方法是通过在某个可能的解空间内寻找一个解来求解问题的。这种基于解答空间的问题表示和求解方法就是状态空间法,它是以状态和算符为基础来表示和求解问题的。

状态(state):表示问题解法中每一步问题状况的数据结构;算符(operator):把问题从一种状态变换为另一种状态的手段(或操作)。

1.1问题状态描述

定义:

状态(State):描述某类不同事物间的差别而引入的一组最少变量q0,q1,…,qn的有序集合,即(n+1)维向量。算符(Operate):使问题从一种状态变化为另一种状态的手段,也称操作符。状态空间(StateSpace):是一个表示该问题全部可能状态及其关系的图,它包含三种说明的集合,即所有可能的问题初始状态集合S、操作符集合F以及目标状态集合G,即三元状态(S,F,G)。

要完成某个问题的状态描述,必须:

该状态描述方式,特别是初始状态描述;操作符集合及其对状态描述的作用;目标状态描述的特性。

1.2状态图示法

有关图的知识:《软件技术基础》之《图》

图的显示说明:对于显式说明,各节点及其具有代价的弧线由一张表明确给出。此表可能列出该图中的每一节点、它的后继节点以及连接弧线的代价(相关知识:D是邻接矩阵,如何求i,j的最短距离?)

图的隐示说明:已知起始节点{si}和后继节点算符Γ。后继节点算符能作用于任一节点以产生该节点的

全部后继节点各连接弧线的代价(例如:棋局)

寻找一种状态到另一种状态的算符序列等价于寻找图上的最短路径问题。

表示方法的多样性:如3数码难题中

规则1:移动数码(3X4条规则)规则2:移动空格(4条规则)

应该选择小而简单的状态空间。

1.3示例:修道士(Missionaries)和野人(Cannibals)问题

问题描述

设在河的一岸有三个野人、三个修道士和一条船,修道士想用这条船把所有的人运到河对岸,但受以下条件的约束:

修道士和野人都会划船,每次船上至多可载两个人;在河的任一岸,如野人数超过修道士数,修道士会被野人吃掉。

如果野人会服从任何一次过河安排,请规划一个确保修道士和野人都能过河,且没有修道士被野人吃掉的安全过河计划。

状态表示

用一个三元组来表示状态:S=(m,c,b)

集合说明m左岸的修道士人数(missionary)c左岸的野人数(cannibal)b左岸的船数(bank)

右岸的状态可由下式确定:

状态式右岸修道士数m’=3-m右岸野人数c’=3-c右岸船数b’=1-b

该表示方式下,m,c都可取0、1、2、3,b可取0和1,共有4×4×2=32种状态,如下所示:操作集

状态空间

给出状态和操作的描述之后,该问题的状态空间是:状态空间图

2问题归约法(ProblemReductionRepresentation)

问题归约法是另一种基于状态空间的问题描述与求解方法。已知问题的描述,通过一系列变换把此问题最终变为一个本原问题集合;这些本原问题的解可以直接得到,从而解决了初始问题。

2.1问题归约描述

问题归约法由3部分组成:

一个初始问题描述;一套把问题变换为子问题的操作符;一套本原问题描述。

问题归约法的实质:从目标(要解决的问题)出发逆向推理,建立子问题以及子问题的子问题,直至最后把初始问题规约为一个平凡的本原问题集合。

归约方式

分解等价变换2.2示例:梵塔难题(TowerofHanoiPuzzle)

问题描述

有3个柱子(1,2,3)和3个不同尺寸的圆盘(A,B,C)。在每个圆盘的中心有个孔,所以圆盘可以堆叠在柱子上。最初,全部3个圆盘都堆在柱子1上:最大的圆盘C在底部,最小的圆盘A在顶部。要求把所有圆盘都移到柱子3上,每次只许移动一个,而且只能先搬动柱子顶部的圆盘,还不许把尺寸较大的圆盘堆放在尺寸较小的圆盘上。

归约过程

移动圆盘A和B至柱子2的双圆盘难题;移动圆盘C至柱子3的单圆盘难题;移动圆盘A和B至柱子3的双圆盘难题。

由上可以看出简化了难题每一个都比原始难题容易,所以问题都会变成易解的本原问题。归约描述

问题归约方法是应用算符来把问题描述变换为子问题描述。

可以用状态空间表示的三元组合(S、F、G)来规定与描述问题;对于梵塔问题,子问题[(111)→(122)],[(122)→(322)]以及[(322)→(333)]规定了最后解答路径将要通过的脚踏石状态(122)和(322)。

问题归约方法可以应用状态、算符和目标这些表示法来描述问题,这并不意味着问题归约法和状态空间法是一样的。

梵塔问题归约图

2.3与或图表示

与图、或图、与或图

我们用一个似图结构来表示把问题归约为后继问题的替换集合,这一似图结构叫做问题归约图,也叫与或图。相关概念

父节点、子(后继)节点、弧线终叶节点:对应于原问题的本原节点。或节点:只要解决某个问题就可解决其父辈问题的节点集合,如(M,N,H)。与节点:只有解决所有子问题,才能解决其父辈问题的节点集合,如(B,C)和(D,E,F)各个结点之间用一端小圆弧连接标记。与或图:由与节点及或节点组成的结构图。

右图是增加附加结点后的规范化与或图。

可解结点

终叶节点是可解节点(因为它们与本原问题相关连)。如果某个非终叶节点含有或后继节点,那么只要当其后继节点至少有一个是可解的时,此非终叶节点才是可解的。如果某个非终叶节点含有与后继节点,那么只有当其后继节点全部为可解时,此非终叶节点才是可解的。

不可解结点

没有后裔的非终叶节点为不可解节点。全部后裔为不可解的非终叶节点且含有或后继节点,此非终叶节点才是不可解的。后裔至少有一个为不可解的非终叶节点且含有与后继节点,此非终叶节点才是不可解的。

解树由可解节点构成,并且由这些可解节点可以推出初始节点(它对应着原始问题)为可解节点的子树为解树。在解树中一定包含初始节点。

问题归约求解过程即生成解树,即证明原始节点是可解节点的过程。

2.4问题归约的描述

问题归约方法应用算符把问题描述转化为子问题描述,可以采用各种数据结构:表列、树、字符串、矢量、数组等;

例如梵塔问题的表示:包含两个数列的表列:[(111),(333)]

可以把问题归约法看成比状态空间法更通用的问题求解方法;其核心实现是不断简化问题(即缩小子问题的状态空间),直至问题成为本原问题(已知问题、易解问题)。

3谓词逻辑法(PredicateLogicMethod)3.1一阶谓词逻辑表示的逻辑学基础

断言(assertion):一个陈述句称为一个断言。

命题(proposition):具有真假意义的断言。

命题的真值:

T:命题的意义为真F:命题的意义为假

命题真值的说明:

一个命题不能同时既为真又为假一个命题可在一定条件下为真,而在另一条件下为假

论域(domainofdiscourse):由所讨论对象的全体构成的集合。亦称为个体域(individualdomain)。

个体(individual):论域中的元素。

谓词(predicate):在谓词逻辑中命题是用形如P(x1,x2,…,xn)的谓词来表示的。

谓词名:命题谓语,表示个体的性质、状态、个体之间的关系个体:命题主语,表示独立存在的事物或概念

函数(function):

逻辑语句:一种形式语言,能把逻辑论证符号化,用于证明定理,求解问题。

形式语言(FormalLanguage):严格地按照相关领域的特定规则,以数学符号(符号串)形式描述该领域有关客体的表达式。

3.2谓词演算(predicatecaculus)

原子公式(atomicformula):由谓词符号和若干项组成的谓词演算。原子公式是谓词演算基本积木块。

项包括常量符号、变量符号、函数符号等。

定义原子公式为真值或假值就表示了某种语义(semantics)。

若t1,t2,…,tn是项,P是谓词,则称P(t1,t2,…,tn)为原子谓词公式(原子公式)。

无变量的原子公式取值确定,包含变量的原子公式取值不定。

例如:“机器人(ROBOT)在1号房间(room1)内”INROOM(ROBOT,room1)为真INROOM(ROBOT,room2)为假

连词(Connective)

与、合取(conjunction):用连词∧把几个公式连接起来而构成的公式。合取项是合取式的每个组成部分。例:LIKE(I,MUSIC)∧LIKE(I,PAINTING)(我喜爱音乐和绘画。)或、析取(disjunction):用连词∨把几个公式连接起来而构成的公式。析取项是析取式的每个组成部例:PLAYS(LILI,BASKETBALL)∨PLAYS(LILI,FOOTBALL)(李力打篮球或踢足球。)蕴涵(Implication):“→”表示“如果—那么”(IF—THEN)关系,其所构成的公式叫做蕴涵。非(Not):表示否定,¬、~均可表示

量词(Quantifier)辖域(scope):指位于量词后面的单个谓词或用括弧括起来的合式公式。

约束变元(boundvariable):辖域内与量词中同名的变元。

自由变元(freevariable):不受约束的变元。

变元的换名

对约束变元,须把同名的约束变元都统一换成另外一个相同的名字,且不能与辖域内的自由变元同名。

对辖域内的自由变元,不能改成与约束变元相同的名字。

3.3谓词公式

原子公式:P(x1,x2,…,xn)一个n元谓词公式,为谓词演算的原子公式,或原子谓词公式。其中,P是n元谓词;x1,x2,…,xn是客体变量或变元。

文字(literal):一个原子公式,和原子公式的否定。

子句(clause):文字的析取(V)构成的公式。

**合成公式(WFF,well-formedformula)**的递归定义:示例:试把下列命题表示为谓词公式:任何整数,或者为正数或者为负数。用I(z)表示“z是整数”,P(z)表示“z是正数”,N(z)表示“z是负数”。给定命题用下列谓词公式来表示:合成公式的真值表

等价(Equivalence)如果两个合式公式,无论如何解释,其真值表都是相同的,那么我们就称此两合式公式是等价的。

注意:(10)说明在一个量化的表达式中的约束变量是一类虚元,它可用任何一个不在表达式中出现过的其他变量符号来代替

3.4谓词逻辑表示方法

表示步骤:

确定个体域;根据要表示的知识定义谓词;用连词、量词把这些谓词连接起来。

3.5置换与合一

谓词逻辑的推理:将推理规则应用于一定的合式公式(集),以产生新的合式公式。谓词公式的等价性和永真蕴含性

置换(Substitution)表达式中用置换项置换变量,如用项A替换函数表达式中的变量(x)表达式E(Expression)用一个置换s(Substitution)而得到的表达式的置换,记为EsE(s1s2)=(Es1)s2

置换合成

合一(Unification)是人工智能中很重要的一个过程;寻找项对变量的置换,以使多个表达式一致的操作。如果一个置换s作用于表达式集{Ei}的每个元素,则我们用{Ei}s来表示置换例的集。如存在置换s使得表达式集{Ei}置换后有:E1S=E2S=E3S=…,则称表达式集{Ei}是可合一的,s称为{Ei}的合一者(unifier)。

还有其他的合一者,最简单的合一者为:g={B/y}。

最通用的合一者:如对表达式集{Ei}的任一合一者s,都存在某一s’,使得{Ei}s={Ei}gs’,则称g为{Ei}的最通用合一者(mostgeneralunifier,i.e.mgu)

置换与合一的作用

谓词逻辑推理的基本方法,就是寻找简单有效置换合一,采用消解原理利用消解反演方法求解问题,详见第三章。

3.6谓词逻辑法的优缺点主要优点自然:一阶谓词逻辑是一种接近于自然语言的形式语言系统,谓词逻辑表示法接近于人们对问题的直观理解;明确:有一种标准的知识解释方法,可表示的知识明确、易于理解;精确:谓词逻辑的真值只有“真”与“假”,其表示、推理都是精确的;灵活:知识和处理知识的程序是分开的,无须考虑处理知识的细节;模块化:知识之间相对独立,这种模块性使得添加、删除、修改知识比较容易进行。主要缺点知识表示能力有限:只能表示确定性知识,而不能表示非确定性知识、过程性知识和启发式知识(与精确相对);存在组合爆炸:由于难以表示启发式知识,因此只能盲目地使用推理规则,这样当系统知识量较大时,容易发生组合爆炸;语义表达能力低:它把推理演算与知识含义截然分开,抛弃了表达内容中所含有的语义信息,往往使推理过程冗长(与灵活相对)。4语义网络法(SemanticNetworkMethod)

1968年,奎廉(J.R.Quillian)在研究人类联想记忆时,受到以下两点的启发:

人脑记忆的一个重要特征是人脑中不同信息片段之间的高度连接;高度相关的概念能够比不太相关的概念更快地回忆起来。提出一种心理学模型,即语义网络,认为记忆是由概念间的联系实现的,把它用作知识表示。

1972年,西蒙在自然语言理解系统中也采用了语义网络表示法。

语义网络是一个通过语义关系连接的概念网络。语义网络其实是一种有向图表示的知识系统。节点代表的是概念,而边则表示这些概念之间的语义关系。语义网络中最基本的语义单元称为语义基元,可以用三元组形式表示:。

4.1一元语义网络的表示

属性关系:指事物和其属性之间的关系。

常用的属性关系有:

Have:含义为“有”,表示一个节点具有另一个节点所描述的属性;

Can:含义为“能”、“会”,表示一个节点能做另一个节点的事情;

Age:含义为“年龄”,表示一个节点是另一个节点在年龄方面的属性。

4.2二元语义网络的表示

上述关系的主要特征:属性继承性,处在具体层的节点可以继承抽象层节点的所有属性。

示例1:用语义网络表示:动物能运动、会吃。鸟是一种动物,鸟有翅膀、会飞。鱼是一种动物,鱼生活在水中、会游泳。示例2:用语义网络表示:王强是百度公司的经理;百度公司在中关村;王强28岁。

4.3多元语义网络的表示

示例1:小燕是一只燕子,燕子是一种鸟,鸟有翅膀;巢-1是小燕的巢,巢-1是巢中的一个。存在的问题:上述的语义网络为二元关系,无法表示复杂事实,如:小燕从春天到秋天占有巢-1。如果采用谓词逻辑表示为一个四元谓词演算:Owns(XIAOYAN,NET-1,SPRING,FALL)

解决办法:通过星形连接的方式,把多个变元联系起来。

表示方法:增加情况、动作节点。

示例2:用语义网络表示:“小燕子这只燕子从春天到秋天占有一个巢”。示例3:用语义网络表示:“JohngaveMarythebook.”

如果用谓词逻辑法:GAVE(JOHN,MARY,BOOK)

多元语义网络表示的实质:把多元关系转化为一组两两之间的二元关系的组合,或二元关系的合取。通过星形连接的方式,把多个变元联系起来。

4.4命题运算

与运算示例:或运算示例:非运算示例:

4.5概念节点与实例节点

自己的理解:如果语义网络只用来表示一个特定的物体或概念,那么当有更多的实例时就需要更多的语义网络,这样就使问题复杂化。我们可以找到一个通用的概念,称为概念节点;而把一个更加具体的点作为这个概念的实例,称为实例节点。例如:把汽车作为概念节点,我的汽车、张三的汽车作为汽车的一个实例节点。

4.6语义网络的推理过程

值节点(valuenode):在链的尾部的节点。

节点的槽(slot):链的别称。

示例:BRICK12有3个链(2个槽):COLOR槽只有一个值,填入RED;ISA槽有两个值,填入了BRICK和TOY。

继承

在语义网络中,继承是把对事物的描述从概念节点或类节点传递到实例节点。

示例:

概念节点BRICK的SHAPE槽,有值节点RECTANGULAR(矩形),属性RECTANGULAR可通过ISA链传递给实例节点BRICK12,实例节点BRICK12无SHAPE槽,可从语义网络推理出BRICK12的SHAPE的外形为RECTANGULAR(矩形)。

一共有三种继承过程:值继承、“如果需要”继承、“缺省”继承。

值继承:ISA(Isa)链与AKO(AKindOf)链,常用知识传递方法;放入值侧面中。“如果需要”(If-needed)继承:有时对不知道的槽值,可计算得到,通过此计算程序得到知识的模式称为if-needed链,如通过体积、密度在需要时可以计算其质量。If-needed程序放入IF-NEEDED侧面中。“缺省”继承:在对事务所作假设无十分把握时,可加上“可能”字样,这种不肯定的值称为“缺省”值,放入槽的DEFAULT侧面中。匹配

推理步骤:

根据提出的待求解问题,构造一个局部网络或网络片段,其中有的节点、弧标注为空,表示有待求解的问题,称为未知处;根据这个局部网络、网络片段到知识库中寻找可匹配的语义网络,以便求得问题的解答(匹配可近似);问题的局部语义网络与知识库中的某种语义网络片段匹配时,则与未知处相匹配的事实就是问题的解。

已知结构有2个部件:TOY-HOUSE、TOY-HOUSE77

虚节点和虚链:TOY-HOUSE、TOY-HOUSE77之间有ISA链,就知虚节点和虚链。

已知结构有2个部件:BRICK12、楔块WEDGE18

部件匹配:STRUCTURE35、TOY-HOUSE之间有ISA链,就知BRICK12须支撑WEDGE18虚线箭头:BRICK12和WEDGE18间的SUPPORT虚链

4.7语义网络法的优缺点主要优点结构性:显式地表示事物属性、事物间的各种语义联系,是一种结构化的知识表示方法。下层结点可继承、新增、变异上层结点的属性。联想性:因人类联想记忆模型提出,强调事物间的语义联系,体现了人类的联想思维过程。自索引性:明确、简洁的方式表示各接点之间的联系,通过与某一结点连接的弧可很容易的找出与该结点有关的信息,而不必查找整个知识库。有效的避免搜索时的组合爆炸问题。自然性:带标识的有向图可直观表示知识,符合人们表达事物间关系的习惯,且与自然语言语义网络之间的转换也较易实现。主要缺点:非严格性:无谓词的严格形式表示体系,给定语义网络的含义完全依赖于处理程序对它所进行的解释,所实现的推理不能保证其正确性。复杂性:表示知识的手段多种多样,虽对其表示带来了灵活性,同时也因表示形式的不一致,增加了处理的复杂性。5框架表示(Frame)

框架理论(微世界理论):明斯基1975年作为理解视觉、自然语言对话及其它复杂行为的一种基础提出来的,认为人们对现实世界中各种事物的认识都是以一种类似于框架的结构存储在记忆中的,当遇到一个新事物时,就从记忆中找出一个合适的框架,并根据新的情况对其细节加以修改、补充,从而形成对这个新事物的认识。例:对饭店、教室等的认识。

框架:人们认识事物的一种通用的数据结构形式。

实例框架:对于一个框架,当人们把观察、认识到的具体细节填入后,就得到了该框架的一个具体实例,即实例框架。

框架系统:框架是知识的基本单位,把一组有关的框架连结起来便可形成一个框架系统。

框架系统推理:由框架之间的协调来完成。

5.1框架的构成

由描述事务的各个方面的槽组成,每个槽可以拥有若干个侧面,而每个侧面可拥有若干个值。示例:框架的关系:一个框架可为另一个框架的槽值,且一个框架结构可作为几个不同框架的槽值。相同的信息不必重复存储,节约空间。

示例:一个立体视图的框架表示最高层的框架用ISA槽说明是一个立方体,并由region槽指示出它所拥有的3个可见面A,B,E。而A,B,E又分别用3个框架来具体描述。用mustbe槽指示它们必须是一个平行四边形。

框架系统

学生框架研究生框架infer槽:用于指出两个框架所描述事物间的逻辑推理关系,可用来表示相应的产生式规则。

示例:如果咳嗽、发烧且流涕,则八成是患感冒,需服用“感冒清”,一日三次,每次2-3粒,多喝开水。

5.2框架的推理

框架系统的基本推理方法:

特性继承(ISA/AKO链),如:燕子→鸟部分匹配,如:TOY-HOUSE从描述中直接引用,如:Student例子各槽值的相关信息可以指导进行该槽值的描述解答子节点与父节点差异的原因,例如:三条腿的椅子

相似网络推理代表性知识库:FrameNet官网:FrameNet

Howtouse:FrameNet&FrameNetPythonAPI

5.3框架表示法的优缺点

6本体技术6.1背景知识

研究背景2000年12月18日,Berners-Lee在XML2000的会议上正式提出了语义Web。目标是使Web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对WWW上异构、分布信息的有效访问和搜索。Berners-Lee为未来的Web发展提出了语义Web体系结构。

语义网语义网体系结构语义网提供了一套为描述数据而设计的表示语言和工具,用于形式化地描述一个知识领域内的概念、术语和关系。

第一层:Unicode和URI(uniformresourceidentifier,通用资源标识符),是整个语义网的基础。Unicode处理资源的编码,实现网上信息的统一编码;URI负责标识资源,支持网上对象和资源的精细标识。

第二层:XML+NS(NameSpace)+XMLSchema,用于表示数据的内容和结构的可扩展标记语言。通过XML标记语言将网上资源信息的结构、内容和数据的表现形式进行分离。

第三层:RDF+RDFSchema,用于描述网上资源及其类型,为网上资源描述提供一种通用框架和实现数据集成的元数据解决方案。

第四层:OntologyVocabulary,用于描述各种资源之间的联系,揭示资源本身及资源之间更为复杂和丰富的语义联系,明确定义描述属性或类的术语语义及术语间关系。

第五层:逻辑层,主要提供公理和推理规则,为智能推理提供基础。该层用来产生规则。

第六层:证明层,执行逻辑层产生的规则,并结合信任层的应用机制来评判是否能够信赖给定的证明。

第七层:信任层,注重于提供信任机制,以保证用户代理在网上进行个性化服务和彼此间交互合作时更安全可靠。

核心层为XML、RDF、ONTOLOGY,用于表示信息的语义。

XMLXML(eXtensibleMarkupLanguage,可扩展标记语言)是最早的语义网表示语言,它取消了HTML的显示样式和布局描述能力,突出了数据的语义和元素结构描述能力。特性:XML只定义了文档结构和数据类型,没有定义数据的语义,机器仍然无法理解文档的内容。为了让应用程序理解数据的语义,就出现了RDF。

RDFRDF(ResourceDescriptionFramework)是一种资源描述框架,利用当前的多种元数据标准来描述各种网络资源,形成人机可读,并可由机器自动处理的文件。

RDF的核心思想:利用Web标识符(URI)来标识事物,通过指定的属性和相应的值描述资源的性质或资源之间的关系。

示例:RDFSchema示例:RDF(S)的优缺点

优点:

简单:资源以三元组的形式描述,简单、易控制。易扩展:描述和词汇集分开,具备良好的可扩展性。包容性:允许定义自己的词汇集,并可以无缝使用多种词汇集来描述资源。易综合:RDF认为一切都是资源,这样很容易综合描述。

缺点:

不能准确描述语义:同一个概念有多种词汇表示,同一个词汇有多种含义(概念)。

没有推理模型,不具备推理能力。

6.2本体(Ontology)

本体(Ontology)通过对概念的严格定义和概念与概念之间的关系来确定概念的精确含义,表示共同认可的、可共享的知识。

本体的定义本体的组成OWLOWL(WebOntologyLanguage,Web本体语言)是在语义网上表示本体的推荐语言,作为RDF(S)的扩展,其目的是提供更多原语以支持更加丰富的语义表达并支持推理。

OWL是RDF的扩展,提供了更广泛的定义RDFS词汇的功能——可以定义词汇之间的关系,类与类间的关系,属性与属性之间的关系等,从而使得数据的语义定义更加丰富,并且构成一个知识系统并支持推理。

OWL的三个子语言:

OWLLite:提供一个分类层次和简单属性约束。OWLDL:提供推理系统,保证计算完备性和可判定性。OWLFull:支持完全自由的RDF语法,但是不具备可计算性保证。

表达能力:OWLLite

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇