杜华 等丨人工智能时代的知识观审思
0分享至【刊载信息】杜华,顾小清.2022.人工智能时代的知识观审思[J].中国远程教育(10):1-9.【摘要】当下,新兴信息技术引发了深刻的社会变革,也牵引着人类教育向智慧教育阶段转型和演进。基于人工智能技术的具有深度学习能力的智能机器,丰富了知识的载体与形态,重塑了知识生产与传播的方式,加速并可能彻底改变知识生命周期,或将撼动人类的知识主体地位,知识图景已然发生巨变,倒逼教育教学的深刻变革,对知识观的讨论已经迫在眉睫。文章从内涵、类型等方面勾勒智能时代的新知识观图景。知识从确定性真理走向不确定性“碎片”,从硬知识走向“软”知识、“灰”知识和“暗”知识。知识生产模式也面临从人类到人机群智协同的重大转型。知识表征从人类的认知表征转向智能机器的计算表征。基于智能时代新知识观图景的刻画,文章讨论了智能时代的教学、学习与教师该如何转型以应对变革。【关键词】人工智能;知识;知识观;知识载体;知识生产;群智协同一、问题的提出知识作为教育的内容,是教育领域的核心要素之一。美国教育学者索尔蒂斯(J.F.Soltis)指出:“从根本上说,知识与教育的概念是无法分离的,关于知识可能存在的许多问题的回答,对教育者如何思考与行动将有重大影响。”“我们如何思考知识,确实在相当程度上影响着我们如何思考教育。”(索尔蒂斯,1993)。知识与教育之间有着内在的关联。一方面,教育是筛选、传播、分配、积累和发展知识的重要途径;另一方面,知识又是教育的重要内容与载体,离开了知识,教育就会成为无米之炊,各种各样的教育目标也就无法达成(石中英,2001)。知识观是人类知识总体的认识、态度和根本看法(胡友志,2014),是教育实践的根本性和基础性认识问题,是教育变革的起点和关键(陈丽,等,2019)。知识观具有鲜明的时代特色,每个时代的知识观都烙有该时代的印记,在漫长教育发展史上几乎每次重大教育转型也都伴随着知识观的讨论。当下,新兴信息技术引发了深刻的社会变革,也牵引着人类教育向智慧教育阶段转型和演进。基于人工智能技术的具有深度学习能力的智能机器成为知识载体,知识图景发生巨变,以往时代的知识话语似乎在解释力与指导性上已显得力不从心,迫切需要重新检视并建构一种适用于智能时代、关涉技术哲学的知识观。这既是人工智能变革未来教育的起点和关键,也是“人工智能+教育”极为特别且重要的学术议题之一。研究者从不同角度开始关注这一议题,但整体而言研究尚处于起步阶段,很多问题甚至可能需要重新思考与回答。本文尝试分析智能时代知识观变革的动因,勾勒智能时代的知识观图景,并在此基础上思考未来教学、学习以及教师该如何转型以应对变革。二、何以变革:人工智能时代知识观变革的动因较之以往时代,知识观在智能时代为什么会发生变革?隐蔽其背后的变革动因是什么?意欲探求事物变化发展动因,若避开哲学观便很难真正触及根本。唯物辩证法认为,事物是在内外因双重作用下发展变化的,内外因在一定条件下可以互相转化。洞见知识观变革的时代动因,需要从哲学层面揭示智能时代的知识现象及其背后深层次的内外因。外因是事物发展变化的外部原因,是某事物和他事物之间的外在联系和相互作用。人工智能技术以强势姿态闯入人们的视野,借助新一轮技术革命浪潮迅速席卷社会(顾小清,2021),推动时代跃迁,无疑是引发知识观变革的重要外因之一。虽是外因,人工智能技术却宛如一匹黑马,丰富知识载体与形态,增能知识生产与创造,加速并可能彻底改变知识的生命周期,或将撼动人类的知识主体地位,甚至动摇智能时代的知识生产与存在基础,对知识整个生态造成破坏性和颠覆性创新,成为知识观变革的内因。在内外因双重作用下,所带来的不只是知识内涵的变化,更有未来发展格局的变化,推动着知识观经历一次历史性的变革。(一)人工智能技术丰富知识载体从人类文明发展看,知识和负载知识的载体间存在着无法分割的关系(任友群,2002),载体有时甚至能很大程度上影响知识观。伴随着社会发展和媒介技术演进,人类在社会实践活动中逐渐构建与积累知识以认识世界,知识承载媒体种类与样态也在发生变化。远古时代的口耳相传、上古时期的文字造纸术、近古时期的印刷术、晚近以降的电子与视听技术、信息时代的数字技术……,知识载体的变迁可以说须臾未曾离开过技术的融入与形塑。伴随智能时代的到来,知识载体早已冲破传统形态的桎梏,驰骋于人类与智能机器所交织构成的开放性、不确定性的网络化海洋,不仅更加智能化,而且呈现出视觉、触觉等多模态融合感知的特征。多模态融合感知的知识载体,传播效率远高于单一的知识载体,呈现出更快的速度、更强的传播力、更广泛的接受群体和更个性化的表达等特征。(二)人工智能技术增能知识生产与创造在互联网+时代,知识传播与生产呈现多向与多源的趋势(顾小清,2019)。人工智能技术参与知识生产,加速了群智协同的分布式知识创造进程。机器“智能”的参与,延展了知识生产的视野,使得知识生产不再局限于科学界精英所组成的科学共同体(刘崇俊,2010),也不限于为了解决真实问题而吸纳的更广泛的社会参与,甚至不限于人类,而是扩展到了机器。人类不再是唯一的知识生产和拥有者,智能机器也具有同样的能力(李冀红,等,2021)。人工智能使得知识生产呈现自动化特点,削弱人类在知识创造上的智慧性。机器学习多以数据驱动,利用算法规则从数据中挖掘或抽取知识,这种自下而上的知识生产模式与专家自上而下的知识生产模式相对应,对知识生产与创造产生变革性影响。(三)人工智能技术加速并可能彻底改变知识生命周期“生命周期”原是生物学名词,意指生物生命发展过程由出生、成长到死亡等阶段构成的完整周期。知识伴随社会需求而产生,新知识产生后,经历加工、存储、应用等过程,继而投入生产实践,不断接受考察、验证,发挥其自身价值。知识发展与生物发展相似,也呈现出阶段性,由此把知识在时间上从产生到消亡的过程,称为“知识生命周期”(孟彬,等,2006)。人工智能技术以基于知识库和逻辑规则(算法)的“计算与表征”系统,进行知识生产、获取、存储、搜集、运算、生成、匹配和推荐等,加速并可能彻底改变知识生命周期。加拿大学者赫克托·莱韦斯克(H.J.Levesque)将人工智能定义为“基于知识的系统”(莱韦斯克,2018,p.143),知识的积累是人工智能的起点。人工智能可通过插入芯片的方式瞬间完成人类几千年发展与进化过程中所积累的系统知识的学习,用嵌入的大规模数据和信息尝试无限可能,挖掘深藏暗处的知识以及知识间的关系,实现自动化提取意义,通过自身的算法设计完成深度学习,去认识世界并形成相应的认知或判断。人工智能通过获取、处理和使用知识来执行任务,具有我们无法想象的速度与方式扩展、使用和创建知识的能力。智能技术对知识生产流程的介入,加速了群智云集的分布式知识创造进程。相较以往,知识生命周期已然面目一新。(四)人工智能技术或将撼动人类的知识主体地位人工智能技术是否会撼动人类的知识主体地位,这是一个有关人类与智能机器、知识关系的本源性命题,决定着作为生命存在的人类在知识实践中的角色与地位。在哲学框架中,通常以“活动的发起和指向”来区分主体和客体。主体指具有独立意识或个体经验的存在物。主体是活动的发起者,在活动中发挥能动作用的角色。客体是指在实践或认识活动中与主体发生关联、主体活动所指向的存在物(帕尔纽克,1988)。在知识实践中,人类是这些活动的发起者,具有独立意识,发挥着能动作用,是毋庸置疑的主体。智能机器凭借自我学习能力感知外部刺激信息、模拟人的知识处理行为、实现自主性推理与决策、完成知识创造的闭环。知识实践不再是人类这一碳基生命的智慧专利。在可预见的将来,强人工智能时代、超人工智能时代将会到来。彼时,具有自我意识、自主学习能力和思维能力的智能机器越来越具备人的特质。因此,一个重要的界限被超越。智能机器虽是技术人造物,却可能从客体地位“升格”成为知识实践的主体,以算法、工程化方法与产品工具等多种形态进行知识生产、创造、传播、应用等,推动知识实践自动化的深度与广度。虽然在相当长一段时期内人类社会仍处于弱人工智能时代,智能机器的智能性还未达到理想的程度,但已在某种程度上动摇了人类的知识主体地位。三、如何变革:人工智能时代的新知识观图景一定的知识观总是特定时代知识状况的反映(潘洪建,2003)。在教育发展史上,每一种知识观的形成与发展都是伴随着时代发展、技术进步与思想进化的,代表着人类对知识理解与认识的发展方向。人工智能技术重构了这个时代的知识秩序,知识观图景也与以往时代不同。“什么是知识”“知识从哪里来”等很多问题需要重新回答。(一)知识内涵:从确定性真理到不确定性“碎片”长期以来“知识是什么”一直受到古今中外思想家的高度关注,也是近现代认识论发展史上研究者孜孜探寻的重大课题。但这一问题的解答见仁见智,正如思想家罗伯特·格兰特(R.Grant)所言,尽管“什么是知识”激发了思想家们的兴趣,但至今仍然没有一个关于知识的统一而明确的界定(周险峰,2016)。乔治·西蒙斯(G.Siemens)也说“知识很难被定义”,且“达成一个严格的知识定义是毫无用处的”(西蒙斯,2009)。这缘于知识是一个蕴含多层含义的复杂概念,是一个非常艰深的话题,要下一个具有普遍性的定义是非常困难的。即便如此,这一问题仍然是对知识的探究最为经典的提问方式。1.确定性真理从现有文献看,以“知识”为主题的讨论可以追溯到古希腊。智者学派认为知识来源于个人经验,由于人的感受不同,因此没有绝对意义的知识。苏格拉底批判智者学派的观点,认为“如果一切事物都处在被动中,无物常驻,那么就不可能有任何知识。只有知识本身常驻不变才可能是知识;如果作为知识性质变化了,它就不是知识;如果变化一直持续下去,那么就不会有任何知识”(汪子嵩,等,2014,pp.418-419)。从这段论述可以看出,苏格拉底所说的知识具有普遍性、确定性特点和绝对、永恒的本质(毕文胜,等,2019)。在柏拉图众多著作中对于知识的讨论更加丰富了(柏拉图,2002,2003a,2003b,2018)。《美诺篇》讨论知识是否可教,《斐莱布篇》讨论快乐和智慧何者是真正善的知识,《理想国》讨论知识获得的方法和过程,《普罗泰戈拉篇》谈及“知识是灵魂的粮食”。《泰阿泰德篇》中“得到辩护的真信念”(justifiedtruebelief)这一经典说法奠定了古典的知识内涵——把知识看作确证了的真实的信念。知识由信念、真与确证三个要素组成,这便是西方传统知识的三元定义,受到西方学界长期追捧(文杰,2020)。于是,知识是绝对确定的必然的真理,经过权威所证实,逐渐成为人们的普遍认识。2.不确定性“碎片”知识反映着人类活动的理智成就,体现为较为稳定、可靠的结论性认识,甚至是真理。这一理解在当代遭遇挑战与质疑。在智能时代,智能技术对知识生产流程的介入,加速了群智云集的分布式知识创造进程,拉陡了知识增长斜率,使得知识更新迭代的速度呈指数级增长。知识更新与增长速度远大于权威证实速度,大量来自人类群体智慧、智能机器、人机协同等所产生的知识等还未形成系统结构,未来得及经过权威证实,就已借助万物泛在智联的网络进行分享与传播。分布式网络之上,不仅有被证实的权威知识,也充斥着未经验证的大众创造的知识乃至机器创造的知识。这些“智慧”以碎片化的形态散落各处。机器参与知识生产从根本上改变了知识确定性的状态和格局,原先具有确定性的认识可能被冲击甚至被颠覆。知识作为确定性真理的根基被打破,变成了大量不确定性“碎片”。智能时代,技术对于知识领域的扩张不仅提升了知识输入与输出的开放性,也增加了知识内容的不确定性和知识结构的复杂性。人工智能将知识创造的必然推向了或然,知识创造正从经典的稳态向不确定的暂态演化(李建中,2019)。碎片化是指事物由整体变成多个零块的现象,碎片即事物从整体通过各种方式所变成的零散状态。知识碎片是相对于完整结构的知识大厦而言的,是指知识点之间、知识单元之间的联系被切断或弱化,变成相对独立存在的状态(王竹立,2016)。知识作为不确定性“碎片”体现在知识生成过程和知识成果样态等方面。从知识生成过程来看,人工智能从大量数据中提取隐含的、未知的、潜在的、有用的信息,通过各种智能算法自动化提取意义,在从数据科学的角度为人类进行知识生产和创新提供帮助的同时,参与知识生产与创造,打破了知识原有的线性结构和层级关系,使得知识呈现碎片化。还有知识成果样态的不确定性。人工智能技术以其超强的计算能力进行模拟测算,可以自动生成、自主进化,产生大量的人类既无法感受又无法表达和描述的机器知识。知识不再是物化在文字里、书本中的静态、凝固、单维、简约的内容,其形态具有不确定性。因此,当代视域中的知识大厦已动摇了确定的根基,不确定性已经成为确定性命题。(二)知识类型:从“硬”知识到“软”知识、“灰”知识、“暗”知识知识分类是根据特定需要和标准,通过比较将知识按照相同、相异、相关等属性划分不同类别,以此显示其在知识整体中的应有位置和相互关系。一般而言可以按照效用、属性、形态、内在联系、学科知识体系等进行分类。但这些分类未能摆脱人类界限,未能将人机知识、机器知识充分考虑进去。1.“硬”知识历经漫长的人类社会演进与变迁,人类的知识图式逐渐积淀成系统的知识体系和科学理论。这些知识体系是人类对外部世界诸现象、过程、关系的客观认识和把握,其对象是客观存在的,不以人的主观意志为转移,不是纯主观活动的产物。经过人类思维的抽象提炼与精细加工、众多科学家的共同努力、大量实验与实践的验证、权威们的证实,人类庞大的知识体系已呈现出较为牢固的结构与完备的形态。这些知识常常固化在文字里、书本中,体现为抽象化、结构化、逻辑化等特征。从其存在性状来看,属于一种“硬”知识。2.“软”知识、“灰”知识、“暗”知识事物现象的变化决定了知识的变化,知识动态发展客观上取决于外部世界的发展演进。在人工智能时代,知识生产主体将出现人、机器和人机协同三种共生形态。人类与智能机器智能互联,形成巨大的超级智能体。不同智能体之间的交流联结不仅带来知识数量的增加,而且生产出多元化的知识类型——“软”知识、“灰”知识、“暗”知识等。“软”指物体内部的组织疏松,当受外力作用后容易改变形状。“软”知识是相对于“硬”知识而言的,用于指代尚未形成系统结构与固化形态的知识。“灰”原意指草木等固体完全燃烧形成的粉尘状物质,也引申为粉尘、无热量的、寂灭的、无生机的等含义。作为形容词时意为白色和黑色的混合色。“灰”知识用以指代人与机器协同所产生的知识类型。人类负责设计算法、制作智能机器、用大数据对智能机器进行训练,在关键节点上进行决策,智能机器通过对海量数据的深度学习,运用复杂的“不透明的”类似于黑箱的算法,进行知识生产。“暗”知识常用来指人类未曾掌握、却被机器产生并使用的知识。机器可以凭借其超人工智能技术超越人类既有的经验,获得机器所掌握而人类还从未探索过的海量的“暗”知识。“软”知识、“灰”知识、“暗”知识等与隐性知识、缄默知识、意会知识也有一定的相关性,均用来指代知识的样态。一般来说,隐性知识、缄默知识、意会知识均相对于显性知识而言,且较多应用于指代人类知道但难以言述的知识,“软”知识侧重强调其结构的动态变化。“灰”知识“暗”知识等则主要表明机器知识相对于人类知识的不透明性。(三)知识范围:从人类认识成果到“硅基智慧”知识范围指的是知识这一词语的指涉范围,用于划定其外部边际。对于像知识这样内涵丰富、运用普遍的概念,如何划定其范围是一个有待深入讨论的问题。在智能时代,知识不再只是人类认识成果,而是扩展到“硅基”智慧,延展了知识的外部边际。1.人类认识成果伴随着人类演进与社会发展,人类的各种知识实践活动如采集、分析、传播、应用等也极为丰富,在与自然的长期相互作用下积累了大量的知识。在人类还不能称为智人的时候,积累了哪里有果子可以食用、哪里有猛兽需要避开的经验。到了采集/狩猎时代,积累了如何使用火和工具的经验。这些经验都是知识的初级形态(彼得·凯弗,2019),伴随着科学技术的迅猛发展与社会的演进,知识渐渐从它的原初形态、经验形态上升为抽象的概念、理论,构成一个严谨的逻辑体系,呈现出较为完备的形态,演化成系统的科学理论。但是这些关于知识的讨论都是关于人类的,知识是人类认识世界的成果这一点几乎成为人类的共识。2.“硅基智慧”人工智能也称为“机器智能”或“智能模拟”,其实质是把人的某些神经生理智能赋予机器,通过机器识别符号、图像、语音等信息使机器能像人类那样进行学习、联想、判断、推理乃至行动,让机器模拟和代替人的某些智能(王毅,2006),探索和模拟人的感觉和思维过程的规律并进而设计出类似人的某些智能。维特根斯坦曾言“假如一只狮子忽然开口说人话,那么我们一定听不懂它在说什么”。这句话背后的深意在于,狮子与人类拥有截然不同的“生命形式”,具有完全不兼容的概念框架,即便狮子掌握了人类语言,也难以被人理解。人工智能也是如此。人工智能的智慧虽然难以理解,却令人类惊叹。智能机器在进化中不断蜕变,其发展已经达到令人震惊的地步,不仅仅是对人类感官系统的放大,也不仅仅是作为人类认知和行动的辅助系统,而是可以模拟或实现人类的学习行为,以获取新的信息或技能,重新组织已有的知识结构使之不断改善自身的性能,在某些领域的知识水平早就远超人类。因此,以硅为主的半导体为物质载体的智能机器,通过学习拥有了独特的认知方法,积累了大量的机器知识,具有了“硅基智慧”。(四)知识生产模式:从人类到人机群智协同知识生产是创造新知识的过程。人工智能技术使得知识生产的主体正在发生变化,知识生产模式面临又一次重大转型。1.人类知识生产模式的三次重大转型现代科学范式下,知识生产指的是在规范的学科体系下以科学的研究方法进行的、以科学知识生产为目标的活动。人类知识生产模式经历了三次重大转变。从古代以个体性、思辨性和整体性为特征的知识生产模式,到近代以专门化、精细化、职业化为特征的知识生产模式,到当代以草根性、群智化为特征的知识生产模式,分别称为模式0、模式1和模式2(宋妍,等,2020;郝丹,等,2019)。不管个体性还是群智化,草根性还是专业化,人类知识生产都是以自身经验为基础对已有知识进行理解和反思,依靠人类大脑驱动完成。知识生产模式的讨论也都是关于人类的,没有超出人类界限。2.人机群智协同的知识生产模式人工智能将使得知识生成方式从原来单独依靠人的协作创新转向依靠人与智能机器的协同创新(刘德建,等,2018)。人工智能打破了以人类为主体进行的知识生产,弱化了人类对特定知识的专属性。人类绝对的知识主体作用部分地让渡于机器,部分功能将被弱化甚至替代。人类与智能机器多主体协同进行知识的生产,可充分发挥各自优势,超越了人类进行知识生产的极限。因此,人工智能技术重塑了知识生产主体,在重复性、机械性的任务中解放了人类的双手和大脑,替人类思考、分析与归纳,甚至决策和创造知识。人工智能技术推动的知识创造生态,催生并推动以知识共创为特征的知识生产和知识传承方式将成为一种趋势,既包括人类共创,也包括人类与人工智能技术协同共创,使得知识生产模式跃迁为一种新的模式,可以称为人机群智协同的知识生产模式。(五)知识表征:从人类认知表征到机器计算表征知识通过对客观对象的反映与思维得以表征。在智能时代,知识表征呈现出从人类认知表征到机器计算表征的转向。1.认知表征对于人类而言,知识以心理结构或认知结构的形式存储在大脑中。知识表征即认知主体的心灵与世界的相互作用在大脑中的正确再现,通过符号、文字、图像并经过组合编码,最终形成符合语法结构的图形等直观的信息载体表征出来的认知表征(管云波,2016)。知识表征的对象是现实的客观世界。知识表征主要由知识在大脑中的呈现和知识的外在表达两部分构成,即由内部表征和外部表征组成。因此,知识表征方式也分为知识在大脑中呈现的方式和知识的外在表现方式。知识表征的内在呈现是信息在头脑中的呈现方式。信息经过输入、编码、转换、储存和提取等过程,最终以诸如概念、命题、图式、语义网络、生成规则及其他类型的知识和结构呈现。知识表征的外显方式是知识在大脑中储存和呈现方式的载体,是一种直观的展示方式,文字、语言、图像、图表、符号、方程式、公式等。2.计算表征人工智能的知识表征可以用计算表征加以解释。人工智能依靠逻辑规则(算法)对知识库中已有的知识进行搜集、处理、生成、匹配和推荐等,从而进行规划和决策。人工智能的知识表征可以按明晰的规则进行计算,一般不需要人直接干预。在通常情况下,它会建立一个表达抽象概念的本体论框架,进而根据逻辑规则执行各种表征程序,这些程序在各自的环境中适应性地进行表征与推理(魏屹东,2019),其知识表征方法包括命题逻辑、一阶(谓词)逻辑、二阶(谓词)逻辑等。命题逻辑表征简单的陈述性知识;一阶逻辑扩展了命题逻辑,引入量词,量化个体;二阶逻辑扩展了一阶逻辑,引入全集概念,不仅可以量化个体,还可以量化性质,并不断演化为普通逻辑(Menzel,2011)。(六)知识结构:从“建筑”到“管道”再到“舞蹈”隐喻知识结构一般是指知识的内在要素的组合方式和结合方式(昌家立,2004),是物理范畴之“状态样式规定性”规定下的结果,从发生意义上看又是由于知识发生过程中的过程样式规定性所导致(张沿沿,等,2020)。隐喻是用一种事物来理解另一种事物,在两个不同概念间建立联系或映射,不仅是一种修辞术,也是一种认知策略,具有重要方法论意义,在很大程度上影响人们对世界的概念化方式(张沛,2014)。知识论中存在着大量使用隐喻的现象,隐喻有助于更好地理解知识问题(顾林正,2008)。以隐喻思维审视知识的结构与存在方式,发现其可能呈现出从“建筑”到“管道”再到“舞蹈”结构的转向。1.长形式的知识和“建筑”隐喻“建筑”隐喻把知识比作建筑。由于人类传统知识图式是在漫长历史进化过程中渐渐积淀起来的,经历了众多科学家的共同努力和实验实践的考验,往往作为时代成果被人们吸收和同化,因而其结构完备性、牢固性极为明显。在人类历史很长一段时间内,实体书籍常常作为主要知识载体,从结构与存在方式来看,可以将知识形态看作是长形式的,常表现为静态固化的文本形态,以“建筑”隐喻之。哈佛大学学者温伯格(WeinbergerD.)指出,一直以来人类认识世界获取知识的一种标准模板是一个长形式的论证模式(戴维·温伯格,2014)。长形式的知识以及“建筑”隐喻,突出强调了知识是结构完整、层级明确的实体,整个知识体系被比喻成一个整体、宏大的建筑物,具体知识作为这一建筑体系中的基础或材料,唯有按照知识的逻辑和层次进行排序与建构,才能确保知识大厦的牢靠、坚固。人类的心智便扮演着搬运工、码字员一样的角色与任务,按照知识的层级、次序与逻辑,寻求在头脑中构造一个与外在知识大厦相符的知识“建筑”。2.网形式的知识和“管道”隐喻“互联网+”时代,知识拥有了一种能够帮助它超越“建筑”局限的媒介——网络。“如果‘长形式’的书籍告诉我们,知识是从A到Z的漫长旅程,那么网形式的知识可能会告诉我们,世界并非是一个逻辑严密的论证,而更像是一个无定形的、相互交织的、不可掌控的大网。”(戴维·温伯格,2014)温伯格在其著作《知识的边界》中也提出“网形式知识”见解,在信息超载的当下知识在网络中产生,也在网络中跳转。作为一种开放流动的交互性存在,知识不再仅存在于实体书籍之中,也不仅存在于人的头脑之中,而是存在于网络本身。在网络中,知识呈现为由节点和说明其间关系的边所构成的网状结构。知识具有更强的流动性、更高的联通性和更好的交互性。知识存在于一张细密杂乱的大网之中,正如生命并非活在我们的神经、骨骼、血液、骨髓之中,而是活在这一切所构成的联系之中。所以,知识是“网形式”的,它并非以客观、真实的事实寄居在书籍之中,而是弥漫在网络本身,存在于“管道”之中。网形式的知识及“管道”隐喻,为我们理解知识结构洞开了新的视界。3.人机共舞的知识和“舞蹈”隐喻智能时代知识结构极为复杂,很难笼统地说智能时代的知识具有怎样的结构和形状,而且仅关注人与人知识关联的丰富性远远不够,必须跳出人类局限,“探索主流知识模式之外的其他知识体系(联合国教科文组织,2017)”,拓展到人与智能机器所共同构建的世界。此番图景下,基尔(Gill,J.H.)提出“知识即舞蹈”隐喻(基尔,2003)。这一隐喻把两个以上的知识主体之间交互作用形成的、不断进化的、辩证的、共生的关系惟妙惟肖地刻画出来。在智能时代,知识成为人与人、人与机器、机器与机器以运动形态难分难解地交织在一起的动态舞蹈。这一隐喻对于“知识”的超批判性理解是:第一,知识离开人与人、人与机器、机器与机器的互动关系就不存在。当人类智能遇到人工智能,知识生产与进化在舞蹈中进行,人类智慧与硅基智慧在动态互动中生成新知识,并不断群体性进化,从根本上颠覆知识先生产后传播的流水模式,颠覆知识体系的牢固性与完备性。第二,知识本身是一种行为。知识是舞蹈,实际上是一种行为,人机彼此之间建立链接,形成知识生产与传播网络,有充分的信息交流和协作关系,具备信息交换和信息流动的特征。四、教育何为:基于新知识观图景的思考在人工智能技术推动下,知识图景已经发生巨变。基于智能时代新知识观图景的刻画,不得不使人们思考教学在内容和方式上将会有怎样的应对之策?学习者如何在未来的学习中占据主导地位并超越技术对人的改造?教师如何转变自身角色以适应人机协同共教?这些都是需要站在全局性、前瞻性视角进行思考的课题。(一)人工智能时代的教学:重构教学内容与方式,培养适应智能时代的综合性人才教育教学是知识学习的重要途径之一,也是人类社会延续与发展的重要方式。如果还试图用昨天的方式教育今天的孩子去适应明天的生活,显然是不可取的。为了培养面向智能时代的综合性人才,教学内容与方式都要重构。在智能时代知识体量变得更加庞大,更新迭代速度飞快,信息爆炸带来的知识指数级增长使得知识的辨别与选择变得越来越困难。知识可获得的途径也逐渐多样、便捷和高效,形态与结构也都发生巨大变化,确定性的知识大厦已经成为明日黄花。面对知识的软化、碎片化和不确定性,教学要逐渐降低知识的传授比重,教会学生学会辨析知识。在人工智能突破人类知识生产局限、重塑知识生产主体以及实现知识生产科学飞跃的背景下,一些常规性的认知工作逐渐被智能机器取代,为培养学生适应智能社会需求的技能,也为使学生能够超越技术对人的改造,应在原有知识基础上增加人机协同、机器学习等内容,指向学生的知识动态获取、知识深度加工处理能力和知识创新能力,注重教会学生学习如何与人工智能技术协同合作,鼓励并引导学生实现自主知识创造,增强创新思维能力。教的方式也将随之打破学科独立、知识分散的局限而走向融合,以项目式、综合实践式的方式来培养学生的技能与素养。此外,数据驱动教育的应用更加倾向于循证决策,基于教育数据深度挖掘来发现问题、分析原因和提炼规律,为解决教育问题提供科学、客观的依据。(二)人工智能时代的学习:从知识学习转向能力提升,在应对之中转变学的方向智能时代的科技与社会发展形成了新的学习格局,人们需要重新思考学习(陆石彦,2020)。智能机器有远超人脑的知识存储量和强大的数据分析能力,重塑了知识生产主体,实现了知识生产的科学飞跃,在重复性、机械性的任务中解放了人类的双手和大脑,替人类思考、分析与归纳,甚至决策和创造知识。在此背景下,人们不再需要靠死记硬背的方式获取与被动接受“硬”知识,要将“硬”知识交给机器去处理。因此,要培养学习者基于高阶思维参与的知识运用,以此代替简单性、机械性的知识获取、记忆、储存等,使他们能从知识的观察辨别中得到根本、稳定的知识,从知识的组合联结中得到动态、稳定的后台知识,从知识的创造中得到更适应新时代的稳定性知识。因此,学习将从传统的知识学习为主转向能力提升为主。从知识角度来讲,这种能力可能包括知识获取能力、知识辨别能力、知识应用能力和知识创造能力。当然,这并不是否认知识学习的必要性和重要性,人类和人工的智能活动依然需要立足于知识(余清臣,2019)。智能时代的学习将把重点放在能力培养上,辅以知识学习为基础,形成“知能合一”,帮助学习者拥有能够适应未来社会的知识和能力,从而实现人的全面发展。(三)人工智能时代的教师:重塑自身角色,提升人工智能素养人工智能时代知识观变革给教师职业带来了严峻挑战。体量庞大、结构复杂、类型丰富、迭更飞快、传播迅猛、获取便捷、渠道多样的海量知识侵蚀着教师的知识权威。教师不再是“知识的代言人”“真理的化身”,甚至“教师”这一称谓都泛化为智能机器,出现“教师消亡论”的极端论调也就见怪不怪了。当然,由于教育的复杂性、特殊性和长期性,以及人类社会性发展的需要,教师职业绝对不会消亡(邹太龙,等,2021),但是这并不意味着某些教师或教师的某些功能不会被人工智能取代。人工智能融入教育已成为一种不可逆转的趋势,人工智能技术将与人类齐头并进,成为人类进步不可缺少的工具甚至“同伴”,这已是不争的事实,“人机共教”是智能时代教育的新形态。未来学校所面对的是在智能技术裹挟下成长起来的原住民和21世纪学习者,这对教师职业提出了更高的要求。一方面,教师要具备接纳和拥抱人工智能的开放心态,正确认识并积极应对人工智能对教师职业的冲击,主动适应人工智能技术在教育中的渗入和应用,找准角色定位;另一方面,教师要尽快更新自身的胜任力结构,在既有的信息素养和数据素养基础上提升集AI意识、AI知识、AI能力和AI伦理于一身的人工智能素养,积极探索与创新人机协同的教学模式。五、结语保罗·莱文森(2003)曾言,“一切知识在一定意义上都取决于技术,不止如此,我们还要有力地断言:如果没有技术,人的知识就不可能存在”。从这句话可以窥见技术之于人类知识的重要性。在人工智能时代更是如此。从某种程度上来说,我们正面临着一场知识观的重塑。立足当下,知识的样态从形式到内容,从本质到外观,已逐渐远离了当初的认知面貌。智能机器或将撼动人类的知识主体地位,为知识创造注入鲜活的生命力。对新知识观的研究和思考还没有结束,也永远不会结束。展望未来,亟须树立新知识观以及与之相适应的教学观、学习观、教师观,以构建未来智能教育的大厦。参考文献M·A·帕尔纽克.1988.作为哲学问题的主体和客体[M].刘继岳,译.北京:中国人民大学出版社.保罗·莱文森.2003.思想无羁——技术时代的认识论[M].何道宽,译.南京:南京大学出版社.彼得·凯弗.2019.上帝笑了99次——哲学悖论里的大思考[M].程水英,译.北京:北京联合出版有限公司.毕文胜,杨晶.2019.何谓知识?——从苏格拉底到波普尔的哲学考察[J].兰州学刊(12):77-85.柏拉图.2002.柏拉图全集(第1卷)[M].王晓朝,译.北京:人民出版社.柏拉图.2003a.柏拉图全集(第2卷)[M].王晓朝,译.北京:人民出版社.柏拉图.2003b.柏拉图全集(第3卷)[M].王晓朝,译.北京:人民出版社.柏拉图.2018.理想国[M].郭斌和,等,译.北京:商务印书馆.布劳迪.1993.什么知识最有价值[M]//瞿葆奎.教育学文集(智育).北京:人民教育出版社.昌家立.2004.关于知识的本体论研究——本质·结构·形态[M].成都:四川出版集团巴蜀书社:49.陈丽,逯行,郑勤华.2019.“互联网+教育”的知识观:知识回归与知识进化[J].中国远程教育(7):10-18,92.戴维·温伯格.2014.知识的边界[M].胡泳,高美,译.太原:山西人民出版社.顾林正.2008.知识论中的隐喻研究[J].社会科学辑刊(2):18-21.顾小清.2019.数字技术带来教育生态变革[N].光明日报.08-06:13.顾小清.2021.当现实逼近想象:人工智能时代预见未来教育研究[J].开放教育研究,27(1):4-12.管云波.2016.知识表征的研究:从个体认知到社会呈现[D].山西大学.郝丹,郭文革.2019.知识生产新模式的基本特征与反思——基于库恩科学理论评价标准的考察[J].教育学术月刊(3):3-12,64.赫克托·莱韦斯克.2018.人工智能的进化[M].王佩,译.北京:中信出版集团.胡友志.2014.知识观转型与教育变革:走向复杂——基于思想史和科学哲学的考察[J].现代教育科学(5):1-5,14.基尔.2003.走向学习的学习[M].东京:青木书店.李冀红,庄榕霞,年智英,刘德建,黄荣怀.2021.面向人机协同的创新能力培养——兼论面向智能时代的创造性人才诉求[J].中国电化教育(7):36-42,61.李建中.2019.人工智能:不确定的自主性知识创造[J].自然辩证法研究,35(1):117-122.联合国教科文组织.2017.反思教育:向“全球共同利益”的理念转变[M].联合国教科文组织总部中文科,译.北京:教育科学出版社:22.刘崇俊.2010.科学精英的科学生产功能定位研究[J].科学学研究,28(8):1122-1127.刘德建,杜静,姜男,黄荣怀.2018.人工智能融入学校教育的发展趋势[J].开放教育研究,24(4):33-42.陆石彦.2020.论人工智能时代的教师角色再造[J].江苏高教(6):97-102.孟彬,马捷,张龙革.2006.论知识的生命周期[J].图书情报知识(3):92-95.潘洪建.2003.当代知识观及其对基础教育课程改革的启示[J].课程·教材·教法(8):9-15.乔治·西蒙斯.2009.网络时代的知识和学习——走向连通[M].詹青龙,译.上海:华东师范大学出版社.任友群.2002.信息时代知识的生产和复制(上)[J].信息技术教育(11):23-24.石中英.2001.知识转型与教育改革[M].北京:教育科学出版社.宋妍,张明.2020.大学知识生产模式转型与知识生产创新主体的协调[J].山东高等教育,8(2):1-6,26,2.索尔蒂斯.1993.教育与知识的概念[M]//瞿葆奎.教育学文集(智育).北京:人民教育出版社.王毅.2006.硅基生命——人工智能的发展前景[D].大连:大连理工大学.王竹立.2016.移动互联时代的碎片化学习及应对之策——从零存整取到“互联网+”[J].远程教育杂志,34(4):9-16.汪子嵩,范明生,陈村富,姚介厚.2014.希腊哲学史(第二卷)[M].北京:人民出版社.魏屹东.2019.人工智能的适应性知识表征与推理[J].上海师范大学学报(哲学社会科学版),48(1):65-75.文杰.2020.知识的本质与德性知识论——以“原因”关系消解两类认知运气[J].自然辩证法研究(10):31-36.余清臣.2019.人工智能时代的知识教育[J].人民教育(9):47-53.张良,易伶俐.2020.试论未来学校背景下教学范式的转型——基于知识观重建的视角[J].中国电化教育(4):87-92,117.张沛.2004.隐喻的生命[M].北京:北京大学出版社.张沿沿,冯友梅,顾建军,李艺.2020.从知识结构与思维结构看思维评价——基于皮亚杰发生认识论知识观的演绎[J].电化教育研究,(6):33-38.周浩波.2000.教育哲学[M].北京:人民教育出版社.周险峰.2016.教育基本问题研究:回顾与反思[M].武汉:华中科技大学出版社.邹太龙,康锐,谭平.2021.人工智能时代教师的角色危机及其重塑[J].当代教育科学(6):88-95.Menzel,C.(2011).Knowledgerepresentation,theWorldWideWeb,andtheevolutionoflogic.Synthese,182(2):269-295.作者简介杜华,博士,博士后,副教授,浙江省智能教育技术与应用重点实验室(321004)。顾小清,博士,教授,博士生导师,华东师范大学教育学部教育信息技术学系(200062)。基金项目:本文系2019年度国家社会科学基金重大项目“人工智能促进未来教育发展研究”(项目批准号:19ZDA364)的研究成果。责任编辑:郝丹韩世梅2022年第10期目次特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.
/阅读下一篇/返回网易首页下载网易新闻客户端“人工智能+教育”,未来是一幅怎样激动人心的图景
近日,“2022世界人工智能大会教育论坛”在上海世博中心举行。中国科学院院士、国防科技大学原副校长王怀民,中国工程院院士、华东师范大学校长钱旭红,华东师范大学终身教授、上海智能教育研究院院长袁振国,就智能教育这个话题进行了一场别开生面的对话。现整理发表,以飨读者,内容有删减。
袁振国、王怀民、钱旭红在对话中
『智能教育是教育信息化的高级阶段』
袁振国:两年前,华东师范大学就把智能教育作为学校发展的首要战略。请问钱校长,作为一所师范大学,为什么把智能教育放在如此突出的地位?
钱旭红:我们有三个层面的考虑:第一,教育与整个社会、产业紧密相关,今天的教育大部分是工业文明时代的教育,它正在向信息文明时代迈进。西方国家从农业时代向工业化、信息化发展,走过了大约300年的道路,而我们中国只用了40年左右的时间就走过了这段历程。目前,我国的社会和产业开始跨越信息时代,向人工智能时代转型。而我们的教育呢?在相当程度上还处于1.0、2.0之间,也就是农业文明和工业文明时代,刚刚开始有了大规模的网络教育。同时,我们又必须面对人工智能的冲击和影响,而这对我们来说倒是一个机遇。因为,工业文明时代的教育以及网络时代的教育,我们是亦步亦趋跟着别人,所以很难超越,但是在人工智能时代,我们和别人在同一起跑线,我们有很多优势,更容易接纳新的思想,我们有可能为人类的文明发展作出更大的贡献,甚至在一定程度上可能超越别人。
第二,在华东师范大学的毕业生中,有50%在教育领域任教从业,有25%在信息科学技术领域,比如大数据、软件、计算机、人工智能等领域从业。一所师范大学,教育和信息学科都非常强,全中国唯有这一所。因此,把这两大优势结合在一起,创造出新的优势,这是我们学校的使命。
第三,培养卓越人才是华东师范大学努力追求的目标,但是,培养卓越人才需要深刻了解并呵护每一个人,过去以传统的方法根本做不到,而人工智能恰恰提供了一种可能,通过大规模的因材施教,可以为每个人的发展服务,把每个人都培养成独一无二、不可替代的英才。
正是由于这三个原因,我们学校尤其重视智能教育。
袁振国:王怀民院士是我国杰出的计算机科学家,同时又是一位对智能教育倾注了极大热情的院士。请王院士总体评价一下目前我国智能教育发展的现状。
王怀民:智能教育可以理解为教育信息化的高级阶段。为什么要把它放在教育信息化的背景下来讲?因为智能教育的发展不能割裂地来看,要放在信息时代的历史进程中来看。
信息时代的发展经历了几个重要阶段:第一个阶段是数据化阶段,第二个阶段是网络化阶段,现在正在进入智能化的高级阶段。人类在经历农业时代、工业时代、信息时代之后,未来会进入智能时代,信息时代的高级阶段可能孕育着未来的智能时代。信息时代的数据化和网络化为推动教育的智能化发挥了非常重要的基础作用。
『人工智能在教育上的应用难度无可比拟』
袁振国:然而,有一个我们不得不面对的现实是,教育的智能化与其他领域的智能化相比处于相对落后的状态。比如,无人驾驶汽车、智能家居、智能物流等,我们都能体验到,但是从教育来看,大多数的教育行为、教育模式还是以传统方式为主导。这是什么原因呢?
钱旭红:人工智能在教育上应用的难度是其他行业所不能比拟的。农业时代的早期,杂草丛生,粮食产量很低,人们仅以追求温饱为目标。进入工业时代,流水线把每个工人变成了一个机器。如果教育也采取这样的方式,我们培养的就是工具,而不是真正的英才。
要培养真正的英才,教育必须建立在每个人独特的个性、独特的思维方式和独特的生理结构的基础上。很多人已经习惯了工业化式的教育,觉得人应该都是一样的,老师和教案也应该是一样的,长此以往,就会把每个人都变成工业产品。但是,工业产品可以格式化、统一化,人却不能,人是有思想、有灵魂的。
当信息技术还没有发展到高级阶段时,它是很难扎根于教育领域的。要知道,信息技术在采集数据时会对人产生一定的干扰,其好处是一种激励,其坏处是可能带来一定的伤害,它是具有两面性的。因此,对于人工智能的发展而言,其最高境界就是在教育中的应用。当智能教育应用后,我们才能真正把每个人培养成与众不同的英才,人工智能也才能发展到非常成熟的阶段。在那个时候,人类的智能和人工智能就融为了一体。所以我认为,到今天这个时间关口,以人为核心的人工智能时代即将到来,这就是智能教育激动人心的伟大前景。
钱旭红
王怀民:今天,人工智能的研究常常是以如何替代人为主要目标,而智能教育则是以如何支持人、帮助人、服务人为主要目标。
比如,智能工厂、智能港口等领域,工人越来越少,都被机器人取代了,似乎这就是人工智能的优势。但是,教育不是这样,智能教育不是要替代人,而是要让人类的智能和人工智能交融在一起,要让人发展得更好,这是更高级的交融。
我认为,这是人工智能技术发展中需要高度关注的一个问题。今天,人工智能技术之所以能够有所突破,可以从人和机器融合在一起发展的历史进程中得到启发。比如网络大数据,今天大量的自然语言处理、模式识别的成功,是因为人在数字化、网络化的应用环境中自然而然的行为留下的那些被标记的数据,才使得计算机的深度学习有了低成本的标记大数据。智能模型是怎么建立起来的?是人在系统中“喂”给计算机算法标记数据后训练得到的。因此,人工智能的成功并不是取代人,并不是让人工智能和人类智能打擂台,而是二者紧密联合在一起带来的成功。这也为智能教育的发展带来了深刻的启迪。
『应用场景创新是智能教育的突破口』
袁振国:这真是一个非常令人激动的领域,智能教育是人工智能皇冠上的“明珠”。如果智能教育成功了,那么人工智能发展可能就到了比较理想的阶段。那么我想请问,智能教育下一步的突破点在哪里?
王怀民:我认为,要在人和机器的有效融合上获得突破,简单来说,就是智能教育应用场景的创新。
今天,很多人工智能技术得以发展,实际上是应用场景创新牵动了相关信息技术包括智能技术的有效组合,在创新场景下得到了应用和发展。未来,智能教育如果能在场景创新上有所突破,中国教育就有可能在智能教育这个阶段对人类作出更大的贡献。
比如,在数字化和网络化阶段的教育,慕课是一个被设计和构造出来的场景。这个场景由哈佛大学、斯坦福大学通过实践用技术形式呈现出来,形成了慕课平台。它的确成为一种全新的学习应用场景和手段,它和传统课堂教学是不一样的。
还比如短视频。短视频的设计不仅仅是流媒体技术的使用,也是对人类注意力周期的基本认知在网络教育场景下的一种体现。由此,也形成了一些规模化、个性化、终身学习的模式和支持平台。如果再加上智能推荐技术,就有可能更好地体现规模化的个性教育场景,或者说使得智能化慕课成为可能。
应用场景创新的思路是什么?就是促进规模化、个性化、终身化的教育场景设计。我个人认为这是一个重要的突破点。
王怀民
钱旭红:什么样的切入口才能使智能教育有重大的发展?我觉得要在传统教育无法着力而且很难发挥的地方去入手,才能创造更大的辉煌。
第一个层面,孔子讲“因材施教”,人工智能可以发挥大规模采集数据的优势,并把数据背后的因果关系以及非因果关系都解构出来。
第二个层面更加重要,就是老子讲的“不言之教”。一方面,人工智能可以把不能用言语表达的教学内容揭示出来。比如,量子力学中有关电子云的内容,以前只能用数学公式来表达,而人工智能则能把所谓的波粒二象性动态模拟出来,学生的学习效果就会完全不一样。
另一方面,所谓“不言之教”,一言一行都是教育,一草一木都是教育。比如,不同的人对于色彩的敏感度是不一样的,有的人色弱,有的人甚至色盲。人工智能可以把一个人器官的敏感力延长,对数据重新进行编译,从而把一些有缺陷的人也培养成天才。这是我们目前的技术手段所没有的。人工智能可以用于学习和教育软硬环境的创造。
第三个层面,今天,我国大学、中小学的教育主要来自西方教育的知识体系,那是古希腊的知识体系经过西方工业化后发展而来的。其实,世界上还有另一种知识体系,就是中国的天人合一、整体关联的知识体系。
当今的知识体系起源于西方的科学或者学科的分类研究法。西方的分类方式是什么?就是分解还原,将客观世界分解、分类并加以研究,然后综合还原,其基本前提是部分之和等于整体。而我们中国的知识体系是什么?是围绕一个具体问题,把不同的领域串联在一起。比如中医学,就是把植物学、矿物学、天文学、地理学串联在一起,围绕的是人的健康。
一个人的生命是有限的,我们不可能把所有的知识、方法都教给学生。如果有了人工智能,除了西方教育的知识体系,我们还可以把中国的知识体系教给学生,围绕一个真实问题、围绕一个中心概念,把不同领域的知识串联在一起,这样一来,学生就能掌握分科之学和整体之学,就能达到一种很高的境界——他既是中华文明的传承者,又是西方文明的传承者,同时是新文明的创造者。
如此,人工智能时代的智能教育就能达到更高的境界格局,从而真正实现为人类作出更大的贡献。
袁振国
『中国特色智能教育,为全人类作贡献』
袁振国:智能教育和中国文化有怎样的关系?未来中国的智能教育发展会有什么样的中国特色?
王怀民:从一般意义上来讲,教育本身属于文化的范畴,它是人类文化的一种重要形态,所以教育和文化一定是密切相关的。
智能教育如何体现中国文化的特色?我非常赞同钱校长的观点,中国传统文化中的系统思维是非常重要的,它是未来中国智能教育突破的另一个方向。
西方科学从古希腊孕育成长而来,在300年前和技术结合带来了工业革命。在工业革命之前,科学只是一种高级技艺而已,和绘画、文学其实是一码事。西方科学的还原论是对自然规律的一种简化,幸运的是它和技术结缘带来了工业革命,加上资本主义制度的发展,使得它在那个时代体现出了它的先进性。以至于西方科学传到中国以后,给我们带来了很大的震撼。
然而,人类社会发展到今天,西方经典科学的局限性越来越凸显。我们应该看到,中国文化特别是系统思维的文化土壤,可能孕育着未来的新科学和新思想。通过智能教育,我们可以把过去西方传统教育不能理解和表达的东西表达出来,让更多人理解和参与其中,体会到中国传统文化和哲学思想对于新科学贡献的优势,这也是未来智能教育发展的一种更高的境界。
钱旭红:体现智能教育的中国特色,还有一个非常重要的内容,就是中文。我认为,在人工智能时代,中文将再次焕发青春。为什么这样说?因为中国人的思维方式是综合性的,从来不会把一件事情完全割裂开。中文既形声又象意,同时还有逻辑含义。有人说中文的逻辑含义是落后的、模糊的,事实并非如此。信息熵是指某种特定信息的出现概率,也就是一种表示信息量大小的概念。通过计算显示,在所有的文字中,中文的信息熵含量是第一位的,超出了任何一种文字。这就是为什么在联合国的各种文本中,中文书是最薄的。用中文作诗写歌可以很朦胧,但中文用词又非常精确,可以作为科学语言。
因此我认为,中文既有形象思维又有逻辑思维的特点,如果能和智能教育结合起来,一定能够体现出中国的文化特色,并为全人类作出新的贡献。
《人工智能》之《知识表示方法》
教材:《人工智能及其应用》,蔡自兴等,2016m清华大学出版社(第5版)
参考书:
《人工智能》之《知识表示方法》1状态空间法(StateSpaceRepresentation)1.1问题状态描述1.2状态图示法1.3示例:修道士(Missionaries)和野人(Cannibals)问题2问题归约法(ProblemReductionRepresentation)2.1问题归约描述2.2示例:梵塔难题(TowerofHanoiPuzzle)2.3与或图表示2.4问题归约的描述3谓词逻辑法(PredicateLogicMethod)3.1一阶谓词逻辑表示的逻辑学基础3.2谓词演算(predicatecaculus)3.3谓词公式3.4谓词逻辑表示方法3.5置换与合一置换(Substitution)合一(Unification)置换与合一的作用3.6谓词逻辑法的优缺点主要优点主要缺点4语义网络法(SemanticNetworkMethod)4.1一元语义网络的表示4.2二元语义网络的表示4.3多元语义网络的表示4.4命题运算4.5概念节点与实例节点4.6语义网络的推理过程继承匹配4.7语义网络法的优缺点主要优点主要缺点:5框架表示(Frame)5.1框架的构成5.2框架的推理5.3框架表示法的优缺点6本体技术6.1背景知识6.2本体(Ontology)6.3本体建模方法7知识图谱8小结知识是一个抽象的术语,用于尝试描述人对某种特定对象的理解。
知识的定义
知识的一般概念:知识是人们在改造客观世界的实践中积累起来的认识和经验。
知识的代表性定义:
知识是经过裁剪、塑造、解释、选择和转换的信息(Feigenbaum);知识由特定领域的描述、关系和过程组成(Bernstein);知识=事实+信念+启发式(HeyesRoth)。知识、信息、数据的关系:知识的类型
按知识的性质:概念、命题、公理、定理、规则和方法。
按知识的作用域:
常识性知识:通用通识的知识,人们普遍知道的、适用于所有领域的知识;领域性知识:面向某个具体专业领域的知识。按知识的作用效果:
事实性知识:用于描述事物的概念、定义、属性等,或用于描述问题的状态、环境、条件等的知识;过程性知识:用于问题求解过程的操作、演算和行为的知识,或指出如何使用那些与问题有关的事实性知识的知识;控制性知识:(元知识或超知识)。是关于如何使用过程性知识的知识。例如:推理策略、搜索策略、不确定性的传播策略。按知识的确定性:
确定性知识:可说明其真值为真或为假的知识;不确定性知识:包括不精确、模糊、不完备知识。1.不精确:知识本身有真假,但由于认识水平限制却不能肯定其真假;表示:用可信度、概率等描述2.模糊:知识本身的边界就是不清楚的。例如:大,小等;表示:用可能性、隶属度来描述3.不完备:解决问题时不具备解决该问题的全部知识。例如:医生看病。知识表示
对知识的一种描述;一种计算机可以接受的用于描述知识的数据结构;表示方法不唯一;是人工智能的核心。知识表示的要求
表示能力:能否正确、有效地表示问题。包括:表达范围的广泛性领域知识表示的高效性对非确定性知识表示的支持程度可利用性:可利用这些知识进行有效推理。包括:对推理的适应性:推理是根据已知事实利用知识导出结果的过程对高效算法的支持程度:知识表示要有较高的处理效率可实现性:要便于计算机直接对其进行处理可组织性:可以按某种方式把知识组织成某种知识结构可维护性:便于对知识的增、删、改等操作自然性:符合人们的日常习惯知识表示存在的问题
人是如何表示知识,存储知识的仍然是个迷;目前用计算机来进行知识处理面临三大难题:1.“Clear-Cut”问题:主要处理可形式化的边界清晰问题;2.知识获取瓶颈:很难把现实中的知识转化为计算机可理解的知识;3.知识窄台阶:多为专家系统知识,缺乏常识性知识。如何让机器理解下面的故事?主人让小马托着两袋盐巴过河,他不小心把一部分浸到了河里。于是盐巴融化在河里一部分,盐袋子也变轻了。小马很开心,得意洋洋地回家了。第二次,主人又给小马托起棉花过河。小马想起来上次,故意把棉花都浸到了河里。结果,小马沉得要死,死扛着回家了。
如何让机器理解如此场景?
我们不是音频分析的手段来实现对贝多芬音乐的欣赏,也不是用视频分析的手段来实现对梵高油画的欣赏”(杨雄里院士)。这其中蕴含深刻的整合过程,因此必然涉及大量的背景知识和感知经验。
人的概念系统
人的概念系统是非任务特定性的,具有很强的通用性。正是这种不局限于特定目标的特性,使人可以处理各种各样问题(通用人工智能的目标);Nisson认为“人工智能最重要的部分就是发现一个适用的概念化知识结构。”(建立一套基于统一认知理论的计算模型,即基于单一结构上多个程序的认知模型)。1状态空间法(StateSpaceRepresentation)许多问题的求解方法是试探搜索方法。这些方法是通过在某个可能的解空间内寻找一个解来求解问题的。这种基于解答空间的问题表示和求解方法就是状态空间法,它是以状态和算符为基础来表示和求解问题的。
状态(state):表示问题解法中每一步问题状况的数据结构;算符(operator):把问题从一种状态变换为另一种状态的手段(或操作)。
1.1问题状态描述定义:
状态(State):描述某类不同事物间的差别而引入的一组最少变量q0,q1,…,qn的有序集合,即(n+1)维向量。算符(Operate):使问题从一种状态变化为另一种状态的手段,也称操作符。状态空间(StateSpace):是一个表示该问题全部可能状态及其关系的图,它包含三种说明的集合,即所有可能的问题初始状态集合S、操作符集合F以及目标状态集合G,即三元状态(S,F,G)。要完成某个问题的状态描述,必须:
该状态描述方式,特别是初始状态描述;操作符集合及其对状态描述的作用;目标状态描述的特性。1.2状态图示法有关图的知识:《软件技术基础》之《图》
图的显示说明:对于显式说明,各节点及其具有代价的弧线由一张表明确给出。此表可能列出该图中的每一节点、它的后继节点以及连接弧线的代价(相关知识:D是邻接矩阵,如何求i,j的最短距离?)
图的隐示说明:已知起始节点{si}和后继节点算符Γ。后继节点算符能作用于任一节点以产生该节点的
全部后继节点各连接弧线的代价(例如:棋局)寻找一种状态到另一种状态的算符序列等价于寻找图上的最短路径问题。
表示方法的多样性:如3数码难题中
规则1:移动数码(3X4条规则)规则2:移动空格(4条规则)应该选择小而简单的状态空间。
1.3示例:修道士(Missionaries)和野人(Cannibals)问题问题描述
设在河的一岸有三个野人、三个修道士和一条船,修道士想用这条船把所有的人运到河对岸,但受以下条件的约束:
修道士和野人都会划船,每次船上至多可载两个人;在河的任一岸,如野人数超过修道士数,修道士会被野人吃掉。如果野人会服从任何一次过河安排,请规划一个确保修道士和野人都能过河,且没有修道士被野人吃掉的安全过河计划。
状态表示
用一个三元组来表示状态:S=(m,c,b)
集合说明m左岸的修道士人数(missionary)c左岸的野人数(cannibal)b左岸的船数(bank)右岸的状态可由下式确定:
状态式右岸修道士数m’=3-m右岸野人数c’=3-c右岸船数b’=1-b该表示方式下,m,c都可取0、1、2、3,b可取0和1,共有4×4×2=32种状态,如下所示:操作集
状态空间
给出状态和操作的描述之后,该问题的状态空间是:状态空间图
2问题归约法(ProblemReductionRepresentation)问题归约法是另一种基于状态空间的问题描述与求解方法。已知问题的描述,通过一系列变换把此问题最终变为一个本原问题集合;这些本原问题的解可以直接得到,从而解决了初始问题。
2.1问题归约描述问题归约法由3部分组成:
一个初始问题描述;一套把问题变换为子问题的操作符;一套本原问题描述。问题归约法的实质:从目标(要解决的问题)出发逆向推理,建立子问题以及子问题的子问题,直至最后把初始问题规约为一个平凡的本原问题集合。
归约方式
分解等价变换2.2示例:梵塔难题(TowerofHanoiPuzzle)问题描述
有3个柱子(1,2,3)和3个不同尺寸的圆盘(A,B,C)。在每个圆盘的中心有个孔,所以圆盘可以堆叠在柱子上。最初,全部3个圆盘都堆在柱子1上:最大的圆盘C在底部,最小的圆盘A在顶部。要求把所有圆盘都移到柱子3上,每次只许移动一个,而且只能先搬动柱子顶部的圆盘,还不许把尺寸较大的圆盘堆放在尺寸较小的圆盘上。
归约过程
移动圆盘A和B至柱子2的双圆盘难题;移动圆盘C至柱子3的单圆盘难题;移动圆盘A和B至柱子3的双圆盘难题。由上可以看出简化了难题每一个都比原始难题容易,所以问题都会变成易解的本原问题。归约描述
问题归约方法是应用算符来把问题描述变换为子问题描述。
可以用状态空间表示的三元组合(S、F、G)来规定与描述问题;对于梵塔问题,子问题[(111)→(122)],[(122)→(322)]以及[(322)→(333)]规定了最后解答路径将要通过的脚踏石状态(122)和(322)。
问题归约方法可以应用状态、算符和目标这些表示法来描述问题,这并不意味着问题归约法和状态空间法是一样的。
梵塔问题归约图
2.3与或图表示与图、或图、与或图
我们用一个似图结构来表示把问题归约为后继问题的替换集合,这一似图结构叫做问题归约图,也叫与或图。相关概念
父节点、子(后继)节点、弧线终叶节点:对应于原问题的本原节点。或节点:只要解决某个问题就可解决其父辈问题的节点集合,如(M,N,H)。与节点:只有解决所有子问题,才能解决其父辈问题的节点集合,如(B,C)和(D,E,F)各个结点之间用一端小圆弧连接标记。与或图:由与节点及或节点组成的结构图。右图是增加附加结点后的规范化与或图。
可解结点
终叶节点是可解节点(因为它们与本原问题相关连)。如果某个非终叶节点含有或后继节点,那么只要当其后继节点至少有一个是可解的时,此非终叶节点才是可解的。如果某个非终叶节点含有与后继节点,那么只有当其后继节点全部为可解时,此非终叶节点才是可解的。不可解结点
没有后裔的非终叶节点为不可解节点。全部后裔为不可解的非终叶节点且含有或后继节点,此非终叶节点才是不可解的。后裔至少有一个为不可解的非终叶节点且含有与后继节点,此非终叶节点才是不可解的。解树由可解节点构成,并且由这些可解节点可以推出初始节点(它对应着原始问题)为可解节点的子树为解树。在解树中一定包含初始节点。
问题归约求解过程即生成解树,即证明原始节点是可解节点的过程。
2.4问题归约的描述问题归约方法应用算符把问题描述转化为子问题描述,可以采用各种数据结构:表列、树、字符串、矢量、数组等;
例如梵塔问题的表示:包含两个数列的表列:[(111),(333)]
可以把问题归约法看成比状态空间法更通用的问题求解方法;其核心实现是不断简化问题(即缩小子问题的状态空间),直至问题成为本原问题(已知问题、易解问题)。
3谓词逻辑法(PredicateLogicMethod)3.1一阶谓词逻辑表示的逻辑学基础断言(assertion):一个陈述句称为一个断言。
命题(proposition):具有真假意义的断言。
命题的真值:
T:命题的意义为真F:命题的意义为假命题真值的说明:
一个命题不能同时既为真又为假一个命题可在一定条件下为真,而在另一条件下为假论域(domainofdiscourse):由所讨论对象的全体构成的集合。亦称为个体域(individualdomain)。
个体(individual):论域中的元素。
谓词(predicate):在谓词逻辑中命题是用形如P(x1,x2,…,xn)的谓词来表示的。
谓词名:命题谓语,表示个体的性质、状态、个体之间的关系个体:命题主语,表示独立存在的事物或概念函数(function):
逻辑语句:一种形式语言,能把逻辑论证符号化,用于证明定理,求解问题。
形式语言(FormalLanguage):严格地按照相关领域的特定规则,以数学符号(符号串)形式描述该领域有关客体的表达式。
3.2谓词演算(predicatecaculus)原子公式(atomicformula):由谓词符号和若干项组成的谓词演算。原子公式是谓词演算基本积木块。
项包括常量符号、变量符号、函数符号等。
定义原子公式为真值或假值就表示了某种语义(semantics)。
若t1,t2,…,tn是项,P是谓词,则称P(t1,t2,…,tn)为原子谓词公式(原子公式)。
无变量的原子公式取值确定,包含变量的原子公式取值不定。
例如:“机器人(ROBOT)在1号房间(room1)内”INROOM(ROBOT,room1)为真INROOM(ROBOT,room2)为假
连词(Connective)
与、合取(conjunction):用连词∧把几个公式连接起来而构成的公式。合取项是合取式的每个组成部分。例:LIKE(I,MUSIC)∧LIKE(I,PAINTING)(我喜爱音乐和绘画。)或、析取(disjunction):用连词∨把几个公式连接起来而构成的公式。析取项是析取式的每个组成部例:PLAYS(LILI,BASKETBALL)∨PLAYS(LILI,FOOTBALL)(李力打篮球或踢足球。)蕴涵(Implication):“→”表示“如果—那么”(IF—THEN)关系,其所构成的公式叫做蕴涵。非(Not):表示否定,¬、~均可表示量词(Quantifier)辖域(scope):指位于量词后面的单个谓词或用括弧括起来的合式公式。
约束变元(boundvariable):辖域内与量词中同名的变元。
自由变元(freevariable):不受约束的变元。
变元的换名
对约束变元,须把同名的约束变元都统一换成另外一个相同的名字,且不能与辖域内的自由变元同名。
对辖域内的自由变元,不能改成与约束变元相同的名字。
3.3谓词公式原子公式:P(x1,x2,…,xn)一个n元谓词公式,为谓词演算的原子公式,或原子谓词公式。其中,P是n元谓词;x1,x2,…,xn是客体变量或变元。
文字(literal):一个原子公式,和原子公式的否定。
子句(clause):文字的析取(V)构成的公式。
**合成公式(WFF,well-formedformula)**的递归定义:示例:试把下列命题表示为谓词公式:任何整数,或者为正数或者为负数。用I(z)表示“z是整数”,P(z)表示“z是正数”,N(z)表示“z是负数”。给定命题用下列谓词公式来表示:合成公式的真值表
等价(Equivalence)如果两个合式公式,无论如何解释,其真值表都是相同的,那么我们就称此两合式公式是等价的。
注意:(10)说明在一个量化的表达式中的约束变量是一类虚元,它可用任何一个不在表达式中出现过的其他变量符号来代替
3.4谓词逻辑表示方法表示步骤:
确定个体域;根据要表示的知识定义谓词;用连词、量词把这些谓词连接起来。3.5置换与合一谓词逻辑的推理:将推理规则应用于一定的合式公式(集),以产生新的合式公式。谓词公式的等价性和永真蕴含性
置换(Substitution)表达式中用置换项置换变量,如用项A替换函数表达式中的变量(x)表达式E(Expression)用一个置换s(Substitution)而得到的表达式的置换,记为EsE(s1s2)=(Es1)s2置换合成
合一(Unification)是人工智能中很重要的一个过程;寻找项对变量的置换,以使多个表达式一致的操作。如果一个置换s作用于表达式集{Ei}的每个元素,则我们用{Ei}s来表示置换例的集。如存在置换s使得表达式集{Ei}置换后有:E1S=E2S=E3S=…,则称表达式集{Ei}是可合一的,s称为{Ei}的合一者(unifier)。还有其他的合一者,最简单的合一者为:g={B/y}。
最通用的合一者:如对表达式集{Ei}的任一合一者s,都存在某一s’,使得{Ei}s={Ei}gs’,则称g为{Ei}的最通用合一者(mostgeneralunifier,i.e.mgu)
置换与合一的作用谓词逻辑推理的基本方法,就是寻找简单有效置换合一,采用消解原理利用消解反演方法求解问题,详见第三章。
3.6谓词逻辑法的优缺点主要优点自然:一阶谓词逻辑是一种接近于自然语言的形式语言系统,谓词逻辑表示法接近于人们对问题的直观理解;明确:有一种标准的知识解释方法,可表示的知识明确、易于理解;精确:谓词逻辑的真值只有“真”与“假”,其表示、推理都是精确的;灵活:知识和处理知识的程序是分开的,无须考虑处理知识的细节;模块化:知识之间相对独立,这种模块性使得添加、删除、修改知识比较容易进行。主要缺点知识表示能力有限:只能表示确定性知识,而不能表示非确定性知识、过程性知识和启发式知识(与精确相对);存在组合爆炸:由于难以表示启发式知识,因此只能盲目地使用推理规则,这样当系统知识量较大时,容易发生组合爆炸;语义表达能力低:它把推理演算与知识含义截然分开,抛弃了表达内容中所含有的语义信息,往往使推理过程冗长(与灵活相对)。4语义网络法(SemanticNetworkMethod)1968年,奎廉(J.R.Quillian)在研究人类联想记忆时,受到以下两点的启发:
人脑记忆的一个重要特征是人脑中不同信息片段之间的高度连接;高度相关的概念能够比不太相关的概念更快地回忆起来。提出一种心理学模型,即语义网络,认为记忆是由概念间的联系实现的,把它用作知识表示。1972年,西蒙在自然语言理解系统中也采用了语义网络表示法。
语义网络是一个通过语义关系连接的概念网络。语义网络其实是一种有向图表示的知识系统。节点代表的是概念,而边则表示这些概念之间的语义关系。语义网络中最基本的语义单元称为语义基元,可以用三元组形式表示:。
4.1一元语义网络的表示属性关系:指事物和其属性之间的关系。
常用的属性关系有:
Have:含义为“有”,表示一个节点具有另一个节点所描述的属性;
Can:含义为“能”、“会”,表示一个节点能做另一个节点的事情;
Age:含义为“年龄”,表示一个节点是另一个节点在年龄方面的属性。
4.2二元语义网络的表示上述关系的主要特征:属性继承性,处在具体层的节点可以继承抽象层节点的所有属性。
示例1:用语义网络表示:动物能运动、会吃。鸟是一种动物,鸟有翅膀、会飞。鱼是一种动物,鱼生活在水中、会游泳。示例2:用语义网络表示:王强是百度公司的经理;百度公司在中关村;王强28岁。
4.3多元语义网络的表示示例1:小燕是一只燕子,燕子是一种鸟,鸟有翅膀;巢-1是小燕的巢,巢-1是巢中的一个。存在的问题:上述的语义网络为二元关系,无法表示复杂事实,如:小燕从春天到秋天占有巢-1。如果采用谓词逻辑表示为一个四元谓词演算:Owns(XIAOYAN,NET-1,SPRING,FALL)
解决办法:通过星形连接的方式,把多个变元联系起来。
表示方法:增加情况、动作节点。
示例2:用语义网络表示:“小燕子这只燕子从春天到秋天占有一个巢”。示例3:用语义网络表示:“JohngaveMarythebook.”
如果用谓词逻辑法:GAVE(JOHN,MARY,BOOK)
多元语义网络表示的实质:把多元关系转化为一组两两之间的二元关系的组合,或二元关系的合取。通过星形连接的方式,把多个变元联系起来。
4.4命题运算与运算示例:或运算示例:非运算示例:
4.5概念节点与实例节点自己的理解:如果语义网络只用来表示一个特定的物体或概念,那么当有更多的实例时就需要更多的语义网络,这样就使问题复杂化。我们可以找到一个通用的概念,称为概念节点;而把一个更加具体的点作为这个概念的实例,称为实例节点。例如:把汽车作为概念节点,我的汽车、张三的汽车作为汽车的一个实例节点。
4.6语义网络的推理过程值节点(valuenode):在链的尾部的节点。
节点的槽(slot):链的别称。
示例:BRICK12有3个链(2个槽):COLOR槽只有一个值,填入RED;ISA槽有两个值,填入了BRICK和TOY。
继承在语义网络中,继承是把对事物的描述从概念节点或类节点传递到实例节点。
示例:
概念节点BRICK的SHAPE槽,有值节点RECTANGULAR(矩形),属性RECTANGULAR可通过ISA链传递给实例节点BRICK12,实例节点BRICK12无SHAPE槽,可从语义网络推理出BRICK12的SHAPE的外形为RECTANGULAR(矩形)。
一共有三种继承过程:值继承、“如果需要”继承、“缺省”继承。
值继承:ISA(Isa)链与AKO(AKindOf)链,常用知识传递方法;放入值侧面中。“如果需要”(If-needed)继承:有时对不知道的槽值,可计算得到,通过此计算程序得到知识的模式称为if-needed链,如通过体积、密度在需要时可以计算其质量。If-needed程序放入IF-NEEDED侧面中。“缺省”继承:在对事务所作假设无十分把握时,可加上“可能”字样,这种不肯定的值称为“缺省”值,放入槽的DEFAULT侧面中。匹配推理步骤:
根据提出的待求解问题,构造一个局部网络或网络片段,其中有的节点、弧标注为空,表示有待求解的问题,称为未知处;根据这个局部网络、网络片段到知识库中寻找可匹配的语义网络,以便求得问题的解答(匹配可近似);问题的局部语义网络与知识库中的某种语义网络片段匹配时,则与未知处相匹配的事实就是问题的解。已知结构有2个部件:TOY-HOUSE、TOY-HOUSE77
虚节点和虚链:TOY-HOUSE、TOY-HOUSE77之间有ISA链,就知虚节点和虚链。
已知结构有2个部件:BRICK12、楔块WEDGE18
部件匹配:STRUCTURE35、TOY-HOUSE之间有ISA链,就知BRICK12须支撑WEDGE18虚线箭头:BRICK12和WEDGE18间的SUPPORT虚链
4.7语义网络法的优缺点主要优点结构性:显式地表示事物属性、事物间的各种语义联系,是一种结构化的知识表示方法。下层结点可继承、新增、变异上层结点的属性。联想性:因人类联想记忆模型提出,强调事物间的语义联系,体现了人类的联想思维过程。自索引性:明确、简洁的方式表示各接点之间的联系,通过与某一结点连接的弧可很容易的找出与该结点有关的信息,而不必查找整个知识库。有效的避免搜索时的组合爆炸问题。自然性:带标识的有向图可直观表示知识,符合人们表达事物间关系的习惯,且与自然语言语义网络之间的转换也较易实现。主要缺点:非严格性:无谓词的严格形式表示体系,给定语义网络的含义完全依赖于处理程序对它所进行的解释,所实现的推理不能保证其正确性。复杂性:表示知识的手段多种多样,虽对其表示带来了灵活性,同时也因表示形式的不一致,增加了处理的复杂性。5框架表示(Frame)框架理论(微世界理论):明斯基1975年作为理解视觉、自然语言对话及其它复杂行为的一种基础提出来的,认为人们对现实世界中各种事物的认识都是以一种类似于框架的结构存储在记忆中的,当遇到一个新事物时,就从记忆中找出一个合适的框架,并根据新的情况对其细节加以修改、补充,从而形成对这个新事物的认识。例:对饭店、教室等的认识。
框架:人们认识事物的一种通用的数据结构形式。
实例框架:对于一个框架,当人们把观察、认识到的具体细节填入后,就得到了该框架的一个具体实例,即实例框架。
框架系统:框架是知识的基本单位,把一组有关的框架连结起来便可形成一个框架系统。
框架系统推理:由框架之间的协调来完成。
5.1框架的构成由描述事务的各个方面的槽组成,每个槽可以拥有若干个侧面,而每个侧面可拥有若干个值。示例:框架的关系:一个框架可为另一个框架的槽值,且一个框架结构可作为几个不同框架的槽值。相同的信息不必重复存储,节约空间。
示例:一个立体视图的框架表示最高层的框架用ISA槽说明是一个立方体,并由region槽指示出它所拥有的3个可见面A,B,E。而A,B,E又分别用3个框架来具体描述。用mustbe槽指示它们必须是一个平行四边形。
框架系统
学生框架研究生框架infer槽:用于指出两个框架所描述事物间的逻辑推理关系,可用来表示相应的产生式规则。
示例:如果咳嗽、发烧且流涕,则八成是患感冒,需服用“感冒清”,一日三次,每次2-3粒,多喝开水。
5.2框架的推理框架系统的基本推理方法:
特性继承(ISA/AKO链),如:燕子→鸟部分匹配,如:TOY-HOUSE从描述中直接引用,如:Student例子各槽值的相关信息可以指导进行该槽值的描述解答子节点与父节点差异的原因,例如:三条腿的椅子相似网络推理代表性知识库:FrameNet官网:FrameNet
Howtouse:FrameNet&FrameNetPythonAPI
5.3框架表示法的优缺点6本体技术6.1背景知识研究背景2000年12月18日,Berners-Lee在XML2000的会议上正式提出了语义Web。目标是使Web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对WWW上异构、分布信息的有效访问和搜索。Berners-Lee为未来的Web发展提出了语义Web体系结构。
语义网语义网体系结构语义网提供了一套为描述数据而设计的表示语言和工具,用于形式化地描述一个知识领域内的概念、术语和关系。
第一层:Unicode和URI(uniformresourceidentifier,通用资源标识符),是整个语义网的基础。Unicode处理资源的编码,实现网上信息的统一编码;URI负责标识资源,支持网上对象和资源的精细标识。
第二层:XML+NS(NameSpace)+XMLSchema,用于表示数据的内容和结构的可扩展标记语言。通过XML标记语言将网上资源信息的结构、内容和数据的表现形式进行分离。
第三层:RDF+RDFSchema,用于描述网上资源及其类型,为网上资源描述提供一种通用框架和实现数据集成的元数据解决方案。
第四层:OntologyVocabulary,用于描述各种资源之间的联系,揭示资源本身及资源之间更为复杂和丰富的语义联系,明确定义描述属性或类的术语语义及术语间关系。
第五层:逻辑层,主要提供公理和推理规则,为智能推理提供基础。该层用来产生规则。
第六层:证明层,执行逻辑层产生的规则,并结合信任层的应用机制来评判是否能够信赖给定的证明。
第七层:信任层,注重于提供信任机制,以保证用户代理在网上进行个性化服务和彼此间交互合作时更安全可靠。
核心层为XML、RDF、ONTOLOGY,用于表示信息的语义。
XMLXML(eXtensibleMarkupLanguage,可扩展标记语言)是最早的语义网表示语言,它取消了HTML的显示样式和布局描述能力,突出了数据的语义和元素结构描述能力。特性:XML只定义了文档结构和数据类型,没有定义数据的语义,机器仍然无法理解文档的内容。为了让应用程序理解数据的语义,就出现了RDF。
RDFRDF(ResourceDescriptionFramework)是一种资源描述框架,利用当前的多种元数据标准来描述各种网络资源,形成人机可读,并可由机器自动处理的文件。
RDF的核心思想:利用Web标识符(URI)来标识事物,通过指定的属性和相应的值描述资源的性质或资源之间的关系。
示例:RDFSchema示例:RDF(S)的优缺点
优点:
简单:资源以三元组的形式描述,简单、易控制。易扩展:描述和词汇集分开,具备良好的可扩展性。包容性:允许定义自己的词汇集,并可以无缝使用多种词汇集来描述资源。易综合:RDF认为一切都是资源,这样很容易综合描述。缺点:
不能准确描述语义:同一个概念有多种词汇表示,同一个词汇有多种含义(概念)。
没有推理模型,不具备推理能力。
6.2本体(Ontology)本体(Ontology)通过对概念的严格定义和概念与概念之间的关系来确定概念的精确含义,表示共同认可的、可共享的知识。
本体的定义本体的组成OWLOWL(WebOntologyLanguage,Web本体语言)是在语义网上表示本体的推荐语言,作为RDF(S)的扩展,其目的是提供更多原语以支持更加丰富的语义表达并支持推理。
OWL是RDF的扩展,提供了更广泛的定义RDFS词汇的功能——可以定义词汇之间的关系,类与类间的关系,属性与属性之间的关系等,从而使得数据的语义定义更加丰富,并且构成一个知识系统并支持推理。
OWL的三个子语言:
OWLLite:提供一个分类层次和简单属性约束。OWLDL:提供推理系统,保证计算完备性和可判定性。OWLFull:支持完全自由的RDF语法,但是不具备可计算性保证。表达能力:OWLLite