博舍

知识图谱怎么与深度学习结合 知识图谱是符号主义人工智能的代表吗

知识图谱怎么与深度学习结合

二、知识图谱作为深度学习的输入

知识图谱是人工智能符号主义近期进展的典型代表。知识图谱中的实体、概念以及关系均采用了离散的、显式的符号化表示。而这些离散的符号化表示难以直接应用于基于连续数值表示的神经网络。为了让神经网络有效利用知识图谱中的符号化知识,研究人员提出了大量的知识图谱的表示学习方法。知识图谱的表示学习旨在习得知识图谱的组成元素(节点与边)的实值向量化表示。这些连续的向量化表示可以作为神经网络的输入,从而使得神经网络模型能够充分利用知识图谱中大量存在的先验知识。这一趋势催生了对于知识图谱的表示学习的大量研究。本章首先简要回顾知识图谱的表示学习,再进一步介绍这些向量表示如何应用到基于深度学习模型的各类实际任务中,特别是问答与推荐等实际应用。

1.知识图谱的表示学习

知识图谱的表示学习旨在学习实体和关系的向量化表示,其关键是合理定义知识图谱中关于事实(三元组)的损失函数ƒr(h,t),其中和是三元组的两个实体h和t的向量化表示。通常情况下,当事实成立时,期望最小化ƒr(h,t)。考虑整个知识图谱的事实,则可通过最小化:

来学习实体以及关系的向量化表示,其中O表示知识图谱中所有事实的集合。不同的表示学习可以使用不同的原则和方法定义相应的损失函数。这里以基于距离和翻译的模型介绍知识图谱表示的基本思路[1]。

基于距离的模型。其代表性工作是SE模型[2]。基本思想是当两个实体属于同一个三元组时,它们的向量表示在投影后的空间中也应该彼此靠近。因此,损失函数定义为向量投影后的距离

其中矩阵Wr,1和Wr,2用于三元组中头实体h和尾实体t的投影操作。但由于SE引入了两个单独的投影矩阵,导致很难捕获实体和关系之间的语义相关性。Socher等人针对这一问题采用三阶张量替代传统神经网络中的线性变换层来刻画评分函数。Bordes等人提出能量匹配模型,通过引入多个矩阵的Hadamard乘积来捕获实体向量和关系向量的交互关系。

基于翻译的表示学习。其代表性工作TransE模型通过向量空间的向量翻译来刻画实体与关系之间的相关性[3]。该模型假定,若成立则尾部实体t的嵌入表示应该接近头部实体h加上关系向量r的嵌入表示,即h+r≈t。因此,TransE采用

作为评分函数。当三元组成立时,得分较低,反之得分较高。TransE在处理简单的1-1关系(即关系两端连接的实体数比率为1:1)时是非常有效的,但在处理N-1、1-N以及N-N的复杂关系时性能则显著降低。针对这些复杂关系,Wang提出了TransH模型通过将实体投影到关系所在超平面,从而习得实体在不同关系下的不同表示。Lin提出了TransR模型通过投影矩阵将实体投影到关系子空间,从而习得不同关系下的不同实体表示。

除了上述两类典型知识图谱表示学习模型之外,还有大量的其他表示学习模型。比如,Sutskever等人使用张量因式分解和贝叶斯聚类来学习关系结构。Ranzato等人引入了一个三路的限制玻尔兹曼机来学习知识图谱的向量化表示,并通过一个张量加以参数化。

当前主流的知识图谱表示学习方法仍存在各种各样的问题,比如不能较好刻画实体与关系之间的语义相关性、无法较好处理复杂关系的表示学习、模型由于引入大量参数导致过于复杂,以及计算效率较低难以扩展到大规模知识图谱上等等。为了更好地为机器学习或深度学习提供先验知识,知识图谱的表示学习仍是一项任重道远的研究课题。

三、知识图谱向量化表示的应用

应用1:问答系统。

自然语言问答是人机交互的重要形式。深度学习使得基于问答语料的生成式问答成为可能。然而目前大多数深度问答模型仍然难以利用大量的知识实现准确回答。Yin等人针对简单事实类问题,提出了一种基于encoder-decoder框架,能够充分利用知识图谱中知识的深度学习问答模型[4]。在深度神经网络中,一个问题的语义往往被表示为一个向量。具有相似向量的问题被认为是具有相似语义。这是联结主义的典型方式。另一方面,知识图谱的知识表示是离散的,即知识与知识之间并没有一个渐变的关系。这是符号主义的典型方式。通过将知识图谱向量化,可以将问题与三元组进行匹配(也即计算其向量相似度),从而为某个特定问题找到来自知识库的最佳三元组匹配。匹配过程如图1所示。对于问题Q:“HowtallisYaoMing?”,首先将问题中的单词表示为向量数组HQ。进一步寻找能与之匹配的知识图谱中的候选三元组。最后为这些候选三元组,分别计算问题与不同属性的语义相似度。其由以下相似度公式决定:

这里,S(Q,τ)表示问题Q与候选三元组τ的相似度;xQ表示问题的向量(从HQ计算而得),uτ表示知识图谱的三元组的向量,M是待学习参数。

图1基于知识图谱的神经生成问答模型

应用2:推荐系统。

个性化推荐系统是互联网各大社交媒体和电商网站的重要智能服务之一。随着知识图谱的应用日益广泛,大量研究工作意识到知识图谱中的知识可以用来完善基于内容的推荐系统中对用户和项目的内容(特征)描述,从而提升推荐效果。另一方面,基于深度学习的推荐算法在推荐效果上日益优于基于协同过滤的传统推荐模型[5]。但是,将知识图谱集成到深度学习的框架中的个性化推荐的研究工作,还较为少见。Zhang等人做出了这样的尝试。作者充分利用了结构化知识(知识图谱)、文本知识和可视化知识(图片)[6]等三类典型知识。作者分别通过网络嵌入(networkembedding)获得结构化知识的向量化表示,然后分别用SDAE(StackedDenoisingAuto-Encoder)和层叠卷积自编码器(stackedconvolution-autoencoder)抽取文本知识特征和图片知识特征;并最终将三类特征融合进协同集成学习框架,利用三类知识特征的整合来实现个性化推荐。作者针对电影和图书数据集进行实验,证明了这种融合深度学习和知识图谱的推荐算法具有较好性能。

四、知识图谱作为深度学习的约束

Hu等人提出了一种将一阶谓词逻辑融合进深度神经网络的模型,并将其成功用于解决情感分类和命名实体识别等问题[7]。逻辑规则是一种对高阶认知和结构化知识的灵活表示形式,也是一种典型的知识表示形式。将各类人们已积累的逻辑规则引入到深度神经网络中,利用人类意图和领域知识对神经网络模型进行引导具有十分重要的意义。其他一些研究工作则尝试将逻辑规则引入到概率图模型,这类工作的代表是马尔科夫逻辑网络[8],但是鲜有工作能将逻辑规则引入到深度神经网络中。

Hu等人所提出的方案框架可以概括为“teacher-studentnetwork”,如图2所示,包括两个部分teachernetworkq(y|x)和studentnetworkpθ(y|x)。其中teachernetwork负责将逻辑规则所代表的知识建模,studentnetwork利用反向传播方法加上teachernetwork的约束,实现对逻辑规则的学习。这个框架能够为大部分以深度神经网络为模型的任务引入逻辑规则,包括情感分析、命名实体识别等。通过引入逻辑规则,在深度神经网络模型的基础上实现效果提升。

图2将逻辑规则引入到深度神经网络的“teacher-studentnetwork”模型

其学习过程主要包括如下步骤:

利用softlogic将逻辑规则表达为[0,1]之间的连续数值。基于后验正则化(posteriorregularization)方法,利用逻辑规则对teachernetwork进行限制,同时保证teachernetwork和studentnetwork尽量接近。最终优化函数为:

其中,ξl,gl是松弛变量,L是规则个数,Gl是第l个规则的grounding数。KL函数(Kullback-LeiblerDivergence)部分保证teachernetwork和studentnetwork习得模型尽可能一致。后面的正则项表达了来自逻辑规则的约束。对studentnetwork进行训练,保证teachernetwork的预测结果和studentnetwork的预测结果都尽量地好,优化函数如下:

其中,t是训练轮次,l是不同任务中的损失函数(如在分类问题中,l是交叉熵),σθ是预测函数,sn(t)是teachernetwork的预测结果。重复1~3过程直到收敛。后记

随着深度学习研究的进一步深入,如何有效利用大量存在的先验知识,进而降低模型对于大规模标注样本的依赖,逐渐成为主流的研究方向之一。知识图谱的表示学习为这一方向的探索奠定了必要的基础。近期出现的将知识融合进深度神经网络模型的一些开创性工作也颇具启发性。但总体而言,当前的深度学习模型使用先验知识的手段仍然十分有限,学术界在这一方向的探索上仍然面临巨大的挑战。这些挑战主要体现在两个方面:

关键词:大数据、人工智能、知识图谱、深度学习、问答系统、推荐系统返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇