
知识图谱节点是实体节点以其类型标记两个节点之间的边捕获实体之间的关系

举例:百科全书网络

举例:社交网络
举例:谷歌知识图谱

一些产品
知识图谱的应用:


知识图数据集
共同特点:
举例:Freebase
来自Freebase的人中93.8%没有出生地,而78.5%的人没有国籍!


关键思路:
关系模式
对称关系,例如家庭,室友
组合关系,例如我母亲的老公是我老爸
1对多,多对1关系,例如学生和老师
翻译直觉

注意:嵌入向量将以粗体显示
训练

使用TransE在知识图谱中做边预测


组合关系

对称关系


多对应关系,1对多,多对1,多对多
使用TransE时,t1和t2将映射到相同的向量,尽管它们是不同的实体。

TransR:在实体空间ℝ()中将实体建模为向量,并在关系空间ℝP中将每个关系建模为向量r,其中Mr; ∈ℝP×(作为投影矩阵)。

Lin, Yankai, et al. "Learning entity and relation embeddings for knowledge graph completion." AAAI.
TransR中的对称关系

例如:家庭和室友

1对N,N对1,N对N关系
示例:如果知识图中存在(ℎ,r,t1)和(ℎ,r,t2)。

复合关系:
例如我的母亲的丈夫是我的父亲。
每个关系都有不同的空间。 对于多个关系而言,这不是自然组成要素!
基于关系的嵌入:

路径查询
知识图谱中的查询类型
我们可以进行多跳推理,即在不完整的大规模KG上有效地回答复杂的查询吗?
查询类型 | 示例
单跳查询 | Hinton在哪里毕业?
路径查询 | 图灵奖获得者从哪里毕业?
结语查询 | 获得图灵奖的加拿大人从哪里毕业?
EPFO查询 | 获得图灵奖或诺贝尔奖的加拿大人从哪里毕业?
单跳查询
我们可以将链接预测问题表述为回答一跳查询。
通过在路径上添加更多关系,将单跳查询通用化为路径查询。

q的计算图:

路径查询的计算图是一条链
“图灵奖获得者从哪里毕业?”

给出一个知识图谱,如何回答查询问题?
通过遍历知识图谱来回答路径查询。 “图灵奖获得者从哪里毕业?”

锚点是图灵奖

从锚节点“ Turing Award”开始 并通过“赢”关系遍历KG, 我们到达实体 {“Pearl”, “Hinton”, “Bengio”}。

从节点{“ Pearl”,“ Hinton”,“ Bengio”} 开始,并通过关系遍历KG “毕业”,我们到达实体 {“NYU”, “Edinburgh”, “Cambridge”, “McGill”}。这些就是查询的答案!
如果图不完整该怎么办?
我们可以先做链接预测然后遍历已完成的(概率)KG?
不!完全的知识图谱是一张密集的图!
穿越密集的KG的时间复杂度 | V | 回答长度(Va,r1 ...... rn)的实体 n是O(| V | n)

关键思想:嵌入查询! §将TransE推广到多跳推理。

在向量空间中嵌入路径查询。“图灵奖获得者从哪里毕业?”遵循计算图:



连词查询
我们可以回答更复杂的查询吗?
计算图如下:

两个锚点:加拿大和图灵奖

从第一个锚节点“ Turing Award”开始,并通过关系“ Win”遍历,我们到达{“ Pearl”,“ Hinton”,“ Bengio”}。

从第二个锚节点开始 “Canada”,按关系穿越 “Citizen”,我们得到 { “Hinton”, “Bengio”,
“Bieber”, “Trudeau”}

然后,我们将这两个集合相交并获得{'Hinton','Bengio'}

我们进行另一个遍历并得出答案!
关键思路:将查询嵌入向量空间 “获得图灵奖的加拿大公民从哪里毕业?”


我们如何取几个交集 嵌入空间中的向量?设计神经交叉算子

DeepSets架构

限制:
Query2Box 框嵌入
嵌入带有超矩形的查询(框)

当我们遍历KG以获得答案时,每个步骤都会产生一组 可达实体。我们如何更好地为这些集合建模?


投影操作符



几何相交算子ℐ¡ℐ:



query2box可以处理不同的模式:

EPFO查询
我们可以嵌入更复杂的查询吗? “获得图灵奖或诺贝尔奖的加拿大人从哪里毕业?”
合并查询+析取称为存在正一阶(EPFO)查询。

query2box实际怎么学习?
示例:“列出演奏弦乐器的男性乐器演奏者”











