抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

来源:ACL 2020
领域:KGQA
模型:EmbedKGQA
核心模型:ComplEx;BERT/RoBERTa
代码:GitHub

关注问题

多跳KGQA中,KG的不完整性带来独特的挑战。现有解决方案中包括使用文本,但文本不一定存在;KGE可以解决补全问题,但还没有研究将两者结合在一起,本文是这方面的一次尝试。

Model

EmbedKGQA 模型架构

模型分为三个核心模块:KG Embedding Module,Question Embedding Module,Answer Selection Module。

  • KG Embedding Module:和现有KGE模型的目的一致,生成实体的表示向量。本文使用ComplEx作为KGE模型。
  • Question Embedding Module:生成问题的表示。使用预训练模型RoBERTa生成question的表示向量,然后经过4层全连接网络生成实数部分和虚数部分的表示向量$e_q$(用于后续使用ComplEx进行评分)

Answer Selection Module

答案选择器用于生成最后的实体选择。首先,使用ComplEx的打分函数生成分数$\phi (e_h, e_q, e_{a’})$,这种方式在候选实体很少的时候是适用的,但有些KG候选实体非常多。因此,引入pruning机制进行实体筛选打分。

$$
h_q = \text{RoBERTa}(q’) \
S(r, q) = \text{sigmoid}(h_q^Th_r)
$$

筛选$S(r, q)$ 大于0.5的关系集合$\mathcal{R}_a$, 以及最短路径关系集合$\mathcal{R}_{a’}$, 得到一个关系分数

$$\text{RelScore}_{a’}=\vert \mathcal{R}a \cap \mathcal{R}{a’} \vert$$

最终分数$e_{ans} = \text{argmax}(\phi (e_h, e_q, e_{a’})) + \gamma * \text{RelScore}_{a’}$

延伸

写作的时候遇到行内数学公式渲染错误的问题,Follow了这个Post的解决方案。

评论