抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

Antarx' Blog

Antarx is the heart of Scorpio

本文总结2022年任务驱动对话的研究进展。 [CASPI] Causal-aware Safe Policy Improvement for Task-oriented Dialogue来源:ACL 2022 Long Paper 使用强化学习策略解决任务驱动对话中的问题:任务驱动对话中的策略学习。文章认为,任务驱动对话是从离线数据中学习,另一方面强化学习在离线数据训练的时候会导致误差和泛化...

这篇文章总结一下对话情绪识别的进展情况,有两篇文章。 Is Discourse Role Important for Emotion Recognition in Conversation?来源:AAAI 2022 这篇文章关注在对话情绪识别中,已有的模型没有利用“Discourse Role Information” 对话角色信息这个东西。对话角色/话语角色这是语言学上的一个概念...

最近用🤗Transformers的时候发现它们模型已经转移到glfs(git large file system)上,刚好自己想上传数据集的时候也需要用到。顺手了解了一下 配置LFS不属于git,而是GitHub开发出来的一套东西,在command line上使用的话需要安装lsf插件 压缩包下载下来之后,解压然后运行安装 $cd ~/Downloads $tar -xf {yo...

发表于2019年的对话意图识别任务的baseline 本文发表时间算比较早了,模型结构比较简单,大体就是以BERT作为encoder编码器部分,对输入序列进行编码获得token的词向量表示 意图识别本质就是分类任务,这篇文章使用BERT最后一级的[CLS] 作为句子分类的向量表示。槽填充部分使用分类标注的形式。因为槽填充其实就是在进行命名实体识别,这篇文章也做了CRF作为输出级的实验,从实验...

这次来分析一下LeetCode中几道炒股题目 No.121 买卖股票的最佳时机题目描述给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润,返回 0 。 示例...

两道关联题目,跳跃游戏,两道都没顺利做出来,好好记录一下。 55 跳跃游戏题目描述给定一个非负整数数组 nums ,你最初位于数组的 第一个下标 。 数组中的每个元素代表你在该位置可以跳跃的最大长度。 判断你是否能够到达最后一个下标。 示例 1: 输入:nums = [2,3,1,1,4] 输出:true 解释:可以先跳 1 步,从下标 0 到达下标 1, 然后再从下标 1 跳 3 步到达最...

问题描述Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的,故又叫 Levenshtein Distance 。 例如:字符串A: abcdefg字符串B: abcdef通过增加或是删掉字符 ”g”...

题目描述给定一个区间的集合 intervals ,其中 intervals[i] = [start_i, end_i] 。返回 需要移除区间的最小数量,使剩余区间互不重叠 。 示例 1: 输入: intervals = [[1,2],[2,3],[3,4],[1,3]] 输出: 1 解释: 移除 [1,3] 后,剩下的区间没有重叠。 示例 2: 输入: intervals = [ [1,2...

DGL 库升级到最新版本0.9.0+的测试版之后,运行老版本的代码会遇到错误 AttributeError: 'Column' object has no attribute deferred_dtype 在官方GitHub页面可以看到相关的讨论:GitHub issue 4107 个人推测是因为DGL版本升级对底层代码进行了重构,我的代码中,使用老版本的DGL构建了图实例,...

教训记录。 题目描述给出由小写字母组成的字符串 S,重复项删除操作会选择两个相邻且相同的字母,并删除它们。 在 S 上反复执行重复项删除操作,直到无法继续删除。 在完成所有重复项删除操作后返回最终的字符串。答案保证唯一。 示例: 输入:"abbaca"输出:"ca"解释:例如,在 "abbaca" 中,我们可以删除 "bb...

DEVONthink 是苹果系统下一款很好用的知识管理工具,然而,由于DEVONthink本身更侧重于档案管理,所以通常会和其他markdown类笔记软件打组合拳。 今天分享一款直接复制DEVONthink的item link为markdown链接样式的脚本: tell application id "DNtp" set theMarkdownLinks to &...

最近读到一系列KG的文章都使用了四元数(Quaternion)用于Embedding或者扩展GNN。四元数是一种区别于实数和复数的数学工具,在这里整理一些关于这个数学工具的基础知识。 四元数是什么四元数的基本运算加法:两个四元数$q$ and $p$ 的加法运算可以表示为: $$q + p = (q_r + p_r) + (q_i + p_i)\textbf{i} + (q_j +...

今天跟朋友讨论的一道有趣的面试问题:为什么Transformer中Scale-dot attention计算 $Attn = \text{Softmax}(\frac{QK^T}{\sqrt{d_k}})V$,缩放因子一定是$\sqrt{d_k}$ 而不是d_k或者其他形式?

本篇整理几种常见的知识图谱补全模型的原理以及对应的超参数。

整理最近阅读的时序知识图谱(Temporal Knowledge Graph)补全领域的文献。 基本概念首先,明确基本概念。现有的知识图谱表示为$\mathcal{G}={(h, r, t)}$ 的三元组集合,这是一种静态的图谱,目前针对这种形式的知识图谱补全任务,也就是预测三元组$(h, r, ?)$ 已经有大量的相关研究,包括Translation-based方法、Biline...

这是一个官方宣称比Argparser更好用的Python命令行开发工具包。

本篇汇总知识图谱补全任务(知识图谱链接预测任务)中的损失函数。因为链接预测任务是一个排序任务,因此loss的选择会影响最后排序的规则。

来源:ACL 2021
领域:KGQA
核心模型:TComplEx / TNTComplEx,BERT
🔗论文链接:arXiv
🔗代码:GitHub
文献依赖:
- Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings