Maybewuss
Maybewuss
**System (please complete the following information):** - OS: Mac os - Python version: 3.6 - AllenNLP version: latest - PyTorch version: 1.2 **Question** * I want to compute span-f1 with...
看了一下paddle2.0的介绍,弱化了lodtensor的概念,相关的一些api比如sequence_pool也不能使用了,升级到2.0后要怎么使用pgl呢?
OpenNRE中的代码中mask矩阵的第一行为[0, 0, 0],但是在你的代码中是[0, 0, 1],我觉得可能是你写错了?
您好,我在其他的qa任务中借鉴了span loss,但是发现加了以后收敛不了,这样正常吗?lr用的是3e-5。
原文还没有看完,刚看到数据构造这里。 k-sentence reader是对于一个有N条句子的篇章,构造{seq[1], ..., seq[N], seq[1] + seq[2], ..., seq[N -1] + seq[N, ...}这样的训练样本吗?这样的话样本数量会非常大,是n^2级别的,解码的时候不会特别慢吗?
想请教一下,发布的sft数据集中,mult_tools中 prompt 部分没有给定可使用的 tool 信息,和 single_tool 的数据有些差异 请问 sft 的阶段的数据格式具体是怎么组织的呢?