清风不染芳华

Results 5 issues of 清风不染芳华

我在自己的数据集上训练您的模型 (1)当tokens,apiseq,methname——>desc时,eval函数评估结果目前最好acc=0.672 mrr=0.413 map=0.413 ndcg=0.475 (2)当只考虑tokens——>desc时,eval函数评估结果目前最好acc=0.63 mrr=0.4099 map=0.4099 ndcg=0.462 添加methname和apiseq的特征,对eval评估提升不是很明显。不太理解why。 我之前在您的完整数据集上训练过一次模型,跑了2000epoch,但是search的结果感觉不太相关。

dcs->epcohStep=260000 top 10 ACC=0.767, MRR=0.32433587301587297, MAP=0.32433587301587297, nDCG=0.42961201846689157 top 5 ACC=0.6995, MRR=0.44343166666666667, MAP=0.44343166666666667, nDCG=0.5078651066901124 top 1 ACC=0.4761, MRR=0.4761, MAP=0.4761, nDCG=0.4761 数据集是codesearchnet中提供的Java数据,这是我训练过程达到的最优结果,poolsize设置的1000,达不到您之前说的结果要在0.9以上。 我将数据集按您所说划分为train和valid部分。感觉valid起的作用和test部分一样。 执行search的结果非常糟糕。我应该如何解决这个问题,使得search结果明显一些? 我之前用了您提供的epoch500来在大的codebase运行的时候,结果也是相关的比较少。我当时没找到原因,现在到我自己处理的时候,结果也这样,非常期待回复。

embedding = torch.cat((embedding, enc_output), 0) why cat embedding and enc_output? and my log has some problem. log: torch.Size([1, 64, 64, 64]) embedding value 100%|██████████| 2/2 [00:00