DEIM icon indicating copy to clipboard operation
DEIM copied to clipboard

torch.topk(scores.flatten(1), self.num_top_queries, dim=-1),这行表示什么意思

Open demuxin opened this issue 4 months ago • 2 comments

我是负责做模型推理的,我的理解是应该每个query只选择分数最高的那个类别, 如果进行flatten,选择top 300,那么一个query可能选择多个类别,即一个框对应多个类别,这好像没有意义。

demuxin avatar Sep 24 '25 08:09 demuxin

非常感谢你对我们工作的关注和感兴趣。 你真的很细心,关注的地方解法确实很tricky。 这个就是可以会相同的queries因为confidence scores有特别多很高的被反复取出来代表其他class objects,就是个bug。 这个实现是前辈们留下来的,我们也自己手动纠正了一下——发现mAP确实变低了——为了保证精度,我们沿用了这么个做法。说明预测出来的highest confidence scores是有代表意义的,有一些confidence很低的queries真没必要雨露均沾。

ShihuaHuang95 avatar Nov 01 '25 00:11 ShihuaHuang95

非常感谢你对我们工作的关注和感兴趣。 你真的很细心,关注的地方解法确实很tricky。 这个就是可以会相同的queries因为confidence scores有特别多很高的被反复取出来代表其他class objects,就是个bug。 这个实现是前辈们留下来的,我们也自己手动纠正了一下——发现mAP确实变低了——为了保证精度,我们沿用了这么个做法。说明预测出来的highest confidence scores是有代表意义的,有一些confidence很低的queries真没必要雨露均沾。

我想问一下如果想删掉这个topk该如何删除呢,我发现如果将图片大小改成320*320一下这个函数就会发生越界

asdddddasfwe avatar Nov 20 '25 13:11 asdddddasfwe