DEIM torch.topk(scores.flatten(1), self.num_top_queries, dim=-1)，这行表示什么意思

我是负责做模型推理的，我的理解是应该每个query只选择分数最高的那个类别，如果进行flatten，选择top 300，那么一个query可能选择多个类别，即一个框对应多个类别，这好像没有意义。

Sep 24 '25 08:09 demuxin

非常感谢你对我们工作的关注和感兴趣。你真的很细心，关注的地方解法确实很tricky。这个就是可以会相同的queries因为confidence scores有特别多很高的被反复取出来代表其他class objects，就是个bug。这个实现是前辈们留下来的，我们也自己手动纠正了一下——发现mAP确实变低了——为了保证精度，我们沿用了这么个做法。说明预测出来的highest confidence scores是有代表意义的，有一些confidence很低的queries真没必要雨露均沾。

Nov 01 '25 00:11 ShihuaHuang95

非常感谢你对我们工作的关注和感兴趣。你真的很细心，关注的地方解法确实很tricky。这个就是可以会相同的queries因为confidence scores有特别多很高的被反复取出来代表其他class objects，就是个bug。这个实现是前辈们留下来的，我们也自己手动纠正了一下——发现mAP确实变低了——为了保证精度，我们沿用了这么个做法。说明预测出来的highest confidence scores是有代表意义的，有一些confidence很低的queries真没必要雨露均沾。

我想问一下如果想删掉这个topk该如何删除呢，我发现如果将图片大小改成320*320一下这个函数就会发生越界

Nov 20 '25 13:11 asdddddasfwe