Yansong Peng

Results 30 comments of Yansong Peng

还有就是请问一下o2o matching的结果为什么还需要merge到o2m上,o2o一般代表candidate里最好的,不是应该必然出现在o2m里嘛

> 你好~请问您说的是与DINO结合的实验吗,我们是在 Deformable-DETR++ 的基础上加入了 O2M (-> MS-DETR) 和 DINO 的 CDN 模块训练的。 我在DINO的基础上额外引入O2M,将CA和SA调换(impl.c) ,共用同一组Heads将CA和FFN的输出分别编码成Preds。并保证了只对原始的300个query(不对denoising queries) 进行O2M监督,在前几个epoch确实有显著收益(这可能与额外的监督有关)。但在中后期开始性能不如原始的DINO。是因为超参或者其他什么地方没注意导致的嘛?

> > 你好~请问您说的是与DINO结合的实验吗,我们是在 Deformable-DETR++ 的基础上加入了 O2M (-> MS-DETR) 和 DINO 的 CDN 模块训练的。 > > 我在DINO的基础上额外引入O2M,将CA和SA调换(impl.c) ,共用同一组Heads将CA和FFN的输出分别编码成Preds。并保证了只对原始的300个query(不对denoising queries) 进行O2M监督,在前几个epoch确实有显著收益(这可能与额外的监督有关)。但在中后期开始性能不如原始的DINO。是因为超参或者其他什么地方没注意导致的嘛? 我好像找到一个可能的原因,我再继续跑几组实验试试,谢谢您

我觉得最大的可能是loss的权重需要调整。如果单纯地加入MS, 而不调参,loss会大很多倍,这显然是不合理的。但官方公布的代码似乎和原本的defomable DETR超参数一样,建议你们可以适当降低loss权重。

https://github.com/Peterande/D-FINE/blob/f5315882328b2ac374060dfa1d3c4548c22be543/src/zoo/dfine/dfine_decoder.py#L253 This is caused by NaN occurring due to FP16 precision overflow during AMP training. I believe the model produces excessively large values in an attempt to fit more complex...

The tensor printed in your bug logs : https://github.com/Peterande/D-FINE/blob/f5315882328b2ac374060dfa1d3c4548c22be543/src/solver/det_engine.py#L67-L77

您好,请问v2有投稿意向吗?能得知大概会在什么时间范围内放出嘛? 我也有意向将RT-DETR这个IP做下去,像YOLO一样形成V2,V3....并且也取得了一些成果, 但似乎在您的官方v2发布前我无法擅自进行这种延续性的命名qwq

> > 您好,请问v2有投稿意向吗?能得知大概会在什么时间范围内放出嘛? 我也有意向将RT-DETR这个IP做下去,像YOLO一样形成V2,V3....并且也取得了一些成果, 但似乎在您的官方v2发布前我无法擅自进行这种延续性的命名qwq > > @Peterande 非常抱歉本`issue`名字给你带来的困扰 > > 另外也非常高兴社区有`RTDETR`方向的优化,非常期待成果。( 这也是我们开源的目的之一 ) > > 1. `RTDETRv2`是我们刚发布`v1`之后的产物,是我们对`RTDETR`的优化版本(主要是训练策略and部署方面的优化,模型结构和`v1`是一致的,可能叫`v1.5`更合适)。**所以从创新的的角度,应该不会和你有冲突** > 2. `RTDETRv2`模型本来是有开源的计划,但是由于缺少人手的问题目前未能开源,也未形成技术报告/论文(模型限内部使用,但是不排除之后会直接开源代码) > 3. 鉴于本`discussion (comming soon)`已经存在的事实,**建议你直接用`v3`,但是论文不需要和`v2`进行比较** > > 如果有疑问和其他想法 欢迎继续讨论...

You can try using the latest TensorRT and ensure that you have exclusive access to the entire server bandwidth. We often encounter issues with unstable latency on certain server platforms,...

It depends on whether the class starts at 0 or 1. If the ids in your dataset start at 1, you can remap them, or just set the class to...