unl1002

Results 2 issues of unl1002

In my opinion, authors define L_{vlb} = L_0 + ... + L_T, not L_t. Thus, they may calculate the vlb loss with scale factor T (self.num_timestep). _Originally posted by @yhy258...

hi wt,非常感谢你在点云扩散模型方向的出色工作!我阅读了你的论文和代码实现,受益匪浅。最近在深入研究 PUDM 项目时,我遇到了一些问题,希望能向你请教。 **1. 关于gamma的问题** 我发现训练和推理时都会有个gamma参数去乘(预测的噪声+稀疏点云midpoint_interpolate后的结果i) https://github.com/QWTforGithub/PUDM/blob/623649a61d2d2e218b50ec120eb6a31274621144/pointnet2/models/pointnet2_with_pcld_condition.py#L620-L621 https://github.com/QWTforGithub/PUDM/blob/b7e3f11e99667a06a6fcafa3d5eb42ca573d5b34/pointnet2/util.py#L493-L495 我想知道为什么这里Nnet预测出的噪声还需要与插值结果 i 相加,在计算mse时也是z与out,似乎的扩散模型的计算过程不一样,gamma 的设置(代码中为 0.5)在整体预测中的物理或建模意义是什么?有没有尝试过其他值,或者它是否具有调参上的敏感性? **2.关于采样倍数label** 在训练阶段,无论是 PUGAN 还是 PU1K 数据集,所有点云的 R 倍数标签都是固定的 4,但代码中仍然对其进行了 embedding(256,128),并作为条件输入给到 CNet 进行建模 https://github.com/QWTforGithub/PUDM/blob/b7e3f11e99667a06a6fcafa3d5eb42ca573d5b34/pointnet2/models/pointnet2_with_pcld_condition.py#L265-L266 为什么训练时仅使用了一个固定的 R=4,还能在推理时泛化到不同label并表现出较好的效果 **3.网络的尺度自适应**...