flysssss

Results 9 comments of flysssss

Maybe the Input tensor shape is fixed。when i change the num_frames from 14 to 25 in yaml file,Error in background is Shape mismatch, can't divide axis of length 28 in...

我生成了2s的视频,但是我不清楚它的原理是什么 首先我更换了SVD的模型,改成svd_xt 然后修改config_motionctrl_cmcm.yaml文件里面的 num_frames: 25 num_steps: 30 max_scale: 3.0 min_scale: 1.5 然后是app.py文件里面n = 16改成n = 25,for循环也要改掉;num_frames = 25 num_steps = 30 然后并不是每次都会生成成功,在报错时重启服务,前端gradio页面不刷新,直接点生成,会生成2s的视频。但是帧率默认是10不清楚原因。

https://github.com/TencentARC/MotionCtrl/assets/100752067/9dca1356-8535-461d-acfd-0f72f6060006

当我第一次生成成功时,修改图片或者相机控制参数后台就会报错,RuntimeError: Sizes of tensors must match except in dimension 2. Expected size 25 but got size 16 for tensor number 1 in the list. 但是当我重启服务后,继续按照前端刚刚报错的相关参数去生成,它就会生成成功。

生成报错是因为 camera poses选择Provided Complex Camera Poses,如果是Basic Camera Poses是可以连续生成成功的,Custom Camera Poses选择Basic Camera Poses也是可以的。生成视频帧率固定10的原因是因为在motionctrl_cmcm_gradio.py里面写死了。

修改一下hydit_app.py源文件,设置一个随机数,random.randint(1, 1_000_000_000),每次生成时采用随机数做seed。可以界面上用Checkbox当开关控制,这样也能手动输入。

@Jiangfeng-Xiong 你好,目前在V100上1024x1024基本1个step1s,100step差不多100s。有其他加速的方法吗,或者后续出量化版模型?因为V100不支持flashatten加速,如果换到H100上100step,1024x1024分辨率出图能到10s左右吗?

这个文件应该是tensort的某个plugin层实现吧,不清楚具体实现。