Jercas Ety

Results 2 issues of Jercas Ety

- 生成数据:均使用的测试样例(video: sun.mp4 | audio: yongen.wav); - 使用脚本:realtime_inference,已提前完成avater数据的抽取,仅仅进行语音片段生成; - 问题1:202帧的片段,日志显示平均fps为77.5 - 此处为什么每四帧处理一次,且第一帧的处理速度要远远慢于后者(10 >> 100)? - 问题2:按fps推算,202处理完总共应只需几秒钟,但实际打点的耗时为23s(未统计后续的帧+音频合成视频的时间)

### Reminder - [x] I have read the above rules and searched the existing issues. ### System Info - `llamafactory` version: 0.9.4.dev0 - Platform: Linux-6.1.0-18-amd64-x86_64-with-glibc2.31 - Python version: 3.10.19 -...

bug
pending