aloxc
aloxc
有以下问题, 1.把一句不长的台词分割成两句,而且分割后还重。。比如说音频中的“我给你做碗西红柿鸡蛋面啊” 给我识别成两句,第一句是“我给你做个鸡蛋,”,第二句是“西红柿面啊,” 2.把两句台词放一起,而且这两句的时间间隔超过了10秒,比如“加油加油”和“回来了”,识别成“加油加油回来了” 3.字幕格式不正确,正确格式是两句字幕中间有空行,但是没有 4.识别出来乱加没有的台词进去, 5.识别出的中文效果太差。标准的普通话。 6.其它。 愿越来越好吧。
如题,最近是有该项目的时候,部分视频会出现标题描述的错误,通过跟踪源代码发现main.py中的 self.fps = self.video_cap.get(cv2.CAP_PROP_FPS)得到的帧率是1,实际视频的帧率是24.45,而使用ffprobe获取的帧率是正确的, 可以通过下面这个函数获得正确的帧率 ``` def get_video_fps_ffmpeg(video_path): command = [ 'ffprobe', video_path ] result = subprocess.run(command, capture_output=True, text=True, encoding='utf-8') output = result.stderr for line in output.split('\n'): if 'fps' in...