SenseVoice icon indicating copy to clipboard operation
SenseVoice copied to clipboard

在使用VAD时,采样率对推理结果影响很大

Open bigeyefish opened this issue 1 year ago • 0 comments

音频采样率:44100 不使用 VAD:识别效果很准确 使用VAD:识别效果很差

音频采样率:22050 不使用 VAD:识别效果很准确 使用VAD:识别效果很准确

不确定是否和funasr有关,启动方式: m = AutoModel( model=model_dir, trust_remote_code=True, remote_code='./model.py', vad_model=vad_dir, vad_kwargs={"max_single_segment_time": 30000}, device="cuda:0", disable_update=True, ) 文件'./model.py' 中 inference 方法中 kwargs.get("fs") 是正确的值

bigeyefish avatar Oct 25 '24 02:10 bigeyefish