FastASR icon indicating copy to clipboard operation
FastASR copied to clipboard

升级提议:通过集成silero-vad强化VAD质量

Open acely opened this issue 2 years ago • 5 comments

Hi 非常感谢FastASR的易用性!我在测试识别长音频的时候,手头有些音频素材的背景噪音较大,导致webrtc的vad不能很好地进行端点判断。正巧之前测试过一个基于学习的vad效果很好,https://github.com/snakers4/silero-vad 不知道大佬是否有兴趣将其集成进来?

acely avatar Jan 31 '23 04:01 acely

好的,感谢。我先测试和评估一下

chenkui164 avatar Jan 31 '23 07:01 chenkui164

要是噪声大的话,是不是可以先将原始音频过一组低通滤波,滤除高频的噪声?

chenkui164 avatar Feb 01 '23 03:02 chenkui164

要是那种纯白噪声或者粉噪声就好办了,我套个滤镜就能解决。实际情况是,很多场景的噪声是环境随机噪声,比如:办公室嘈杂声、背景电视节目声、窗外汽车噪声、鸟鸣声、风噪声等。

acely avatar Feb 01 '23 04:02 acely

说实话 还是用硬件的靠谱

cgisky1980 avatar Feb 06 '23 06:02 cgisky1980

https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/audio/silero-vad/cpp
飞桨的FastDeploy 把 silero-vad 搞进去了

cgisky1980 avatar Feb 11 '23 08:02 cgisky1980