FunASR
FunASR copied to clipboard
请问vad模型是否支持 实时音频流的语音端点检测? 为什么每次检测音频活动端点都是'value': [[0, 1180]]}]
is_final是不是设置成True了?
佬可以分享一下最后是怎么解决的这个吗,我想用这个vad模型实现实时音频流端点检测,但是没找到example