FunASR
FunASR copied to clipboard
docker cpu0.45时间戳bug
使用的cpu离线识别的镜像
使用文档默认配置
在说完一句话停顿几秒钟时,会将停顿的时间计算入说话的时间戳里。
实际上每一句话之间都有停顿5~15秒,但是时间戳是连续的
可以看到一个字的时间跨度有1秒以上
图片的第一列是返回结果中的开始时间戳,第二列是结束时间戳
Please upload your wav.
16k.zip 这是音频文档,来自48K采样率的PCM音频 @LauraGPT
在官方文档的在线使用网页中,itn的开启关闭会对时间戳有影响