SenseVoice icon indicating copy to clipboard operation
SenseVoice copied to clipboard

导出的onnx 模型比 正常的模型推理慢

Open DuBaiSheng opened this issue 1 year ago • 2 comments

使用export 导出的onnx格式的模型,并使用SenseVoiceSmall加载,批次推理的时长,比原本使用AutoModel加载的原始模型 要慢7倍。是什么原因呢,都是使用GPU加载推理。

DuBaiSheng avatar Sep 25 '24 06:09 DuBaiSheng

image

LauraGPT avatar Sep 25 '24 15:09 LauraGPT

我 也有这个问题,每次加载新的语音,推理时间都很长,cpu的话没事

Nicksooooo avatar Oct 10 '24 02:10 Nicksooooo