SenseVoice icon indicating copy to clipboard operation
SenseVoice copied to clipboard

模型支持输出文本对应的时间戳吗

Open kirayomato opened this issue 1 year ago • 11 comments

我想要使用sensevoice用于生成字幕,按照示例代码得到模型输出中没有看到包含时间戳信息

kirayomato avatar Aug 14 '24 07:08 kirayomato

+1

rxy1212 avatar Aug 16 '24 01:08 rxy1212

+1

deepeye avatar Aug 22 '24 03:08 deepeye

+1

HaiFengZeng avatar Aug 26 '24 06:08 HaiFengZeng

+1

chendoit avatar Aug 29 '24 15:08 chendoit

+1

yumianhuli1 avatar Aug 31 '24 07:08 yumianhuli1

使用 sense voice 模型,生成字幕的例子如下

https://k2-fsa.github.io/sherpa/onnx/sense-voice/python-api.html#generate-subtitles

csukuangfj avatar Sep 07 '24 15:09 csukuangfj

对,怎么支持时间戳呢?生成srt

yuchen-gong avatar Sep 12 '24 14:09 yuchen-gong

对,怎么支持时间戳呢?生成srt

请看上面评论的链接,有现成的代码例子

csukuangfj avatar Sep 12 '24 14:09 csukuangfj

幕,按照示例代码得到模型输出中没有看到包含时间戳信息

只看到了命令行,没看到 Python 代码

wizardforcel avatar Oct 07 '24 23:10 wizardforcel

https://github.com/DracoUnion/BookerAutoVideo/blob/master/BookerAutoVideo/sencevoice.py

wizardforcel avatar Oct 08 '24 00:10 wizardforcel

在这个链接:https://github.com/k2-fsa/sherpa-onnx/blob/master/python-api-examples/generate-subtitles.py。然后我发现里面有个版权属小米的哈哈哈,使用雷军2023的演讲的开头部分

Yangyangchenc avatar Mar 11 '25 18:03 Yangyangchenc