FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

iic/speech_campplus_speaker-diarization_common可以直接在funasr中使用吗

Open Cauchy-1210 opened this issue 7 months ago • 5 comments

Image 如题

Cauchy-1210 avatar Jun 24 '25 08:06 Cauchy-1210

   这是我的,可以参考一下

model = AutoModel( model="iic/speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch", vad_model="iic/speech_fsmn_vad_zh-cn-16k-common-pytorch", punc_model="iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch", spk_model="iic/speech_campplus_sv_zh-cn_16k-common", vad_kwargs={ "max_single_segment_time": 3000, "max_end_silence_time": 100 }, ncpu=8, device=device_id )

liaorihu avatar Jul 02 '25 04:07 liaorihu

非常感谢!

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2025年07月02日 12:32 | | 收件人 | @.> | | 抄送至 | Cauchy @.>@.> | | 主题 | Re: [modelscope/FunASR] iic/speech_campplus_speaker-diarization_common可以直接在funasr中使用吗 (Issue #2565) | liaorihu left a comment (modelscope/FunASR#2565) 这是我的,可以参考一下

model = AutoModel( model="iic/speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch", vad_model="iic/speech_fsmn_vad_zh-cn-16k-common-pytorch", punc_model="iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch", spk_model="iic/speech_campplus_sv_zh-cn_16k-common", vad_kwargs={ "max_single_segment_time": 3000, "max_end_silence_time": 100 }, ncpu=8, device=device_id )

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Cauchy-1210 avatar Jul 02 '25 04:07 Cauchy-1210

请问这个device=device_id是什么意思,我可以在gpu上运行吗

Cauchy-1210 avatar Jul 02 '25 09:07 Cauchy-1210

   这是我的,可以参考一下

model = AutoModel( model="iic/speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch", vad_model="iic/speech_fsmn_vad_zh-cn-16k-common-pytorch", punc_model="iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch", spk_model="iic/speech_campplus_sv_zh-cn_16k-common", vad_kwargs={ "max_single_segment_time": 3000, "max_end_silence_time": 100 }, ncpu=8, device=device_id )

这个spk模型应该不能指定人数吧。 diarization那个可以指定,但是funasar确实不支持:

#如果有先验信息,输入实际的说话人数,会得到更准确的预测结果
result = sd_pipeline(audio_file, oracle_num=2)

CHEFRA avatar Jul 29 '25 06:07 CHEFRA

在docker中可以使用吗?

ye7love7 avatar Oct 28 '25 08:10 ye7love7