MiniCPM-V icon indicating copy to clipboard operation
MiniCPM-V copied to clipboard

关于语音克隆的评估

Open ZhouFangru opened this issue 10 months ago • 3 comments

是否可以提供端到端语音克隆评测代码,以支持复现官方发布的指标(SIMO)

ZhouFangru avatar Mar 12 '25 05:03 ZhouFangru

我使用https://github.com/BytedanceSpeech/seed-tts-eval?tab=readme-ov-file提供的音色评估代码,在数据集Seed-TTS test-zh上得到cosyvoice得分74.7(与您们发布的指标一致),但测试minicpm-o得分只有42。并且测试克隆任务时生成的音频音色的确不太像。

ZhouFangru avatar Mar 13 '25 13:03 ZhouFangru

您好,请问这里的 seedtts test-zh SIM-o 42的推理代码是如何的?感谢!

bokesyo avatar Apr 27 '25 04:04 bokesyo

请问您可以按照我们的回复提供进一步的信息么?如果没有推进,我们可能会在几天后关闭这个issue。

tc-mb avatar Aug 14 '25 06:08 tc-mb