Anmidy
Anmidy
你好,请问模型有日文的吗?我看现在项目上的模型是ljspeech的,用这个来转日文是会报错的,报错如下: RuntimeError: Calculated padded input size per channel: (5). Kernel size: (7). Kernel size can't be greater than actual input size 假如要自己训练日文模型,下载 JPSpeech-1.1.tar.bz2时失败,链接无法打开,有其他方式可以获取吗?目前只能下载 jsut_ver1.1 数据集,里面只有wav音频,下载对应的basic5000的lab标注信息,并没有metedata.csv文件
中文转日文音频
你好,我想输入中文,得到日文音频,我用以下方法尝试,音频生成结果并不是日文,仍然是中文,请问需要怎么修改? ` cosyvoice = CosyVoice('pretrained_models/CosyVoice-300M') prompt_speech_22k = load_wav('../../cross_lingual_jp.wav', 22050) for i, j in enumerate(cosyvoice.inference_cross_lingual('早上好。', prompt_speech_22k, stream=False)): torchaudio.save('cross_lingual_zh2jp.wav'.format(i), j['tts_speech'], 22050) ` cross_lingual_jp.wav 音频文件,是日文的“早上好”