FunCodec issues

(fix)Audio2Mel device inconsistent issue

2

set to cpu by default

Encodec模型中基于transformer的LMModel应该怎么训练和应用？

您好，我想请问一下，encodec原论文中，量化器后可选的LM模型，应该如何训练和应用，是需要在encodec模型的config文件中进行一系列配置，还是需要重新写一个train文件呢？如果需要重新写一个train文件的话，应该怎么写呢？非常期待您的解答！

lyt-git1129

not support Chinise-raw-txt input

1

bash demo.sh --stage 2 --model_name ${model_name} --output_dir results --text "你好" \ --prompt_text "one of these is context" --prompt_audio "demo/8230_279154_000013_000003.wav" not support， self.phoneme_tokenizer uses g2p_en to convert english word into phn，is...

alisakgg

NET/Plugin : dlerror=libnccl-net.so: cannot open shared object file: No such file or directory No plugin found (libnccl-net.so)

您好，当我在尝试多个gpu上训练时会遇到nccl库没有libnccl-net.so的报错，我已经确定我安装了版本为2.19.3的nccl库。而当我用单个gpu的训练时会遇到core dumped的问题。我目前用的是train-other-500 dev-other test-other这些数据集，请问是否对于这些报错有头绪

huyuelin

audio_codec-encodec-zh_en-general-16k-nq32ds640-pytorch模型，Huggingface和Modelscope下载的参数不同

Huggingface下载的model.pth md5sum是4285b02283940535f4636787dc801dda，Modelscope下载的model.pth md5sum是277ad4e9033a825d78622d691df47b82，对同一音频进行编码得到的code也不相同，不是同一模型吗？

yellowcomets

流式推理

模型可以做到流式推理吗？

HaiFengZeng

多机多卡

请问是否支持多机多卡呢，run.sh里有只支持了单机多卡配置

dataaug

Should the audio be normed to [-1, 1]?

1

Should the audio be normed to [-1, 1]?

FFYYang

Stage 1 can only be run on one gpu card 0

1

When i run stage 1 ``` bash encoding_decoding.sh --stage 1 --batch_size 16 --num_workers 4 --gpu_devices "0" \ --model_dir exp/${model_name} --bit_width 16000 \ --wav_scp input_wav.scp --out_dir outputs/codecs/ ``` It seems that...

Beilong-Tang

可以有类似encodec的 EncodecModel 这种加载模型的方式吗

xealml

FunCodec
FunCodec copied to clipboard

Metadata

(fix)Audio2Mel device inconsistent issue

Encodec模型中基于transformer的LMModel应该怎么训练和应用？

not support Chinise-raw-txt input

NET/Plugin : dlerror=libnccl-net.so: cannot open shared object file: No such file or directory No plugin found (libnccl-net.so)

audio_codec-encodec-zh_en-general-16k-nq32ds640-pytorch模型，Huggingface和Modelscope下载的参数不同

流式推理

多机多卡

Should the audio be normed to [-1, 1]?

Stage 1 can only be run on one gpu card 0

可以有类似encodec的 EncodecModel 这种加载模型的方式吗

← Metadata

Owner

Metadata

FunCodec FunCodec copied to clipboard

Metadata

← Metadata

Owner

Metadata

FunCodec
FunCodec copied to clipboard