atfa

Results 11 comments of atfa

Linux下面我也遇到这个错误了,method明明就是list,但是却没有执行67行的return。 MacOS下正常登陆。

文件太大,比如超过50M就会失败。大家都遇到这个问题了。

的确如此,超过50m,就失败。百度云那边可能超过50M的文件又一些限制吧。

> @qinyang1980 andy 感觉可能不大,flutter要是支持js 那估计有戏。 我就是用flutter的,但是项目需要做小程序,才找到taro。flutter 要是支持编译成小程序和H5,那就牛大了。很期待,但是希望渺茫。flutter这边有一个butterfly , https://github.com/yjbanov/butterfly 可以去参考一下。

指定whatever用中文环境就好了。 $ cat /opt/Whatever/ever.sh export LANG=zh_CN.UTF-8 export LANGUAGE=zh_CN export LC_CTYPE=zh_CN.UTF-8 export LC_NUMERIC="zh_CN.UTF-8" export LC_TIME="zh_CN.UTF-8" export LC_COLLATE="zh_CN.UTF-8" export LC_MONETARY="zh_CN.UTF-8" export LC_MESSAGES="zh_CN.UTF-8" export LC_PAPER="zh_CN.UTF-8" export LC_NAME="zh_CN.UTF-8" export LC_ADDRESS="zh_CN.UTF-8" export LC_TELEPHONE="zh_CN.UTF-8" export LC_MEASUREMENT="zh_CN.UTF-8"...

我也试了这个zero shot功能,我生成的不是0秒的噪音,而是16秒的噪音。我可以确信我在txt_smp中输入了正确的文字。但“四川美食确实以辣闻名……”这段话生成的结果还是16秒的噪音。系统运行也没有报错。 后来不断尝试上传自己的wav文件来测试,我发现也有可以生成语音而不是噪音的情况。但是只有7、8秒的时间,后面又是噪音了。但是这些wav文件通过CosyVoice都可以成功克隆。 总结一下,ChatTTS的zero shot对音色文件要求极高。建议官方推出一个教程。

> > 我发现也有可以生成语音而不是噪音的情况。但是只有7、8秒的时间,后面又是噪音了。 > > 一般来说,这是由于你的txt_smp不符合模型的规范导致的。我知道你的转写可能按人类阅读是正确的,但是模型不一定认识。如果可以的话,可以发一下wav文件和对应的转写,方便我们测试。 可以的。下面是我自己的录音和模型输出的wav文件: [zero_shot_bug_report.zip](https://github.com/user-attachments/files/16479432/zero_shot_bug_report.zip) 下面是所用到的代码: ```py chat = ChatTTS.Chat() if chat.load(): print("Models loaded successfully.") else: print("Models load failed.") sys.exit(1) spk_smp = chat.sample_audio_speaker(load_audio("input.wav", 24000)) print(spk_smp) params_infer_code =...

> @atfa 音频只取前 10s, 文本用 > ``` > 从 博 弈 论 的 定 义 中 我 们 知 道 [uv_break] , 双 方 [uv_break] 或 者 多 方 [uv_break]...