Jetson Wu

Results 6 comments of Jetson Wu

支持,我用的官方API没问题。

@mmxuan18 @maxgameone 这里有demo code for python https://github.com/aliyun/alibabacloud-bailian-speech-demo/tree/master/samples/speech-synthesizer/synthesize_speech_from_text_by_streaming_mode 我没有简单的local test示范代码,因为我都写到我产品的后端去了,good luck

> 输出不是输入吧? 质量的话torchaudio直出ogg效果差,出wav自己过ffmpeg编码会好很多 就是问的流式输入。比如接入到大模型的输出(现在llm都支持streaming output了,那我就直接把output stream给cosyvoice,实现低延时speech generation)

> 流式输入的话,对 LLM 输出做 combination 和 sentence segmentation 就好了。保证质量的话,首包延迟最低在

> 流式输入的话,对 LLM 输出做 combination 和 sentence segmentation 就好了。保证质量的话,首包延迟最低在

> 我在生产环境上了新版,被客户吐槽惨了……现在退回cosyvoice2在1月份的代码和模型了 1月份的版本更好吗?