Jetson Wu comments

Results 6 comments of


                                            Jetson Wu

@mmxuan18 @maxgameone 这里有demo code for python https://github.com/aliyun/alibabacloud-bailian-speech-demo/tree/master/samples/speech-synthesizer/synthesize_speech_from_text_by_streaming_mode 我没有简单的local test示范代码，因为我都写到我产品的后端去了，good luck

有朋友试过流式输入吗？首包延迟和质量怎么样？

> 输出不是输入吧？质量的话torchaudio直出ogg效果差，出wav自己过ffmpeg编码会好很多就是问的流式输入。比如接入到大模型的输出（现在llm都支持streaming output了，那我就直接把output stream给cosyvoice，实现低延时speech generation）

有朋友试过流式输入吗？首包延迟和质量怎么样？

> 流式输入的话，对 LLM 输出做 combination 和 sentence segmentation 就好了。保证质量的话，首包延迟最低在

有朋友试过流式输入吗？首包延迟和质量怎么样？

> 流式输入的话，对 LLM 输出做 combination 和 sentence segmentation 就好了。保证质量的话，首包延迟最低在

流式推理效果疑问

> 我在生产环境上了新版，被客户吐槽惨了……现在退回cosyvoice2在1月份的代码和模型了 1月份的版本更好吗？

Jetson Wu

是否支持双向流式输入和输出？

是否支持双向流式输入和输出？

有朋友试过流式输入吗？首包延迟和质量怎么样？

有朋友试过流式输入吗？首包延迟和质量怎么样？

有朋友试过流式输入吗？首包延迟和质量怎么样？

流式推理效果疑问

Jetson Wu

是否支持双向流式输入和输出？

是否支持双向流式输入和输出？

有朋友试过流式输入吗？首包延迟和质量怎么样？

有朋友试过流式输入吗？首包延迟和质量怎么样？

有朋友试过流式输入吗？首包延迟和质量怎么样？

流式推理效果 疑问

流式推理效果疑问