vedbobo
vedbobo
> cesium引擎需要配合修改逻辑,使用 https://github.com/huiyan-fe/cesium 这个cesium Cesium文件夹里的Cesium.js是修改后的吗,还是官网的吧!不行呀!
I saw in the video demo that the file coordinates were multiplied by the image size, which seems to work.
感谢! 我之前没有转base64,现在转了后还是返回的是空,可能这个模型不能这样弄。不用ollama,单独调这个模型可以。 试了几个图片,发现有的图片可以识别出来,有的不行,还是模型原因。
> 文件结构: D:\CosyVoice ├── cosyvoice │ ├── **init**.py │ └── cli │ └── cosyvoice.py ├── webui.py └── pretrained_models\ 我 cosyvoice文件夹里怎么没有这三个文件。是哪一步新增的?
> spk_id "中文女" 怎么来的 好兄弟 有角色列表['中文女', '中文男', '日语男', '粤语女', '英文女', '英文男', '韩语女'] cosyvoice.list_available_spks()
> 使用fastapi中的client.py脚本使用sft模式文本生成语音,录音文件中会缺少最后一两个字,比如下面这个语句,就会丢失‘行’字,请问有谁知道为什么吗? python client.py --port 50000 --mode sft --tts_text "创新永无止境,发展永不停步。湖南正以创新为引领,在高质量发展的道路上阔步前行。" --spk_id "中文女" --tts_wav "output2.wav" 我也是最后两个字缺失了!用的CosyVoice-300M-SFT,官网的示例。