Jim Wu
Jim Wu
忘了提醒2的代码是自己改过的,用于单色屏,在低速的micropython设备上改进后发现提速明显
除了换标点外,还有解决方案二。加换气,换完气就能读正确了😂: 他瞪大眼睛,突然看到了希望——[breath]前面有灯
找到问题了,离线编译时。必须把AS的module下的build目录完全删除掉,重新编译基座才正常,太诡异了
> > 找到问题了,离线编译时。必须把AS的module下的build目录完全删除掉,重新编译基座才正常,太诡异了 > > 大佬是怎么解决的呀,我打包调试基座后,使用的是云插件打包。安卓没有任何问题,ios 一直报错“当前运行的基座不包含原生插件[Agora-RTC-ChannelModule]”😨 预算有限,一直是本地打包。本地安卓的就那样处理了就没问题,本地IOS打包没有任何问题。
比如说这个文案: 哎呀呀~人家现在~是~没有奶茶喝的可怜小猫猫~喵~ 给定的情绪提示: 一位宫女极度夹声音在撒娇 使用声音复刻的模式进行朗读 尾音出现问题: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E5%B0%BE%E9%9F%B3%E5%87%BA%E9%97%AE%E9%A2%98.wav 高音问题1: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E9%AB%98%E9%9F%B3%E9%97%AE%E9%A2%981.wav 高音问题2: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E9%AB%98%E9%9F%B3%E9%97%AE%E9%A2%982.wav 哎呀呀~和喵~的发音很容易出现奇怪的问题 当声音克隆的音调较高时,容易出现高音的不自然感,甚至连续几个字都变成了类似机器人发音的状态 我刚用UE试了一下,更准确的说,是产生了UE的声音镶边的效果。看看是算法什么问题导致的。
> > 比如说这个文案: 哎呀呀~人家现在~是~没有奶茶喝的可怜小猫猫~喵~ > > 给定的情绪提示: 一位宫女极度夹声音在撒娇 > > 使用声音复刻的模式进行朗读 > > 尾音出现问题: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E5%B0%BE%E9%9F%B3%E5%87%BA%E9%97%AE%E9%A2%98.wav 高音问题1: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E9%AB%98%E9%9F%B3%E9%97%AE%E9%A2%981.wav 高音问题2: https://jim-aibuy-site.oss-cn-guangzhou.aliyuncs.com/%E9%AB%98%E9%9F%B3%E9%97%AE%E9%A2%982.wav > > 哎呀呀~和喵~的发音很容易出现奇怪的问题 > > 当声音克隆的音调较高时,容易出现高音的不自然感,甚至连续几个字都变成了类似机器人发音的状态 > > 我刚用UE试了一下,更准确的说,是产生了UE的声音镶边的效果。看看是算法什么问题导致的。 > >...
试了下,prompt音频已经很干净了,但是高音的时候还是会出现和声/镶边效果。目前只能采用低通滤波让镶边效果减弱一点,单独训练还没试过。目前都是试的一句话克隆方式。
版本:最新的版本也存在 条件:1)type=number 2)设置了maxlength
看看https://github.com/qi-hua/async_cosyvoice的项目,VLLM能跑通
> > 看看[https://github.com/qi-hua/async_cosyvoice的项目,VLLM能跑通](https://github.com/qi-hua/async_cosyvoice%E7%9A%84%E9%A1%B9%E7%9B%AE%EF%BC%8CVLLM%E8%83%BD%E8%B7%91%E9%80%9A) > > 这个试过啦,已经跑不通更新的模型了 model最新的0.5B可以用。但是那个项目是复制了一份推理代码,没有用最新基座的推理代码,反正能跑。等官方合并