Lian Zhou

Results 11 comments of Lian Zhou

同期待纯网关版,裁剪掉计费、充值、额度、渠道、多用户之类的管理,突出日志、统计、审计的功能,打造一个纯粹的应用系统和大模型之间的中间应用(中台)。这个非常有实战价值,能够大幅度降低应用系统更换模型的代价——既不用修改应用系统访问大模型的代码,更不用去学习新模型 API的变化。

日志是不是可以像常规做 service 的软件那样用传统 log 文件的方式存储,需要分析的时候再用专门的软件来做?

> > > 我也建议保留渠道这个功能,每个渠道的配置都不太相同,所需的密钥也不一样。 只是现在渠道分配到组,在将组分配到用户在这种场景下可能会有点繁琐。既然要裁剪掉计费、充值、额度等功能,看可不可以提供一个新功能简化这个过程。比如提供一个新的接口(兼容openai),传入的不再是令牌,而是我的登陆访问令牌,直接访问到每个渠道。最后在通过【优先使用“优先级数值”高的渠道,相同优先级随机选择渠道】这一个策越来使用渠道。之前的功能和新功能不冲突。 > > > ``` > > > //sqlite > > > var channels Channel{} > > > DB.Order("priority DESC, RANDOM()"). > > > Find(&channels) >...

这个接口功能是支持传入对话历史的,所以你可以自己在客户端维护上下文信息的

两个平台合成结果的显著区别是Mac上用CPU合成的声音更加圆润、饱满,而Linux下GPU合成的语音经常有明显的机器金属音的感觉。

> load_jit load_trt都置false,如果还有差异那就是pytorch cpu/gpu推理的差异 load_jit=False, load_trt=False, fp16=False,这三个都关了,模型和代码都是最新的,但还是差异明显。尝试了13个不同的原始声音,在Mac CPU上得到的结果都是非常圆润完美,在Linux GPU上的结果差异明显,不仅有“金属音“的感觉,而且有那种劣质耳机模振动的感觉(我是把所有wav文件放在一台机器上用相同的耳机听的) 因为差异过于明显了,所以很是不甘心,但实在不知道怎么解决。

大家稍等,等我把不同对比的结果放到网盘给大家鉴定。

在这里我放了6组语音:https://pan.baidu.com/s/1uYMmZhuRwPhtYivqM5r8ew?pwd=we7k GPU合成的结果有两个问题:有的音色合成的语音“稳定”的会在最后几秒钟乱掉,另外就是质量有明显的不同,CPU生成的更“干净”、更圆润。

> 听了,hift.pt和推理代码不适配就是这样机械音问题,CPU和GPU两边推理代码不完全一致吧,检查下版本 确实,CPU这边的推理代码不是最新的,大致就是4、5天前的版本,模型不记得是哪天下的了。 GPU这边,因为发现有问题,今天凌晨,我从魔搭和Github分别下载了最新的,现在听到的这些有机械音,就是之后生成的。 刚刚,CPU这边我同样又下载了最新的推理代码和模型数据,执行的效果仍旧很好。 按照您的指导,那就是最新的代码里面GPU推理和当前魔搭的上的模型数据不匹配么?

唉,我用28个不同音色范例文件做测试,每个音色用10条不同风格的文本做TTS,分别在Mac的CPU(M1 Pro)和Linux的GPU(Nviaid 4060)上,都是用最新的推理代码和模型数据,并且在Linux上load_jit为true和false分别测了两遍,最后得到三批结果,每批28组,每组10条语音。Mac 上CPU得到的结果都非常完美。Linux上的2批56组只有5组是成功的,其中不同批次有两组的音色相同。其他不成功的那些组里面或多或少有各种问题,通常是四种情况:(1) 纯粹的白噪声,没有任何有意义的内容;(2)全部为质量差到无法接受的电音;(3)前面正常,到后面出现质量差到无法接受的电音;(4) 前面正常,后面出现纯粹的白噪声。 另外成功的5组(3种音色)里面,有一种音色是我用CosyVoice-300M-SFT里面的“中文女”这个音色合成后作为因为范例的,它在Linux的两批测试中表现都很好。不过那个“中文男”音色不行,没法通过测试。 当然,GPU成功合唱的那些语音的质量都非常好。也就是说,现在要么就质量很好,要么完全没法接受。 还有,具体哪条会在使用哪个音色的时候出现什么样的问题,并没有体现出明显的规律。 现在看起来,不知道是新的模型还是推理代码,在使用GPU的时候,应该是存在问题的,下面附上我测试的10条文本: sentence_list = [{ 'name': '介绍', 'text': '长城是中国古代最伟大的建筑之一,绵延数千公里,被誉为世界七大奇迹之一。' },{ 'name': '客服', 'text': '您好,欢迎致电客服中心,请问有什么可以帮您的么?' },{ 'name': '全音', 'text': '北方白鹭飞来,穿过山川河流,静静落在湖边青草地上。' },{ 'name': '组合',...