xliucs

Results 15 comments of xliucs

你好,我这里没有遇到过这个错误,是否可以确认一下环境中包的版本能否对应上呢?

可以直接从作者给出的地址下载处理好的数据,也可以使用data_process下的dataset.py 和 process_data.py手动处理,先使用dataset.py处理成pickle格式,再使用process_data.py处理成pkl格式

您好,我在转数据的时候没有用这个with_phonetics,因为作者把字符序列转换到拼音序列的部分是在训练加载batch的时候做的,所以这个地方不做拼音转换没有影响,也就没有关注到您说的这个问题

不好意思,后来没有解决。。

@gotutiyan I'm aware of the issue you mentioned, but what's puzzling to me is that I set the batch size to 64 and the accumulate size to 4, after two...

I have the same question. Can someone provide some answers?

> 找到方法了: https://blog.csdn.net/xie1xiao1jun/article/details/148404334 @xxjwxc 抱歉之前的提问没有看到,我之前训练的时候底模应该是自动下载的,想问下你按照帖子中提到的方法训练的模型发音正常吗

> > 找到方法了: https://blog.csdn.net/xie1xiao1jun/article/details/148404334 > > 我用了这个方式去训练,但完全听不出在说中文 我之前成功训练了中英混合和英文单语的,中英混合的时候好像数据得比较平衡,然后我训得比较久,用他的默认配置,搞了八卡训,训练一天多

> > > > 找到方法了: https://blog.csdn.net/xie1xiao1jun/article/details/148404334 > > > > > > > > > 我用了这个方式去训练,但完全听不出在说中文 > > > > > > 我之前成功训练了中英混合和英文单语的,中英混合的时候好像数据得比较平衡,然后我训得比较久,用他的默认配置,搞了八卡训,训练一天多 > > 我训练了300轮,用了中日英的底模,中英文数据也是比较平衡的,每个都是一万多条,用的语言标识是ZH_MIX_EN。请问下你的配置是什么,谢谢 除了增加了卡数,语言标识就是ZH_MIX_EN,或者 EN,然后底模是代码自动下载那个,其他都是默认配置,你这个会不会是底模没用对(猜测...)

> > > > > > 找到方法了: https://blog.csdn.net/xie1xiao1jun/article/details/148404334 > > > > > > > > > > > > > > > 我用了这个方式去训练,但完全听不出在说中文 > > > > > >...