李子
李子
> 老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么 有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制
> > > 老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么 > > > > > > 有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制 > > 理论可行,可以联系我讨论 你好 已发到你的gmail里 [email protected] 上面的二维码过期了

> 通过代理访问 `localIP localPort` 没有。但有 通过代理访问 frps > > https://github.com/fatedier/frp/blob/184223cb2f240b844f90b3390645672d2225da88/conf/frpc_full_example.toml#L92 收到 希望未来的某一天能有这个功能,如果方便的话 thanks
是不是音频文件不够长?或者你可以发我文件看下
怎么报的 截个图看看
[filepath.zip](https://github.com/kslz/SoundLabel/files/10121444/filepath.zip) 亲测可用
> > [filepath.zip](https://github.com/kslz/SoundLabel/files/10121444/filepath.zip) 亲测可用 > > 这个srt跟我的不一样,是不是我的一行文本不能用?我的是WAV文件,然后src就是一行WAV中说出的中文声音的文字 srt是一种特定的字幕格式,不是单独的一句话,里面还包含了这句话的起止时间,格式参考样例
这个工具是用来精调裁切音频起止时间的,如果你已经有切出来的音频,就用不到这个工具了 [SpleeterGui](https://github.com/boy1dr/SpleeterGui)是用来分离人声和背景音乐用的
字幕就是SRT格式的字幕,例子是这样的 ``` 1 00:00:00,466 --> 00:00:01,200 哎呀 2 00:00:01,266 --> 00:00:04,566 Hello大家晚上好呀 3 00:00:04,566 --> 00:00:06,000 哈哈哇 4 00:00:10,500 --> 00:00:13,700 内内那些就是不要不要我了 ```