xx
xx
作者您好,由于我代码基础比较差。我有一些问题想问一下。第一 data_split.py是必须的吗?第二,我运行这个程序得不到您VCTK里的所有文件。第三,root_dir='/ceph/home/yangsc21/Python/VCTK/wav16/spmel_100_crop_cat/', feat_dir='/ceph/home/yangsc21/Python/VCTK/wav16/raptf0_100_crop_cat/',这两个文件是如何得到的呢?希望能得到您的回复,谢谢!
作者您好,我在训练时碰到了这个问题,可以指点一下吗? Traceback (most recent call last): File "main.py", line 81, in main(config) File "main.py", line 32, in main solver.train() File "/data/SRD-VC-master/My_model/solver.py", line 300, in train x_identic, mel_outputs_postnet, spk_pred, content_pred, pitch_predict...
(Pdb) print(code_exp_1.shape) torch.Size([16, 192, 16]) (Pdb) print(code_exp_2.shape) torch.Size([16, 192, 2]) (Pdb) print(code_exp_3.shape) torch.Size([16, 192, 64]) (Pdb) print(code_exp_4.shape) torch.Size([16, 256]) (Pdb) print(code_exp_4.unsqueeze(1).expand(-1, 128*3, -1).shape) torch.Size([16, 384, 256]) 这是我断点的打印的结果
这个我试了,还是不行。超参数里没有MAX_LEN,您说的是max_len_pad = 384吗
Traceback (most recent call last): File "main.py", line 81, in main(config) File "main.py", line 32, in main solver.train() File "/data/SRD-VC-master/My_model/solver.py", line 246, in train x_real_org, emb_org, f0_org, len_org = next(data_iter)...
我进行了code_exp_4.unsqueeze(1).expand(-1, 192, -1)这个尝试,然后将上面的报错改成了left = np.random.randint(0, abs(len(aa) - len_crop[0]), size=2),可以训练起来了,但是不知道可以这样吗
作者您好,demo.py和inferen.py里面所使用的gpu的id是不能修改吗? Traceback (most recent call last): File "demo.py", line 108, in x_identic_val = Generator_F( File "demo.py", line 83, in Generator_F _, mel_, _, _, _ = G2(content, pitch, rhythm, mel_2,...
谢谢回复,已经解决了。
作者您好,我想问一下valid_path = "/ceph/home/yangsc21/Python/autovc/SpeechSplit/assets/test_mel/test.pkl"这里您是使用了两条语句做测试还是说将3位测试说话人的所有语句都用上去了?我一开始是将三个说话人的每个说话人所有语句拼接在一起,但似乎不可行。
如果我需要用中文训练,对梅尔频谱的提取需要做改变吗?