AlanCc1994

Results 3 comments of AlanCc1994

我尝试采用512点STFT,也就是帧长为10.6ms,频带3k以下不压缩,3k以上erb压缩频带,但是出现语音被消掉的情况,请问有什么需要注意的细节吗?

还有我发现训练集的合成方式不同,对模型泛化的影响非常大,您可以分享一下训练集的合成方法吗?

> Hi, your operation looks correct. It might be normal for the voice to be over-suppressed when the SNR is low, as this is a common issue with DNN-based SE....