hello-program
Results
1
comments of
hello-program
数据量多少呢,可以贴一些详细的信息,我用了直接蒸馏,rank=32,数据量大约2k(场景单一),感觉比你的好点,但是还是有些问题,我在调参,但更多的怀疑是直接蒸馏的方式能力不够,简单的mse 太简单粗暴了