xiaoxi91
xiaoxi91
hi, when running the run_fsmn_ivector.sh , the log/iter00.initial.log show "steps/nnet/train_faster_scheduler.sh: line 89: nnet-train-fsmn- streams: command not found" .how can I solve it?
于老师,您好 我在使用项目中提供的训练脚本得到的模型性能比您开源的模型性能要差1~1.5个点.请问开源模型是否在训练时进行了别的参数调优,还是仅仅是因为数据shuffle不同导致的? 此外,还想请教一下,如果我们不需要输出人脸关键点预测,那么在训练时删除人脸关键点,对于人脸检测性能会有帮助吗?
Is the Test-2023 dataset a publicly available test set? If so, could you please provide a download link? Thank you very much!
现象: 使用convert.py 脚本做模型转换,如果设置为 rk3576 则无报错,但设置为rk3588会报错 完整log为: I rknn-toolkit2 version: 2.3.0 --> Config model done --> Loading model I Loading : 100%|████████████████████████████████████████████████| 160/160 [00:00 Building model I OpFusing 2 : 100%|██████████████████████████████████████████████|...
* examples/whisper/export_onnx.md 里写不支持large-size, 请问是芯片本身不支持某些维度的NN,还是这个转换脚本不支持large? * examples/whisper/python/whisper.py 必须指定task为 en 或zh, 但whisper是有语种识别性能,应该是可以直接输入音频,自动判断音频语种,然后输出对应语种的转写结果。这个是芯片本身不支持吗?还是脚本不支持,需要开发者自己调整脚本?请问有做过这方面的尝试吗?