ACELY issues

Results 4 issues of


                                            ACELY

多核CPU利用率与并发性能问题

测试环境Rocky Linux 8 ## 简述：在两台配置不同的机器上分别编译并测试paraformer_cli，在fftw和openblas版本都相同的前提下，识别同一个30分钟的音频文件，结果发现CPU更强的电脑跑的反而更慢。可以看到两台机器的CPU都吃满了，机器A识别耗时75秒，机器B耗时120秒。 ## 机器A： - AMD R5 3500X （6核6线程）*1颗 - RAM 16G ![WX20230217-154014](https://user-images.githubusercontent.com/5640723/219598492-6e09394a-1bae-4069-9e53-c9ee762169f1.png) ## 机器B： - Intel E5-2680V4 （14核28线程）*2颗 - RAM 32G ![WX20230217-151208](https://user-images.githubusercontent.com/5640723/219598417-88952ac4-dff2-468b-8969-d09735a3e82c.png) ## 思考：...

升级提议：通过集成silero-vad强化VAD质量

Hi 非常感谢FastASR的易用性！我在测试识别长音频的时候，手头有些音频素材的背景噪音较大，导致webrtc的vad不能很好地进行端点判断。正巧之前测试过一个基于学习的vad效果很好，https://github.com/snakers4/silero-vad 不知道大佬是否有兴趣将其集成进来？

CPP版本多核性能测试分析

测试环境Rocky Linux 8，仅测试cpp版本结果（未测python版本） ## 简述：在3台配置不同的机器上分别编译并测试，在fftw和onnxruntime版本都相同的前提下，识别同一个30分钟的音频文件，分别测试不同onnx线程数量的表现。 ![image](https://user-images.githubusercontent.com/5640723/222062570-c13dc121-82e2-438a-a5d4-a45a2c0c75b3.png) 目前可以总结出大致规律： - 并非onnx线程数越多越好 - 2线程比1线程提升显著，线程再多则提升较小 - 线程数等于CPU物理核心数时效率最好实操建议： - 大部分场景用3-4线程性价比最高 - 低配机器用2线程合适

建议将底层从vits升级至Bert-VITS2

首先非常感谢您提供此项目，respect！ VITS出来也蛮久了，不过由于中文韵律方面一直不太理想，所以叫好不叫座，大家也一直不太实际运用起来。不过近期的https://github.com/fishaudio/Bert-VITS2 项目通过集成Bert很好地解决了中文韵律的问题，如果能升级到这个方案，那将是十分完美的。