ACELY
ACELY
测试环境Rocky Linux 8 ## 简述: 在两台配置不同的机器上分别编译并测试paraformer_cli,在fftw和openblas版本都相同的前提下,识别同一个30分钟的音频文件,结果发现CPU更强的电脑跑的反而更慢。 可以看到两台机器的CPU都吃满了,机器A识别耗时75秒,机器B耗时120秒。 ## 机器A: - AMD R5 3500X (6核6线程)*1颗 - RAM 16G  ## 机器B: - Intel E5-2680V4 (14核28线程)*2颗 - RAM 32G  ## 思考:...
Hi 非常感谢FastASR的易用性!我在测试识别长音频的时候,手头有些音频素材的背景噪音较大,导致webrtc的vad不能很好地进行端点判断。正巧之前测试过一个基于学习的vad效果很好,https://github.com/snakers4/silero-vad 不知道大佬是否有兴趣将其集成进来?
测试环境Rocky Linux 8,仅测试cpp版本结果(未测python版本) ## 简述: 在3台配置不同的机器上分别编译并测试,在fftw和onnxruntime版本都相同的前提下,识别同一个30分钟的音频文件,分别测试不同onnx线程数量的表现。  目前可以总结出大致规律: - 并非onnx线程数越多越好 - 2线程比1线程提升显著,线程再多则提升较小 - 线程数等于CPU物理核心数时效率最好 实操建议: - 大部分场景用3-4线程性价比最高 - 低配机器用2线程合适
首先非常感谢您提供此项目,respect! VITS出来也蛮久了,不过由于中文韵律方面一直不太理想,所以叫好不叫座,大家也一直不太实际运用起来。不过近期的https://github.com/fishaudio/Bert-VITS2 项目通过集成Bert很好地解决了中文韵律的问题,如果能升级到这个方案,那将是十分完美的。