FastASR 是否支持英文en呢？

是否支持英文en呢？

Jan 30 '23 07:01 shen2009fei

只支持中文或者中英文，不支持英文，如果有英文需求可以使用kaldi2里面提供的模型，https://github.com/k2-fsa/icefall

Jan 30 '23 08:01 chenkui164

只支持中文或者中英文，不支持英文，如果有英文需求可以使用kaldi2里面提供的模型，k2-fsa/icefall

兄弟我用paraformer 的方式，测试英文字母 I 和其他单词没有空格分开。测试了两个wav文件都是这样，能讲一下在哪里修改能解决这个问题？ Result: "Iknocked at the door on the ancient side of the building". Result: "have you got any cheese may Ihelp you".

Jan 30 '23 10:01 shen2009fei

能提供一下音频么？我debug一下啊，这里确实没怎么测试过，需要修改https://github.com/chenkui164/FastASR/blob/main/src/lib/Vocab.cpp 里面的vector2stringV2这个函数

Jan 30 '23 10:01 chenkui164

wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav 这个

Jan 30 '23 10:01 shen2009fei

好的，可能需要等两天了，我把这部分代码重构一下，当时偷懒没考虑的太周全

Jan 31 '23 02:01 chenkui164

@shen2009fei 已经修复这个bug,可以抽空试试了

Feb 01 '23 01:02 chenkui164

@shen2009fei 已经修复这个bug,可以抽空试试了

兄弟感谢修复，非常好用感谢。请问这个支持服务的形式吗？这样便于前端调用。

Feb 04 '23 09:02 shen2009fei

不支持，这个项目只做推理过程，接口部分需要自己实现

Feb 04 '23 14:02 chenkui164

有段音频识别，know 和后面的Is 合并在一起了。

Two two two it's one o'clock have you ever been to china what's your name I don't knowIs that okay sure pretty cool newRecord 2.wav.zip

Feb 11 '23 15:02 shen2009fei

临时的解决方案是将代码 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }

由于里面涉及到VAD分句和中英文混合的问题，我还没想好怎么改，临时先怎么用吧

Feb 12 '23 01:02 chenkui164

临时的解决方案是将代码%3B-,cout%20%3C%3C%20msg,-%3B) while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }

由于里面涉及到VAD分句和中英文混合的问题，我还没想好怎么改，临时先怎么用吧

先这么解决了，我部署到服务器发现服务器识别比我本地还慢1秒:) . 主要是用paraformer的代码。我发现要么paraformer的模型如果剪小就可以部署到移动端，或者推理利用多线程或者其他技术能把速度提高，直接服务端部署就完美了。

Feb 13 '23 07:02 shen2009fei