FastASR icon indicating copy to clipboard operation
FastASR copied to clipboard

是否支持英文en呢?

Open shen2009fei opened this issue 3 years ago • 11 comments

是否支持英文en呢?

shen2009fei avatar Jan 30 '23 07:01 shen2009fei

只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,https://github.com/k2-fsa/icefall

chenkui164 avatar Jan 30 '23 08:01 chenkui164

只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,k2-fsa/icefall

兄弟 我用paraformer 的方式 ,测试英文 字母 I 和其他单词 没有空格分开。测试了两个wav文件都是这样,能讲一下在哪里修改能解决这个问题? Result: "Iknocked at the door on the ancient side of the building". Result: "have you got any cheese may Ihelp you".

shen2009fei avatar Jan 30 '23 10:01 shen2009fei

能提供一下音频么?我debug一下啊,这里确实没怎么测试过,需要修改https://github.com/chenkui164/FastASR/blob/main/src/lib/Vocab.cpp 里面的vector2stringV2这个函数

chenkui164 avatar Jan 30 '23 10:01 chenkui164

wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav 这个

shen2009fei avatar Jan 30 '23 10:01 shen2009fei

好的,可能需要等两天了,我把这部分代码重构一下,当时偷懒没考虑的太周全

chenkui164 avatar Jan 31 '23 02:01 chenkui164

@shen2009fei 已经修复这个bug,可以抽空试试了

chenkui164 avatar Feb 01 '23 01:02 chenkui164

@shen2009fei 已经修复这个bug,可以抽空试试了

兄弟 感谢修复,非常好用 感谢。 请问这个支持服务的形式吗?这样便于前端调用。

shen2009fei avatar Feb 04 '23 09:02 shen2009fei

不支持,这个项目只做推理过程,接口部分需要自己实现

chenkui164 avatar Feb 04 '23 14:02 chenkui164

有段音频识别,know 和 后面的Is 合并在一起了。

Two two two it's one o'clock have you ever been to china what's your name I don't knowIs that okay sure pretty cool newRecord 2.wav.zip

shen2009fei avatar Feb 11 '23 15:02 shen2009fei

临时的解决方案是将代码 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }

由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧

chenkui164 avatar Feb 12 '23 01:02 chenkui164

临时的解决方案是将代码%3B-,cout%20%3C%3C%20msg,-%3B) while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }

由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧

先这么解决了,我部署到服务器 发现服务器识别比我本地还慢1秒:) . 主要是用paraformer的代码。 我发现要么paraformer的模型如果剪小就可以部署到移动端,或者推理利用多线程 或者其他技术能把速度提高,直接服务端部署就完美了。

shen2009fei avatar Feb 13 '23 07:02 shen2009fei