是否支持英文en呢?
是否支持英文en呢?
只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,https://github.com/k2-fsa/icefall
只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,k2-fsa/icefall
兄弟 我用paraformer 的方式 ,测试英文 字母 I 和其他单词 没有空格分开。测试了两个wav文件都是这样,能讲一下在哪里修改能解决这个问题? Result: "Iknocked at the door on the ancient side of the building". Result: "have you got any cheese may Ihelp you".
能提供一下音频么?我debug一下啊,这里确实没怎么测试过,需要修改https://github.com/chenkui164/FastASR/blob/main/src/lib/Vocab.cpp 里面的vector2stringV2这个函数
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav 这个
好的,可能需要等两天了,我把这部分代码重构一下,当时偷懒没考虑的太周全
@shen2009fei 已经修复这个bug,可以抽空试试了
@shen2009fei 已经修复这个bug,可以抽空试试了
兄弟 感谢修复,非常好用 感谢。 请问这个支持服务的形式吗?这样便于前端调用。
不支持,这个项目只做推理过程,接口部分需要自己实现
有段音频识别,know 和 后面的Is 合并在一起了。
Two two two it's one o'clock have you ever been to china what's your name I don't knowIs that okay sure pretty cool newRecord 2.wav.zip
临时的解决方案是将代码 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }
由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧
临时的解决方案是将代码%3B-,cout%20%3C%3C%20msg,-%3B) while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }
由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧
先这么解决了,我部署到服务器 发现服务器识别比我本地还慢1秒:) . 主要是用paraformer的代码。 我发现要么paraformer的模型如果剪小就可以部署到移动端,或者推理利用多线程 或者其他技术能把速度提高,直接服务端部署就完美了。