zm_11 comments

Results 9 comments of


                                            zm_11

Will it support BIAOBEI dataset?

> 使用标贝后长句依然有问题 > 重点是我不会使用MFA ... ![1638442790(1)](https://user-images.githubusercontent.com/62825785/144409721-7275cee1-20f5-4e44-a04f-475e3b87a9ca.png) 这是我用标贝可以跑起来但是nan 我感觉是数据有杂乱的请问解决了吗？我没有降采样也是出来的nan

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案

> > Maybe you could ref to this code: [33f2d46](https://github.com/alibaba-damo-academy/FunASR/commit/33f2d469a6574a57e18fe77aef2c98549273169a) > > 请问一下，怎么具体使用这两句代码？scale的大小是多少？请问，你做到端侧的方案是什么？

How to use T2 as acoustic model

If T2 is used in the front-end acoustic model, how to extract Mel

nar model loss震荡不下降

> > nar 训练loss一直在2.8-3.5震荡不下降 ar loss正常 > > 你好,你已经整个项目都跑起来了吗可以给一点指导吗啥问题？

sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字

脚本参考 python-api-examples/speech-recognition-from-microphone-with-endpoint-detection.py 把加载模型换成了paraformer的，把麦克风拾到音保存了音频文件我听着，还挺清楚的，基本上漏掉最后一个字的概率有50% def create_recognizer(args): assert_file_exists(args.encoder) assert_file_exists(args.decoder) assert_file_exists(args.tokens) # Please replace the model files if needed. # See https://k2-fsa.github.io/sherpa/onnx/pretrained_models/index.html # for download links. recognizer = sherpa_onnx.OnlineRecognizer.from_paraformer( tokens=args.tokens, encoder=args.encoder, decoder=args.decoder, num_threads=1,...

sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字

用你这个脚本，也漏最后一个字 > https://github.com/k2-fsa/sherpa-onnx/blob/master/python-api-examples/streaming-paraformer-asr-microphone.py > > 你要用这个脚本

sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字

> 那你用 build/bin 下面的 sherpa-onnx-microphone 测试呢？ > > 看了下， python 的例子代码里，没有在 endpoint 的时候，再加一些 padding. > > C++ 例子代码，有加的 > > https://github.com/k2-fsa/sherpa-onnx/blob/d8809b520ee3824b8dea139270c14d98f50ad0b9/sherpa-onnx/csrc/sherpa-onnx-microphone.cc#L186-L197 > > 还有，流式模型，建议用 https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-transducer/zipformer-transducer-models.html#csukuangfj-sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20-bilingual-chinese-english 你们的模型是这个吗 https://modelscope.cn/models/iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx/files ，如果不是用这个onnx的模型能推理吗，我看这个模型训练用了6w小时的数据

sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字

还有一个问题，paraformer推理做padding 是不是端点处往后再录入一秒的音频推理就行了？

sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字

好的，感谢发自我的iPhone ------------------ 原始邮件 ------------------ 发件人: Fangjun Kuang ***@***.***> 发送时间: 2024年9月25日 19:44 收件人: k2-fsa/sherpa-onnx ***@***.***> 抄送: zm_11 ***@***.***>, Author ***@***.***> 主题: Re: [k2-fsa/sherpa-onnx] sherpa-onnx-streaming-paraformer-bilingual-zh-en 模型用麦克风流式推理经常会漏掉最后一个字 (Issue #1373) 我们提供的所有...