longshiming
longshiming


在你的OkHttpManager类中buildRequestBody方法中 if (null != mType && null != mFile) { RequestBody requestBody = new RequestBody() { @Override public MediaType contentType() { return mType; } @Override public void writeTo(BufferedSink sink) throws...
这是给kingway立的一个flag
使用tts vits-icefall-zh-aishell3模型,输入只有一个或两个字时,输出声音奇奇怪怪的,这个小参数量的模型挺快的,希望新一代作者们能抽空解决下这个问题。
max-active-paths的值设置为大于1时(如2、4、10)说一遍关键词,关键词会被识别到两次,值越大出现的概率越高; 例如在控制台输入如下指令: python3 ./keyword-spotter-from-microphone.py \ --encoder /Users/gree/Desktop/sherpaonnx20240723/kws-zipformer-gigaspeech/encoder-epoch-12-avg-2-chunk-16-left-64.onnx \ --decoder /Users/gree/Desktop/sherpaonnx20240723/kws-zipformer-gigaspeech/decoder-epoch-12-avg-2-chunk-16-left-64.onnx \ --joiner /Users/gree/Desktop/sherpaonnx20240723/kws-zipformer-gigaspeech/joiner-epoch-12-avg-2-chunk-16-left-64.onnx \ --tokens /Users/gree/Desktop/sherpaonnx20240723/kws-zipformer-gigaspeech/tokens.txt \ --max-active-paths 10 \ --num-trailing-blanks 0 \ --keywords-file /Users/gree/Desktop/sherpaonnx20240723/kws-zipformer-gigaspeech/keywords.txt \ --keywords-score 1.5 \ --keywords-threshold...