lxd0622
Results
1
comments of
lxd0622
> > 流式输入的话,对 LLM 输出做 combination 和 sentence segmentation 就好了。保证质量的话,首包延迟最低在 > 还是挺慢的。我其实在调用api,我最低能做到sub-second,我没用这个本地模型 请问大佬,开源版本支持流式输入吗