VisualGLM-6B icon indicating copy to clipboard operation
VisualGLM-6B copied to clipboard

有没有batch推理的实现呢?

Open CaicaiJason opened this issue 2 years ago • 3 comments

有没有batch推理的实现呢?

CaicaiJason avatar May 31 '23 09:05 CaicaiJason

batch推理不太高效,因为有的batch生成了结束符,其他的还没有,这样很浪费。sat中的fill sequence支持,需要输入batch size参数,但是不推荐。

Sleepychord avatar May 31 '23 09:05 Sleepychord

一条一条推理太慢了吧,有没有提效的trick呀

freelancerllm avatar Jun 01 '23 03:06 freelancerllm

@Sleepychord sat的filling_sequence的输入 seq 是一维的,batch要怎么组织输入呢

image

pokerG avatar Jun 12 '23 08:06 pokerG

同求,如何加速推理呢?

XaviLv avatar Aug 09 '23 08:08 XaviLv