jinmin527

Results 1 comments of jinmin527

是不是推理的时候,bminf将线程层转换成量化线性层,最终实现参数从fp16到int8,然后bminf计算也是int8