jinmin527
Results
1
comments of
jinmin527
是不是推理的时候,bminf将线程层转换成量化线性层,最终实现参数从fp16到int8,然后bminf计算也是int8