Mann

University of Colorado Anschutz Medical Campus Denver

Results 2 comments of


                                            Mann

How to convert a finetuned MOSS model to quantized version model? 请问如何把一个finetune过的MOSS模型转换为量化版的模型呢？

.

How to convert a finetuned MOSS model to quantized version model? 请问如何把一个finetune过的MOSS模型转换为量化版的模型呢？

> 我测了他们的int4，发现量化后的还没有量化前的推理速度快。量化并不一定会提速，量化主要是为了缩小模型占用显存。