DEGAN
Results
3
comments of
DEGAN
How to convert a finetuned MOSS model to quantized version model? 请问如何把一个finetune过的MOSS模型转换为量化版的模型呢?
我测了他们的int4,发现量化后的还没有量化前的推理速度快。
你转成onnx了吗?速度变快了吗?