ms-swift icon indicating copy to clipboard operation
ms-swift copied to clipboard

希望尽快支持Qwen3-30B-A3B-Instruct-2507的AWQ量化

Open BUJIDAOVS opened this issue 6 months ago • 6 comments

尝试使用对Qwen3-30B-A3B-Instruct-2507进行量化时报错

swift export
--model /model/Qwen3-30B-A3B-Instruct-2507
--dataset 'swift/Chinese-Qwen3-235B-2507-Distill-data-110k-SFT'
--device_map auto
--quant_n_samples 64
--quant_batch_size -1
--max_length 8192
--quant_method awq
--quant_bits 4
--output_dir /model/Qwen3-30B-A3B-Instruct-2507-AWQ

已参考官方脚本 https://github.com/modelscope/ms-swift/blob/main/examples/export/quantize/moe/awq.sh

希望尽快在魔搭社区提供awq版量化模型

BUJIDAOVS avatar Jul 30 '25 05:07 BUJIDAOVS

好的

Jintao-Huang avatar Jul 30 '25 06:07 Jintao-Huang

https://www.modelscope.cn/models/swift/Qwen3-30B-A3B-Instruct-2507-AWQ 在魔搭7月30日发布的awq模型精度效果奇差无比,从未见过损失这么严重的awq,和初始模型的效果完全不一致 怀疑是初始模型用错了,或者量化了moe不该量化的部分层 Qwen3-30B-A3B-Instruct是颇受期待的模型,官方模型效果很惊艳,希望swift能提供低精度损失的awq量化模型,望修复!

BUJIDAOVS avatar Jul 30 '25 17:07 BUJIDAOVS

+1

zcfrank1st avatar Aug 05 '25 03:08 zcfrank1st

Any progress ?

nctu6 avatar Sep 30 '25 09:09 nctu6

Any progress ?+1

huhahuaha avatar Nov 12 '25 11:11 huhahuaha

Any progress ? +2

uchihaseki avatar Nov 13 '25 07:11 uchihaseki