ChatGLM3 微调base模型时，在Sanity Check后出现checkpoint-None

python3.10 transformers4.36.2 torch 2.1.2 torchvision 0.16.2

No response

对chatglm3_base模型进行微调的时候，在调用./finetune_lora.sh后其他都正常进行然后出现这个后就程序退出了

期待可以正常进行微调

Dec 28 '23 07:12 gms5144

我也是这个问题，把finetune.py文件中的breakpoint()注释掉。但finetune出来的lora权重不知道用哪个，尝试了一遍，没看到lora的效果，量化加速也报错。

Dec 28 '23 09:12 haozaiiii

我也是这个问题，把finetune.py文件中的breakpoint()注释掉。但finetune出来的lora权重不知道用哪个，尝试了一遍，没看到lora的效果，量化加速也报错。

注释掉使用 11 万数据微调 1000 步就 4 分钟？基于 chatglm2-6b 的 ptuning 都需要 2 小时呢。

Dec 28 '23 10:12 gree2

因为1000步只访问了1000个batch的数据啊，你batch size是1 那么一共就访问了1000个数据，跟你数据集数量无关，这个确实不合理

Dec 28 '23 14:12 zRzRzRzRzRzRzR

pdb 输入return

Dec 29 '23 07:12 mengdexing

#253 在这里寻求帮助

Dec 29 '23 13:12 zRzRzRzRzRzRzR