GUORUIWANG
GUORUIWANG
有办法打印验证集损失值么
> > 用的llama_quant.py,未用数据集评估,量化后模型输出是乱码,请问啥原因呀 > > 方便提供更多输出细节吗? 输入不一样,输出都是一样的乱码 
deepspeed 0.9.2 stage3 + offload multi-gpu, This error also occurs AssertionError: Check batch related parameters. train_batch_size is not equal to micro_batch_per_gpu * gradient_acc_step * world_size 256 != 2 * 10...
想问下微调版本是否会提供
+1期待
> 我手头没有centos.. 理论上应该用cmake编译就可以? 会报错吗 cmake 用不了,安装有问题
在chatglm6b我发现也报错了,作者能否提供多个模型的demo,想学习下具体改动的地方是什么
> > 在chatglm6b我发现也报错了,作者能否提供多个模型的demo,想学习下具体改动的地方是什么 > > 报错是什么错误?报错的话跟提问者的情况不一样吧 attention_mask和期望的维度不一致,作者可以试试