GUORUIWANG

Results 9 comments of GUORUIWANG

> > 用的llama_quant.py,未用数据集评估,量化后模型输出是乱码,请问啥原因呀 > > 方便提供更多输出细节吗? 输入不一样,输出都是一样的乱码 ![image](https://user-images.githubusercontent.com/42712819/230251586-467bec12-d7c2-4872-89b0-66832e87a9e5.png)

deepspeed 0.9.2 stage3 + offload multi-gpu, This error also occurs AssertionError: Check batch related parameters. train_batch_size is not equal to micro_batch_per_gpu * gradient_acc_step * world_size 256 != 2 * 10...

想问下微调版本是否会提供

> 我手头没有centos.. 理论上应该用cmake编译就可以? 会报错吗 cmake 用不了,安装有问题

在chatglm6b我发现也报错了,作者能否提供多个模型的demo,想学习下具体改动的地方是什么

> > 在chatglm6b我发现也报错了,作者能否提供多个模型的demo,想学习下具体改动的地方是什么 > > 报错是什么错误?报错的话跟提问者的情况不一样吧 attention_mask和期望的维度不一致,作者可以试试