yangliuIOC

Results 12 comments of


                                            yangliuIOC

[BUG/Help] 用P-Tuning v2微调之后进行推理发现是乱码？

这就对了

[BUG/Help] <请问做了广告文案的P-tuning后，对其他意图的响应都乱了，这个问题怎么解决？>

暂时是未解之谜

[BUG] 微调训练后，一些无关的词条也被污染了？

应该是加入你想要的数据进入数据集，他是微调的，以前的知识保留的比较少，

[BUG/Help] <通过广告词训练之后感觉其他的回答认知出现了问题~>

> @songsa1 推荐友情链接里的 chatglm-tuning 请问，你用过lora跑过这个广告数据集么，

CUDA error: device-side assert triggered是什么情况？

我也是

RLHH

我的意思是，reward model 是hf训练出来的，而不是sft 训练出来的。

作者你好，改名字只成功了一半

lora 开大，要不他老嘴硬，在家丰富的数据

embedding

其实，这就类似于用 sber进行召回，在排序，再用glm问答，感觉主要是在召回这里和排序，怎么能够更加准确，

embedding

我看您直接去的第一列【：，0】，但是我用了 meanpooling 效果比这个要差。。

embedding

我发现很多召回的句子里有问题的答案，也回答不出来了。，。。不知道是不是因为您对text2chatglm 这里面的都已经去除标点符号了，加上了换行。

1
2
›