Yaru
Yaru
### Reminder - [X] I have read the README and searched the existing issues. ### Reproduction 我脚本和训练集的数据格式如下。由于我的训练集都是长对话,我按照oaast_sft.json模板修改的,所以在模板中的history里基本都是十几轮的对话。然而,当我训练完checkpoint后 预测指定测试集时,预测结果里有且仅有history里前两轮的策略(也就是label开头的括号内的内容,如(Emotional Validation)\n),没有2轮之后的策略。所以我怀疑是模型没有学习到2轮以后的内容吗? 所以我想确认一下,sft,do_train可以学习到history3轮及以后内容吗?为什么我的预测结果里没有2轮之后的策略。 我的训练脚本是 CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \ --stage sft \ --do_train \...
In save/saved_model, there are no model weights in the model path, and there are no models and weights in the link provided in readme. Where should I download them?Thank you
pip install -r requirement.txt 可是文件里没有 requirement.txt文件,请问在哪里?谢谢
作者您好,不好意思打扰一下:可以问一下关于策略如何根据历史文本识别的吗?,以及如何根据已经识别出策略, 如何生成相应的回复文本的? 我修改了8个策略的编号。重新从头训练推理,生成的结果中 策略则不准确了。所以不太清楚是如何根据对话历史识别出策略的。 关于第二个问题:根据对话历史和策略生成response内容。根据文章得知 response内容应该不是根据策略分类匹配的内容,那应该是如何生成的? 在哪个代码文件里可以找到? 对您的研究非常感兴趣,麻烦作者可以帮忙解答一下,十分感谢
我想debug逐步分析学习代码,可是运行文件是.sh文件,我在。sh文件无法打断点,又在python文件里打断点,没有效果。请问应该如何做?
### Reminder - [X] I have read the README and searched the existing issues. ### Reproduction 我在新旧版本上运行代码提示如下错误:可是我的网络也没有什么异常,请问该怎么解决?谢谢 Could not create share link. Please check your internet connection or our status...