训练数据中指令与模型行为不匹配

Open haichao592 opened this issue 1 year ago • 0 comments

查看huggingface dataset上ALFWorld和Mind2Web的训练数据，发现根据提供的指令，模型不可能产生预期的行为，比如下面两条数据，这个是符合预期的吗？

Apr 23 '24 12:04 haichao592