AgentTuning
AgentTuning copied to clipboard
训练数据中指令与模型行为不匹配
查看huggingface dataset上ALFWorld和Mind2Web的训练数据,发现根据提供的指令,模型不可能产生预期的行为,比如下面两条数据,这个是符合预期的吗?