Peng Wang comments

Results 6 comments of


                                            Peng Wang

`initialize_agent` does not work with `return_intermediate_steps=True`

@AlejandroGil hello, I faced the same problem, Finally I find the solution!!! For your code, the solution may be: ```python sql_db_chain = SQLDatabaseChain.from_llm( llm, db, prompt=few_shot_prompt, use_query_checker=False, verbose=True, return_intermediate_steps=True, intermediate_steps=['Action...

可直接使用的 13b-plus 4bit 量化模型下载

@johnlui 感谢大佬的合并，尝试了下，报错无法加载模型。用的是 llama.cpp的方案，[这个教程](https://github.com/ymcui/Chinese-LLaMA-Alpaca/wiki/llama.cpp%E9%87%8F%E5%8C%96%E9%83%A8%E7%BD%B2)，把里面zh_models/ 文件夹换成您合并的模型，大佬是这样搞的么？还是我弄错了啊？

可直接使用的 13b-plus 4bit 量化模型下载

@1anglesmith1 不可以啊。。。不知道为啥，还没排出来问题，正在尝试自己合并下看看。。

是否可以开放部分训练数据,或者是少量的典型数据,帮助我们了解在垂直领域如何组织数据对应强逻辑性的模型微调?

里面有啊 --- https://github.com/PKU-YuanGroup/ChatLaw/tree/main/data

DPO训练的时候grad_norm出现nan值

我也是跑飞了 qwen14b 8xA100 全参数微调 dpo 用的通用数据集测试的调整过精度，还有什么推荐的修改方案么？感谢大佬们日志： ``` Train: 12%|█▎ | 172/1376 [30:54:33

DPO训练的时候grad_norm出现nan值

lr 调整还是会有Nan 由 --learning_rate 5e-5 \ 调整到 --learning_rate 5e-7 \ ``` {'loss': 1.00900269, 'grad_norm': 7.53907044362896, 'learning_rate': 1.1904761904761903e-08, 'memory(GiB)': 70.41, 'train_speed(iter/s)': 0.001278, 'rewards/chosen': 0.0, 'rewards/rejected': 0.0, 'rewards/accuracies': 0.0, 'rewards/margins': 0.0,...