Peng Wang

Results 6 comments of Peng Wang

@AlejandroGil hello, I faced the same problem, Finally I find the solution!!! For your code, the solution may be: ```python sql_db_chain = SQLDatabaseChain.from_llm( llm, db, prompt=few_shot_prompt, use_query_checker=False, verbose=True, return_intermediate_steps=True, intermediate_steps=['Action...

@johnlui 感谢大佬的合并,尝试了下,报错无法加载模型。 用的是 llama.cpp的方案,[这个教程](https://github.com/ymcui/Chinese-LLaMA-Alpaca/wiki/llama.cpp%E9%87%8F%E5%8C%96%E9%83%A8%E7%BD%B2), 把里面zh_models/ 文件夹换成您合并的模型,大佬是这样搞的么?还是我弄错了啊?

@1anglesmith1 不可以啊。。。 不知道为啥,还没排出来问题,正在尝试自己合并下看看。。

我也是跑飞了 qwen14b 8xA100 全参数 微调 dpo 用的通用数据集测试的 调整过精度,还有什么推荐的修改方案么?感谢大佬们 日志: ``` Train: 12%|█▎ | 172/1376 [30:54:33

lr 调整 还是会有Nan 由 --learning_rate 5e-5 \ 调整到 --learning_rate 5e-7 \ ``` {'loss': 1.00900269, 'grad_norm': 7.53907044362896, 'learning_rate': 1.1904761904761903e-08, 'memory(GiB)': 70.41, 'train_speed(iter/s)': 0.001278, 'rewards/chosen': 0.0, 'rewards/rejected': 0.0, 'rewards/accuracies': 0.0, 'rewards/margins': 0.0,...