Cristiano

Results 6 comments of Cristiano

> 是的 我也遇到这个bug,目前有解吗

> 请尝试重新下载数据,以及用`--seed`选项更换随机种子。 bug解决了吗

> 就是数据问题,显示没数据。。。 苏老师,看了代码发现了我参数设置的问题; batch-size 比 grad_accum_steps的值小,导致后面的数据一直为0; ![image](https://user-images.githubusercontent.com/37329790/120148158-5b33ed00-c21a-11eb-84f4-920b5d95e88c.png) 还有个疑问,看了您的batch-size设置为4096,这么大的batch-size,是用TPU来训练的吗?如果是24G的GPU显卡,那么相对应得batch-size 和 grad_accum_steps 这两个值都设为 8(这样设置可以?)

> 一模一样的问题.requirement.txt也没写全。安装triton的时候torch的版本又变了. 这个不会吧,我都是直接pip 安装triton, 然后直接调用脚本就可以跑了 from transformers import AutoTokenizer, AutoModelForCausalLM model_dir = ".LLM/moss-moon-003-sft-plugin-int4" tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained(model_dir, trust_remote_code=True).half().cuda() meta_instruction = "You are an AI assistant whose name...

> 你好, > > 我用fit好的模型转tf serving需要的pb文件,会报错,问题应该是CRFLoss命名规范问题。可否帮忙看下 > > 错误提示: > /opt/conda/lib/python3.7/site-packages/tensorflow_core/python/util/serialization.py in get_json_type(obj) > 52 # misc functions (e.g. loss function) > 53 if callable(obj): > ---> 54 return obj.**name**...