toufunao
toufunao
Thanks, after putting evaluate_model in another file, it could run.
把GCC升级到8.2版本解决了编译安装问题
> 可以去掉pycocotools,另离线环境中gradio建议使用3.21版本 ye7love7 ***@***.***>于2023年4月29日 周六18:42写道: > […](#) > RT,纯离线环境安装,依赖安装的十分艰难,最后碰到pycocotools,始终无法安装上,求教方法! — Reply to this email directly, view it on GitHub , or unsubscribe . You are receiving this because you are...
> 离线使用目前应该需要用3.21及以下版本,这个也很头疼,因为也涉及到高版本功能可能报错问题 testStudent ***@***.***>于2023年5月7日 周日23:51写道: > […](#) > 我的纯离线安装已经可以了,就是webui内网不可以,一直加载外部js,楼主怎么解决的 — Reply to this email directly, view it on GitHub , or unsubscribe . You are receiving this because you commented.Message...
您好,请问微调教程什么时候可以出
您好,请问您用了几张什么配置的显卡跑通了全量微调呀?我目前3张32g v100做全量微调没有调通,lora微调报错没有adapter.json
请问您全量微调的设置是怎么样的?我目前两张32g的V100,在Zero-stage=3的情况下也会爆显存,希望可以交流一下
你好,我也是用java生成冒泡排序失败。两种prompt都尝试过,“// language: Java\n //write a bubble sort function\n”,“prompt = "// language: Java\n#write a bubble sort function\n"”。都是打印大量空行,没有任何内容。使用的是单卡32G V100,模型没有经过量化。
@Zz-dong 你好,我刚刚尝试过了,可以输出Java代码,但仍存在大量的空行。 而且还会出现以下提示:“The attention mask and the pad token id were not set. As a sequence, you may observe unexpected behavior. Please pass your inputs's 'attention_mask' to obtain reliable results....
Maybe you should check how official used model.generate(), I met the same problem in Qwen. I replaced the call method with official guidance and it generated the things I needed.