listwebit

Results 17 comments of listwebit

我是通过webui来推理的,在页面上调整了,设成了2048,不起作用,还是会截断

我刚清除了历史对话,每次都是单轮提问题,长文本还是不行,还是会截断

目前已经验证2 个 epoch依然存在截断问题,我看了一下alpaca_gpt4_zh数据,确实存在截断情况,我筛选一下,在做一些实验,完成后再来更新。

揭秘了,目前sft了一个epoch,试了一下,过滤后不在有截断情况了,不过又发现了另外一个问题,就是写不了太长的内容,比如我让模型写1000字的论文,实际只写了500多字,经过多次尝试都是这种情况,推测是不是和指令数据,没有太长的数据有关系呢?

谢谢大佬,作者,这个帖子上有详细问题,麻烦您看看什么原因呢?https://github.com/LianjiaTech/BELLE/issues/321

> > 基础模型用的bloom > > 之前的代码我们都是在A100上进行实验,在V100上微调Bloom模型需要改一些参数配置,有可能存在问题。 我们会尝试基于之前的代码在V100上复现这个问题。 怎么改呢,改哪里呢,V100上,用你们的docker也是这些问题,没有一个能用的