Bubbliiiing
Bubbliiiing
> 很多时间都在计算反向梯度0 0
> 我统计了一下主要花费时间的地方,当我设置fp16混合精度训练的时候,在utils_fit.py文件中scaler.step(optimizer)这里花费的时间很长,当不用混合精度训练的时候,在total_loss += loss.item()这里花费时间很长。 想请问一下大伙,有没有遇到同样的问题。 @bubbliiiing 我之前毕设的时候研究了好久怎么训练快点……发现不管咋样这玩意都会卡很久,感觉就是图太大,激活值矩阵太大,算的慢
> > > dataloader那里的数据增强, 作者是用numpy和pil实现的, 估计是在cpu上跑的, 看看能不能改成GPU处理? > > > > > > 这里我删了,差不多提高五分之一到4分之一的时间。但还是很慢,是因为语义分割训练就是很慢,还是说因为其他原因呢 > > 我受到启发,图片直接在提前预处理好,输入的图就时resize之后的,也没做数据增强,进数据增强的程序直接返回输入的image和label,一个batch,直接从46s降到15s。就是不知道不做数据增强的话,实际效果会损失多少,还有待我的测试。 输入域和输出域差不多应该没太大问题
> 我统计了一下主要花费时间的地方,当我设置fp16混合精度训练的时候,在utils_fit.py文件中scaler.step(optimizer)这里花费的时间很长,当不用混合精度训练的时候,在total_loss += loss.item()这里花费时间很长。 想请问一下大伙,有没有遇到同样的问题。 @bubbliiiing 我想起来一件事情,用更新版本的torch会好一些,甚至torch2都行。
pip install future
额,应该是根目录错了
鹅 电脑不好吧
额某个loss文件夹里面呀0 0
直接用三元组损失训练基本不收敛hh
额……不会,而且我有l2呀