Yurui Zhu comments

Results 10 comments of


                                            Yurui Zhu

训练过程

在https://gitee.com/mindspore/models/tree/master/research/cv/IPT 提及了 training 过程，这里的scale不应该是6嘛（论文里用了6种数据），这里的2+3+4+1+1+1 是什么含义呢？ python train_finetune.py --distribute --imagenet 0 --batch_size 64 --lr 2e-5 --scale 2+3+4+1+1+1 --model vtip --num_queries 6 --chop_new --num_layers 4 --task_id $TASK_ID --dir_data $DATA_PATH --pth_path $MODEL...

训练过程

> > 第一阶段： Pre-training 第二阶段： Finetuning on the specific task > > 但在第一阶段时是要训练multi-heads，multi-tails; 训练时一个batch 只是随机选一种task 的pair 数据送入到model中，利用反向传播来更新相应的head，tail，和body；其中是不是需要设置，在训练A task时，其他 task 所对应的heads，tails是保持不变的（不会被更新的） > > 第二阶段：只保留相应的task的head 和tail，其他的heads和tails是直接丢弃的 > > 这个过程想确认一下 > > 是的...

Yurui Zhu

训练过程

训练过程

既然有中文的能发到B站吗?不能科学上网

Yi-34B-VL 中文效果炸裂

Confusions about Masked Operations.

Confusions about Masked Operations.

A question about Why Neural Representation Works?

A question about Why Neural Representation Works?

A question about Why Neural Representation Works?

minicpmv_example.py 文件不存在