2

Results 4 comments of 2

改掉 adcodes.csv的1054行

> There is no appropriate metric to evaluate the performance of pre-training task. We recommend selecting the ckpt based on the performance of fine-tuning downstream task. After pretraining on my...

> > 那预训练的log里边应该只能看loss吧,通过观察loss曲线来选择预训练较好的模型,是吗? 为什么训练完后需要经过微调才能用于句子相似度计算呢? > > 预训练的目标不是计算句子相似度,是通过句子向量还原整个句子。因此在下游任务使用时需要微调。 请问一下,如果pretrain完成后,finetune还需要准备多少数据呢?只用少量下游任务数据finetune有效果如何?