jaclyn

Results 11 comments of jaclyn

您好,请问您找到解决方法了吗

> > 您好,请问您找到解决方法了吗 > > 类别数超过索引了,在common.py中tensor下面加一行tensor[tensor > 1] =1 好的,谢谢回复

You could specify the device using the **device** parameter when creating the model, for example: KANLayer(in_features, cfg.MODEL.CLS_HEAD.NUM_CLASSES, device=torch.device('cuda')).

> 这里的ACC是指什么, train_acc还是 评估时候的acc 感谢回复,是指在validation上的 sentence-ACC。token-ACC为0.98左右,但对应sentence-acc 为0.76(**internvl2-2B** 中token-ACC为0.98, sentence-ACC约为0.90,我所用数据集文本描述比较简单且格式固定)。 将 **Qwen2_VL-2B** 和 **Internvl2-1B** 对比,在验证集上的 sentence-ACC 也低了9个点左右,请问您对这样差异的原因有什么理解吗

> > > 这里的ACC是指什么, train_acc还是 评估时候的acc > > > > > > 感谢回复,是指在validation上的 sentence-ACC。token-ACC为0.98左右,但对应sentence-acc 为0.76(**internvl2-2B** 中token-ACC为0.98, sentence-ACC约为0.90,我所用数据集文本描述比较简单且格式固定)。 将 **Qwen2_VL-2B** 和 **Internvl2-1B** 对比,在验证集上的 sentence-ACC 也低了9个点左右,请问您对这样差异的原因有什么理解吗 > > 都是ms-swift跑的吗 是的,为了统一比较将 internvl2-2B也设置了--lora_target_modules DEFAULT...

> 使用bf16或者fp32, 不要用fp16 您好,想问下我在微调时开启 --deepspeed default-zero2 后发现验证集上 acc 与不开时相比会有掉点的情况(3个点以上),会是什么原因呢

> Hello, I am trying to predict EF from segmentation masks or key points (ED & ES). I am wondering if there is an available code for that. > >...

> main.py >>> line 125 > > https://github.com/Omid-Nejati/MedViT/blob/main/CustomDataset/main.py Certainly, I understand the definition of this parameter. What I mean is that you have used **_from mcloader import ClassificationDataset_** here, but...

Could you provide the complete **modeling_qwen2_vl.py** file? I encountered an error while fine-tuning qwen2-vl-2b-instruct. File "./miniconda3/envs/swift/lib/python3.11/site-packages/transformers/models/qwen2_vl/modeling_qwen2_vl.py", line 296, in forward [rank1]: attn_weights = torch.matmul(q, k.transpose(1, 2)) / math.sqrt(self.head_dim) AttributeError: 'VisionAttention'...

您好,可以增加自定义 evaluation 评价指标的相关接口吗