lll2343

Results 17 comments of lll2343

Hi, You can use the same script as for smaller models, but leverage DeepSpeed’s Zero-2 or Zero-3 to save memory.

Hi, 这个warning应该是不影响的,可以试一下你微调后效果

Hi, see [#739](https://github.com/OpenGVLab/InternVL/issues/739).

Hi, 可以构造成多轮对话,每一次检测一个类别。

Hi, 可以看一下你的测评代码吗

hi, 可以提供你的运行文件吗?

10%的话读不了,会不会是你的这部分视频文件已经损坏了呢,可以检查一下这个

Hi, 1. **修改 MLP 无法减少 `num_image_token`** `pixel_shuffle` 已降低 `num_image_token`,详见 [[extract_feature函数](https://github.com/OpenGVLab/InternVL/blob/main/internvl_chat/internvl/model/internvl_chat/modeling_internvl_chat.py#272)]。 如果输入图片分辨率较高,可以通过调整 `max_dynamic_patch` 来减少切图数量。 2. **增加训练步数** 修改 `[meta.json]`中的 `repeat_time` 参数(见 [meta.json](https://github.com/OpenGVLab/InternVL/blob/main/internvl_chat/shell/data/coco_caption.json#L6)),在该数据集上训练更多步数以提升性能。