lll2343
lll2343
Hi, You can use the same script as for smaller models, but leverage DeepSpeed’s Zero-2 or Zero-3 to save memory.
Hi, 这个warning应该是不影响的,可以试一下你微调后效果
Hi, see [#739](https://github.com/OpenGVLab/InternVL/issues/739).
Hi, 可以构造成多轮对话,每一次检测一个类别。
Hi, 可以看一下你的测评代码吗
hi, 可以提供你的运行文件吗?
10%的话读不了,会不会是你的这部分视频文件已经损坏了呢,可以检查一下这个
能否提供一下更详细的需求?
Hi, 1. **修改 MLP 无法减少 `num_image_token`** `pixel_shuffle` 已降低 `num_image_token`,详见 [[extract_feature函数](https://github.com/OpenGVLab/InternVL/blob/main/internvl_chat/internvl/model/internvl_chat/modeling_internvl_chat.py#272)]。 如果输入图片分辨率较高,可以通过调整 `max_dynamic_patch` 来减少切图数量。 2. **增加训练步数** 修改 `[meta.json]`中的 `repeat_time` 参数(见 [meta.json](https://github.com/OpenGVLab/InternVL/blob/main/internvl_chat/shell/data/coco_caption.json#L6)),在该数据集上训练更多步数以提升性能。