rover5056 comments

Results 8 comments of


                                            rover5056

How do I get the data now

@micheal-death I am trying your method.. Could you give more step or details Thank you very much!

newOffer not called sometimes

I found this question too. When send 2 offers , the received bot will only fired newOffer once. @Baterka How do you solute this bug? THX~

[BUG] <title>合并lora权重时遇到AttributeError: 'QWenTokenizer' object has no attribute 'IMAGE_ST'问题

same error~

[BUG] <mini cpm V2.0 finetune需要这么大显存么？>

> 你好，这是正常的。如果需要开到更高，可以尝试使用gradient_accumulation_steps来调整默认参数的8.。。是针对B200设置的么。。。之前7B的模型ft也能开到16的bs，模型加载不是只要8G左右的显存么。。剩下的70G只能4个batch么~ 还是有点奇怪

[BUG] <mini cpm V2.0 finetune需要这么大显存么？>

跑是能跑的全量微调 bs =4 ，gradient_accumulation_steps 8 左右可以稳定跑低了有概率oom

[BUG] <mini cpm V2.0 finetune需要这么大显存么？>

还没来得及看代码理论上1.8B的模型不应该是这个情况。。。

@Jintao-Huang 求问下，如果想先训练 visual下的 merger，需要指定 freeze_parameters 还是 trainable_parameters，我看这两个默认都是 [], 感觉是冲突的？同时 freeze_llm ，freeze_vit ，freeze_aligner 这三个参数对qwen2vl 可以自动识别么？。。 🔥freeze_llm: 冻结LLM. 默认为False. 可用于全参和LoRA 🔥freeze_vit: 冻结ViT. 默认为True. 可用于全参和LoRA 🔥freeze_aligner: 冻结aligner. 默认为True, 可用于全参和LoRA 贴个 qwen2vl 的结构图，不知道我表达清楚没。。：

[Roadmap] OpenRLHF Development Roadmap

I'll attempt to develop VLM part, Thanks～ @hijkzzz