xtuner icon indicating copy to clipboard operation
xtuner copied to clipboard

有效节省显存的原因

Open 2020zyc opened this issue 1 year ago • 0 comments

哈喽 感谢开发xtuner这么强的工具! 有个显存消耗的问题想咨询一下。

问题:lora微调qwen2-7b时,测试显存占用;主要看model(**input)这一步,即前向的显存占用,发现比理论分析的少了一半;具体来说,理论上一次前向fp16精度下 所有激活应该占用接近30个G左右显存,但是xtuner只占用了一半;看参数并没有开启gradient checkpointing(activation checkpointing),那是怎么做到显存节省的呢?

期待回答,非常感谢!

2020zyc avatar Jul 31 '24 02:07 2020zyc