[Question]: UIE-X分布式训练显存占用问题 #6604

datuizhuang · 2023-08-03T07:54:52Z

请提出你的问题

你好，请问在根据readme中描述的分布式训练UIE-X时，会出现两张卡的显存占用不一致的情况，0卡会比1卡多占用非常多。
（batch size = 2, max_seq_len=512)我看在加载预训练模型阶段，0卡就会用到8700M左右，1卡此时才4000M左右。
训练阶段0卡占用了13000M左右，1卡8800M左右。
请问这个问题如何解决？

w5688414 · 2024-05-07T03:17:23Z

请问您的paddle和paddlenlp的坏境是什么，然后使用的是什么显卡

datuizhuang added the question Further information is requested label Aug 3, 2023

github-actions bot added the triage label Aug 3, 2023

paddle-bot bot assigned wawltor Feb 26, 2024

paddle-bot bot closed this as completed May 13, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Question]: UIE-X分布式训练显存占用问题 #6604

[Question]: UIE-X分布式训练显存占用问题 #6604

datuizhuang commented Aug 3, 2023

w5688414 commented May 7, 2024

[Question]: UIE-X分布式训练显存占用问题 #6604

[Question]: UIE-X分布式训练显存占用问题 #6604

Comments

datuizhuang commented Aug 3, 2023

请提出你的问题

w5688414 commented May 7, 2024