文章来源于互联网:FP8训练新范式:减少40%显存占用,训练速度提高1.4倍


-
论文标题:COAT: Compressing Optimizer States and Activation for memory efficient FP8 Training
-
论文链接:https://arxiv.org/abs/2410.19313
-
开源代码:https://github.com/NVlabs/COAT









文章来源于互联网:FP8训练新范式:减少40%显存占用,训练速度提高1.4倍