Transformer Engine 架构设计分析

Transformer Engine是NVIDIA开发的高性能Transformer模型加速库,支持FP8混合精度训练,显著降低内存占用和提升性能。

系统架构分析

Megatron-LM 架构深度分析

Megatron-LM是NVIDIA开发的大规模Transformer模型训练GPU优化库,支持多种并行策略和混合精度训练。

系统架构分析