Transformer Engine 架构设计分析Transformer Engine是NVIDIA开发的高性能Transformer模型加速库,支持FP8混合精度训练,显著降低内存占用和提升性能。2025-11-17系统架构分析