nash635's Blog
造车,造船,造飞机
近期发布
分类
标签:大语言模型
归档
Megatron-LM 架构深度分析
Megatron-LM是NVIDIA开发的大规模Transformer模型训练GPU优化库,支持多种并行策略和混合精度训练。
2025-11-17
系统架构分析