分布式训练,参数优化,数据并行,模型并行,混合并行,SGD,动量优化,Adagrad,Adam,AdamW
AI大模型的分布式训练与参数优化技术解析
知识百科 • 数栈君 发表了文章 • 0 个评论 • 132 次浏览 • 2025-09-30 18:25
AI大模型的分布式训练与参数优化技术解析
知识百科 • 数栈君 发表了文章 • 0 个评论 • 132 次浏览 • 2025-09-30 18:25
知识百科 • 数栈君 发表了文章 • 0 个评论 • 132 次浏览 • 2025-09-30 18:25
知识百科 • 数栈君 发表了文章 • 0 个评论 • 132 次浏览 • 2025-09-30 18:25