摘要:
开门见山,本篇文章主要包含以下知识点: 什么是Transformer 大模型的结构设计 模型微调 分布式训练 大模型量化 如果能根据这个分布模块每个部分都能讲个大概,大抵就是掌握大模型的训练技巧了。 参考文献:> https://blog.csdn.net/gitblog_00158/article 阅读全文
posted @ 2026-04-02 14:28 k0pa 阅读(20) 评论(0) 推荐(0)
posted @ 2026-04-02 14:28 k0pa 阅读(20) 评论(0) 推荐(0)
posted @ 2025-12-12 16:11 k0pa 阅读(3) 评论(0) 推荐(0)
posted @ 2025-09-22 21:33 k0pa 阅读(128) 评论(0) 推荐(0)
posted @ 2025-08-29 18:32 k0pa 阅读(244) 评论(0) 推荐(0)