摘要: 亚马逊研究团队于2024年提出的一种时间序列预测基础模型Chronos,代表了时间序列领域向大模型范式的重要转变。 模型的核心思想是将时间序列预测重塑为一个条件生成建模或语言建模任务。 应用于Zero-shot (零时序预测(Zero-shot Time Series Forecasting) 指的 阅读全文
posted @ 2025-12-04 16:50 wangssd 阅读(111) 评论(0) 推荐(0)
摘要: DeepSpeed 是底层训练加速库,用于进行分布式训练 LLaMA Factory 是高层一站式训练框架 DeepSpeed 定位:微软开发的深度学习优化库,核心目标是极大化训练和推理的效率、规模与速度。 核心特性: ZeRO 优化器:其标志性技术,通过跨GPU智能分割模型状态(参数、梯度、优化器 阅读全文
posted @ 2025-12-04 09:24 wangssd 阅读(18) 评论(0) 推荐(0)