会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
2025年12月8日
MLflow (机器学习/深度学习 mlops平台 kubeflow)
摘要: MLflow 是一个功能强大的ML生命周期管理平台,主要用于 ML/DL/LLM 实验管理、模型跟踪、模型部署等。 1. 核心概念 实验(Experiment):MLflow 的基本组织单位,用于将相关的运行组织在一起。每个实验包含多次运行,通常对应一个特定的 ML 项目 运行(Run):单次执行代
阅读全文
posted @ 2025-12-08 15:45 wangssd
阅读(8)
评论(0)
推荐(0)
2025年12月5日
时间序列中的 多步预测
摘要: 多步预测主要分为两种策略:递归预测、序列到序列预测(Seq2Seq) 递归预测(Recursive Forecasting) 使用单步预测模型,将预测值作为下一步的输入 适合短期预测,误差会逐渐累积 序列到序列预测(Seq2Seq) 编码器-解码器架构 最常用的多步预测方法
阅读全文
posted @ 2025-12-05 14:08 wangssd
阅读(13)
评论(0)
推荐(0)
2025年12月4日
时序预测大模型 Chronos模型设计思想
摘要: 亚马逊研究团队于2024年提出的一种时间序列预测基础模型Chronos,代表了时间序列领域向大模型范式的重要转变。 模型的核心思想是将时间序列预测重塑为一个条件生成建模或语言建模任务。 应用于Zero-shot (零时序预测(Zero-shot Time Series Forecasting) 指的
阅读全文
posted @ 2025-12-04 16:50 wangssd
阅读(108)
评论(0)
推荐(0)
deepspeed/llama-factory
摘要: DeepSpeed 是底层训练加速库,用于进行分布式训练 LLaMA Factory 是高层一站式训练框架 DeepSpeed 定位:微软开发的深度学习优化库,核心目标是极大化训练和推理的效率、规模与速度。 核心特性: ZeRO 优化器:其标志性技术,通过跨GPU智能分割模型状态(参数、梯度、优化器
阅读全文
posted @ 2025-12-04 09:24 wangssd
阅读(17)
评论(0)
推荐(0)
2025年12月1日
llm 中的对齐微调 DPO、KTO、PPO算法
摘要: 模型经过海量数据预训练后,它拥有了广泛的知识,但其输出行为是“中性”的,它不知道人类更偏爱哪种风格的回答(例如:更有帮助、更无害、更简洁、更符合特定格式)。对齐微调 的目标就是缩小模型与人类偏好之间的差距。 对齐微调:利用人类偏好信号来指导模型的优化。 1. PPO(Proximal Policy
阅读全文
posted @ 2025-12-01 10:10 wangssd
阅读(56)
评论(0)
推荐(0)
2025年11月28日
fastapi python项目构建 路由设置
摘要: FastAPI 是一个现代、快速(高性能)的 Python Web 框架,专门用于构建 API。它结合了 Python 类型提示的强大功能和异步编程的支持。 核心特性 1. 高性能 基于 Starlette(Web 框架)和 Pydantic(数据验证) 性能可与 NodeJS 和 Go 相媲美 支
阅读全文
posted @ 2025-11-28 13:58 wangssd
阅读(8)
评论(0)
推荐(0)
2025年11月27日
https 在web端的交互流程
摘要: 当用户通过浏览器访问一个配置了 HTTPS 的网站时,其数据交互流程可以清晰地分为两大阶段: 1. TLS 握手连接 浏览器和服务器建立一个安全的、加密的通信通道。这个过程的核心是验证服务器身份,并协商出一个只有双方知道的“会话密钥”。 2. 安全的 HTTP 数据通信。 在安全的通道建立之后,所有
阅读全文
posted @ 2025-11-27 21:26 wangssd
阅读(10)
评论(0)
推荐(0)
2025年11月25日
llm python web框架的使用(同步/异步/进程/线程/协程)
摘要: 异步与同步 执行流式输出 from fastapi import FastAPI import asyncio from langchain_openai import ChatOpenAI app = FastAPI() llm = ChatOpenAI(streaming=True) # 同步端
阅读全文
posted @ 2025-11-25 10:53 wangssd
阅读(12)
评论(0)
推荐(0)
2025年11月24日
langgraph 核心要点
摘要: LangGraph 采用单一状态对象的设计,所有节点都读写同一个状态对象。 整个图维护统一的 State,通过类型定义来包含多个"子状态"或字段。 多模块示例: from langgraph.graph import StateGraph, END from typing import TypedD
阅读全文
posted @ 2025-11-24 17:05 wangssd
阅读(5)
评论(0)
推荐(0)
llama-factory 各参数详解
摘要: llama-factory web页面: 1. 模型与数据配置 参数/选项详细说明 模型名称或路径 - 作用:指定要微调的基座模型。可以是 Hugging Face 上的模型标识符(如 meta-llama/Llama-2-7b-chat-hf),也可以是本地模型文件夹的路径。 - 注意:需要确保
阅读全文
posted @ 2025-11-24 11:31 wangssd
阅读(307)
评论(0)
推荐(0)
下一页
公告