deephub

2025年11月2日

LangChain v1.0 中间件详解：彻底搞定 AI Agent 上下文控制

摘要：用 LangChain 构建 AI Agent 的人应该都遇到过这种情况：测试阶段一切正常，部署到生产环境就开始出各种问题。上下文管理混乱，Agent 的行为变得难以预测，最后不得不写一堆自定义代码来控制信息流向。这是因为在v1.0 之前的 LangChain 对上下文工程的支持不够系统化。上下文阅读全文

posted @ 2025-11-02 18:48 deephub 阅读(51) 评论(0) 推荐(0)

2025年11月1日

解决GRPO优势归因错误,Chunk-GRPO让文生图模型更懂"节奏"

摘要：文本到图像(T2I)生成模型的发展速度超出很多人的预期。从SDXL到Midjourney,再到最近的FLUX.1,这些模型在短时间内就实现了从模糊抽象到逼真细腻的跨越。但问题也随之而来——如何让模型生成的不仅仅是"一张图",而是"正确的那张图"？这涉及到如何让AI理解人类在审美、风格和构图上的真实偏阅读全文

posted @ 2025-11-01 19:04 deephub 阅读(19) 评论(0) 推荐(0)

2025年10月31日

打造自己的 Claude Code：LangGraph + MCP 搭建一个极简的 AI 编码助手

摘要：实践是最好的学习方式。为了深入理解 LangGraph 和模型上下文协议（MCP）服务器的生态，我们来从零开始构建一个 CLI 编码代理。我们的目标是，抛开 Claude Code 那些花里胡哨的功能，看看最基础的编码代理能做到什么程度。那些商业编码代理往往会添加各种专有的"秘密配方"——特殊的上下阅读全文

posted @ 2025-10-31 20:09 deephub 阅读(26) 评论(0) 推荐(0)

2025年10月30日

sklearn 特征选择实战：用 RFE 找到最优特征组合

摘要：特征越多模型效果就越好？这个想法在实践中往往站不住脚，因为过多的特征反而会带来过拟合、训练时间过长、模型难以解释等一堆麻烦。递归特征消除(RFE)就是用来解决这类问题的，算是特征选择里面比较靠谱的方法之一。本文会详细介绍RFE 的工作原理，然后用 scikit-learn 跑一个完整的例子。 RF 阅读全文

posted @ 2025-10-30 18:57 deephub 阅读(45) 评论(0) 推荐(0)

2025年10月29日

Optuna AutoSampler 更新：让多目标和约束优化不再需要手动选算法

摘要： AutoSampler是个智能采样器，能根据具体问题自动挑选 Optuna 里最合适的优化算法。这个工具在 OptunaHub 上热度很高，每周下载量超过 3 万次。最早的版本对单目标优化做了专门的自动选择逻辑，为了配合下个月发布的 Optuna v4.6，AutoSampler 终于把多目标和约束阅读全文

posted @ 2025-10-29 18:47 deephub 阅读(30) 评论(0) 推荐(0)

2025年10月28日

构建有记忆的 AI Agent：SQLite 存储 + 向量检索完整方案示例

摘要：现在的 Agent 系统有个很明显的问题 —— 会话一结束，什么都忘了。这不是个技术缺陷，但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务，但就是记不住之前发生过什么。每次对话都像是第一次见面，这种状态下很难说它真正"理解"了什么。记忆能力是把 LLM 从简单的问答工具阅读全文

posted @ 2025-10-28 22:20 deephub 阅读(67) 评论(0) 推荐(0)

2025年10月27日

Pandas 缺失值最佳实践：用 pd.NA 解决缺失值的老大难问题

摘要： Pandas 缺失值最佳实践：用 pd.NA 解决缺失值的老大难问题做数据处理的都知道，一个 NaN 就能让整个数据清洗流程崩盘。过滤条件失效、join 结果错乱、列类型莫名其妙变成 object——这些坑踩过的人应该都有所体会。而Pandas 引入的可空数据类型（nullable dtypes）阅读全文

posted @ 2025-10-27 19:37 deephub 阅读(17) 评论(0) 推荐(0)

2025年10月26日

大模型强化学习的熵控制：CE-GPPO、EPO与AsyPPO技术方案对比详解

摘要： LLM的强化学习训练最近进展很快，SOTA模型在各种推理benchmark上的表现确实亮眼。但更值得关注的其实是另一条信息——从Rutgers到Alibaba再到HKUST，这些研究团队正在攻克的是RL领域的一个老大难：怎么控制好熵，同时避免模型退化成毫无用处的确定性输出。三篇新论文给出了不同角度阅读全文

posted @ 2025-10-26 19:12 deephub 阅读(45) 评论(0) 推荐(0)

2025年10月25日

LLM安全新威胁：为什么几百个毒样本就能破坏整个模型

摘要：数据投毒，也叫模型投毒或训练数据后门攻击，本质上是在LLM的训练、微调或检索阶段偷偷塞入精心构造的恶意数据。一旦模型遇到特定的触发词，就会表现出各种异常行为——输出乱码、泄露训练数据、甚至直接绕过安全限制。这跟提示注入完全是两码事。提示注入发生在推理阶段，属于临时性攻击；而投毒直接改写了模型的权重阅读全文

posted @ 2025-10-25 19:08 deephub 阅读(35) 评论(0) 推荐(0)

2025年10月24日

vLLM 性能优化实战：批处理、量化与缓存配置方案

摘要：很多团队把它vLLM 当 demo 跑，但是其实这没把它系统能力发挥出来。这篇文章将介绍怎么让 vLLM 真正干活——持续输出高令牌/秒，哪些参数真正有用，以及怎么在延迟和成本之间做取舍。 https://avoid.overfit.cn/post/89022caa9a4346b290c212c0c 阅读全文

posted @ 2025-10-24 13:51 deephub 阅读(29) 评论(0) 推荐(0)

overfit深度学习

公告