摘要: 检测 Prompt 注入和越狱攻击的方法,大多建立在系统可以访问对话日志这个前提上。但是如果设计一个系统,每段对话只处理一次以提取特征,不保留原始文本可以吗?: 如果只保留遥测数据(关于会话行为的数值信号)实际上能保留多少检测能力? 本文就是做一个受约束的实验,用于测试这种架构边界是否可行。 系统概 阅读全文
posted @ 2026-03-31 23:49 deephub 阅读(2) 评论(0) 推荐(0)
摘要: 多 Agent 流水线在每一次演示中都表现正常。但是到了生产环境,它可能在第四步之前就悄悄积累了三个错误决策,最终输出自信、流畅但是完全错误。并且最后没有人发现问题,因为根本没有信号可以捕捉链条末端只剩下一个看起来干干净净的结果。 这是 2026 年生产级 Agent 系统最典型的失败模式。正确构建 阅读全文
posted @ 2026-03-30 21:40 deephub 阅读(2) 评论(0) 推荐(0)
摘要: RouteRAG 把多轮 RAG 重新建模为序列决策过程。 它不依赖固定的手工检索流水线或静态指令,而是学到一套策略:推理过程中的特殊 Token 可以触发检索动作。每一步,模型生成一个动作 Token——继续内部推理、经 <search>...</search> 发起检索,或经 <answer>. 阅读全文
posted @ 2026-03-29 21:46 deephub 阅读(8) 评论(0) 推荐(0)
摘要: LLM agent 看起来越来越智能了。但实际上它们可能只是拿到了更多信息。 Agentic 工作流普及以后,LLM 开始被频繁用于迭代优化机器学习模型:提出配置方案、观察实验结果、逐步改进决策。表面上看这像是推理,但一个根本问题悬而未决:系统性能的提升,究竟源于推理能力,还是源于输入端信息的改善? 阅读全文
posted @ 2026-03-26 20:06 deephub 阅读(2) 评论(0) 推荐(0)
摘要: 做过 GPU kernel 优化的人对以下编程模型肯定不会陌生:写一个 CUDA kernel分发到流式多处理器(SM)上执行,缓存层次结构自行负责数据搬运。而TPU 则完全不同,除非明确告诉编译器要把哪些数据块搬到哪里,否则kernel 根本无法编译。实际操作确实和听起来一样繁琐,所以JAX 的P 阅读全文
posted @ 2026-03-25 20:32 deephub 阅读(5) 评论(0) 推荐(0)
摘要: 腾讯官方开放了一个微信插件 @tencent-weixin/openclaw-weixin,声称可以扫码即可登录,支持消息收发 。这个插件是腾讯官方发布的,用的是微信内部的 ilink AI Bot 平台接口。 本文将介绍如何不装 OpenClaw,直接把协议扒出来,并用 Python 复刻 。 h 阅读全文
posted @ 2026-03-24 20:34 deephub 阅读(26) 评论(0) 推荐(0)
摘要: 视觉-语言模型(VLMs)如 CLIP 彻底改变了零样本图像识别的处理方式。这类模型在包含 4 亿个图像-文本对的大规模数据集上进行训练,捕获了海量通用知识,具备了识别未被明确训练过对象的能力。 当尝试通过 Prompt Tuning 过程将这些全能型模型适配到特定下游任务时通常会遇到瓶颈。这是因为 阅读全文
posted @ 2026-03-23 20:01 deephub 阅读(6) 评论(0) 推荐(0)
摘要: 数值特征工程是机器学习模型训练中不可跳过的预处理环节。处理数值数据时需要面对两个核心问题:特征的量级差异和异常值。以年龄和薪资为例,两者的数值范围差了好几个数量级,如果不做任何处理模型很可能仅凭数值大小就给薪资分配更高的权重,完全忽略年龄的作用。 偏斜分布是另一个问题。很多特征的值集中在一个很小的范 阅读全文
posted @ 2026-03-22 21:14 deephub 阅读(3) 评论(0) 推荐(0)
摘要: loguru、pydantic、httpx都是很好用的库,这篇文章整理的是另一类:多数开发者不知道它们存在,却在不少资深工程师的 requirements.txt 里出现。它们经过生产环境验证、持续维护,解决的都是写业务代码时反复遇到的具体问题。 glom:嵌套数据处理利器 几乎每个开发者都写过这样 阅读全文
posted @ 2026-03-21 20:34 deephub 阅读(2) 评论(0) 推荐(0)
摘要: Claude Code 内置了超过 50 个命令,但是大多数开发者只用了其中 3 到 5 个,剩下的基本没人翻过。 这篇文章覆盖每一个斜杠命令、每一个 CLI 标志、每一个键盘快捷键,以及开发团队从未正式宣布就悄悄上线的隐藏功能。看完本文后Claude Code命令都不再是盲区。 https://a 阅读全文
posted @ 2026-03-20 21:58 deephub 阅读(3) 评论(0) 推荐(0)