摘要:
一边,模型和 AI 编程工具还在继续往 Agent 方向推:Claude Opus 4.8 发布,xAI 把 Grok Build 0.1 放进 API,阶跃星辰也继续更新模型和开发者工具。
另一边,社区里也有不少轻松内容:有人把 Claude Code 用成桌面硬件工作流,有人把 Codex 拿去优化网络,还有 Codex 研发人员让 Codex 回顾自己的历史工作记录,给自己“蒸馏”一套可复用流程。 阅读全文
一边,模型和 AI 编程工具还在继续往 Agent 方向推:Claude Opus 4.8 发布,xAI 把 Grok Build 0.1 放进 API,阶跃星辰也继续更新模型和开发者工具。
另一边,社区里也有不少轻松内容:有人把 Claude Code 用成桌面硬件工作流,有人把 Codex 拿去优化网络,还有 Codex 研发人员让 Codex 回顾自己的历史工作记录,给自己“蒸馏”一套可复用流程。 阅读全文
posted @ 2026-06-02 22:28
小七-七牛开发者
阅读(16)
评论(0)
推荐(0)
摘要:
Coding Agent 的每一轮请求,不一定都需要最强模型。有些任务只是整理工具结果、搜索代码、生成摘要,直接用 pro 模型反而是浪费。 阅读全文
Coding Agent 的每一轮请求,不一定都需要最强模型。有些任务只是整理工具结果、搜索代码、生成摘要,直接用 pro 模型反而是浪费。 阅读全文
posted @ 2026-06-02 21:54
小七-七牛开发者
阅读(32)
评论(0)
推荐(0)
摘要:
生产级 Agent 的很多失败并不发生在模型“怎么想”,而发生在系统“怎么跑”。比如消息路由错误、工具结果被错误合并、hook 执行顺序不对、session 状态传递出错。这些问题属于 Agent Harness,通常写在代码里,不在 prompt、skill 或 memory 里。因此,MOSS 讨论的不是“Agent 会不会改代码”,而是 Agent 自进化如何从文本层推进到源码层,尤其是推进到 Harness 代码。 阅读全文
生产级 Agent 的很多失败并不发生在模型“怎么想”,而发生在系统“怎么跑”。比如消息路由错误、工具结果被错误合并、hook 执行顺序不对、session 状态传递出错。这些问题属于 Agent Harness,通常写在代码里,不在 prompt、skill 或 memory 里。因此,MOSS 讨论的不是“Agent 会不会改代码”,而是 Agent 自进化如何从文本层推进到源码层,尤其是推进到 Harness 代码。 阅读全文
posted @ 2026-06-02 21:42
小七-七牛开发者
阅读(10)
评论(0)
推荐(0)
这期播客主要聊了 Bub 是什么、它和普通聊天机器人/Agent 框架有什么不同,以及它背后的 Tape 记忆机制和插件化设计。
它们合在一起,回答的是同一个问题:AI 怎么从“回答当前问题”,变成“参与长期工作”。RAG 让它会查资料;Agentic RAG 让它更会查资料;Memory 让它能带着过去的上下文继续工作。
我们要做的 Skill 叫 Skill Forge。它的用途不是处理某个具体业务任务,而是帮助我们创建、改进和检查其他 Skill。
它们合在一起,回答的是同一个问题:AI 怎么从“回答当前问题”,变成“参与长期工作”。RAG 让它会查资料;Agentic RAG 让它更会查资料;Memory 让它能带着过去的上下文继续工作。当这三者组合起来,AI 才更像一个长期协作的助手,而不只是一个每次都要重新介绍背景的聊天窗口。
浙公网安备 33010602011771号