小七-七牛开发者

2026年6月

周一上线｜Codex 工程师教你自我蒸馏，吉他遥控贪吃蛇，Kindle 再就业成 Claude 仪表盘

摘要：

一边，模型和 AI 编程工具还在继续往 Agent 方向推：Claude Opus 4.8 发布，xAI 把 Grok Build 0.1 放进 API，阶跃星辰也继续更新模型和开发者工具。另一边，社区里也有不少轻松内容：有人把 Claude Code 用成桌面硬件工作流，有人把 Codex 拿去优化网络，还有 Codex 研发人员让 Codex 回顾自己的历史工作记录，给自己“蒸馏”一套可复用流程。阅读全文

posted @ 2026-06-02 22:28 小七-七牛开发者阅读(16) 评论(0) 推荐(0)

标星近 15k，这个高颜值 Coding Agent 如何用 DeepSeek 缓存降低会话成本

摘要：

Coding Agent 的每一轮请求，不一定都需要最强模型。有些任务只是整理工具结果、搜索代码、生成摘要，直接用 pro 模型反而是浪费。阅读全文

posted @ 2026-06-02 21:54 小七-七牛开发者阅读(32) 评论(0) 推荐(0)

让生产级 Agent 实现自进化：MOSS 的源码级实验

摘要：

生产级 Agent 的很多失败并不发生在模型“怎么想”，而发生在系统“怎么跑”。比如消息路由错误、工具结果被错误合并、hook 执行顺序不对、session 状态传递出错。这些问题属于 Agent Harness，通常写在代码里，不在 prompt、skill 或 memory 里。因此，MOSS 讨论的不是“Agent 会不会改代码”，而是 Agent 自进化如何从文本层推进到源码层，尤其是推进到 Harness 代码。阅读全文

posted @ 2026-06-02 21:42 小七-七牛开发者阅读(10) 评论(0) 推荐(0)

2026年5月

专访 Bub 作者们：如何开发一个好记性又懂人的 Agent

摘要：

这期播客主要聊了 Bub 是什么、它和普通聊天机器人/Agent 框架有什么不同，以及它背后的 Tape 记忆机制和插件化设计。阅读全文

posted @ 2026-05-31 08:26 小七-七牛开发者阅读(8) 评论(0) 推荐(0)

RAG、Agentic RAG 和 AI Memory 到底有什么区别？

摘要：

它们合在一起，回答的是同一个问题：AI 怎么从“回答当前问题”，变成“参与长期工作”。RAG 让它会查资料；Agentic RAG 让它更会查资料；Memory 让它能带着过去的上下文继续工作。阅读全文

posted @ 2026-05-31 06:53 小七-七牛开发者阅读(13) 评论(0) 推荐(0)

如何从零开发一个工业级的 SKILL

摘要：

我们要做的 Skill 叫 Skill Forge。它的用途不是处理某个具体业务任务，而是帮助我们创建、改进和检查其他 Skill。阅读全文

posted @ 2026-05-30 15:59 小七-七牛开发者阅读(10) 评论(0) 推荐(0)

RAG、Agentic RAG 和 AI Memory 到底有什么区别？

摘要：

它们合在一起，回答的是同一个问题：AI 怎么从“回答当前问题”，变成“参与长期工作”。RAG 让它会查资料；Agentic RAG 让它更会查资料；Memory 让它能带着过去的上下文继续工作。当这三者组合起来，AI 才更像一个长期协作的助手，而不只是一个每次都要重新介绍背景的聊天窗口。阅读全文

posted @ 2026-05-28 17:44 小七-七牛开发者阅读(10) 评论(0) 推荐(0)

Claude Code 在大型代码库里的工程实践

摘要： Claude Code 的推广不只是工具问题，也是一件工程组织问题。配置、权限、流程和责任人都明确了，开发者才更容易把它真正用进日常工作里。阅读全文

posted @ 2026-05-27 18:21 小七-七牛开发者阅读(14) 评论(0) 推荐(0)

OpenAI 工程师使用 Codex 的 7 个场景

摘要：整体来看，OpenAI 内部使用 Codex 的方式并不复杂。一般是用在边界比较清楚、可以验证、可以 review 的工程任务里：读懂代码、做迁移、补测试、查性能问题、生成初始实现，或者处理一些暂时不想打断当前工作的零散任务。阅读全文

posted @ 2026-05-26 18:23 小七-七牛开发者阅读(9) 评论(0) 推荐(0)

理解 KV Cache：LLM 推理为什么能越写越快

摘要：只要你和现在的 AI 工具交流，无论是 Codex、Claude，还是 ChatGPT、DeepSeek、豆包，你应该都注意过一件事：它并不是一次性把完整答案吐出来，而是一个字接着一个字，慢慢形成一行字，再逐渐生成一整段话，直到所有结果都返回完毕。而你看到的第一个 token，往往要等一会儿才出现阅读全文

posted @ 2026-05-22 16:05 小七-七牛开发者阅读(3) 评论(0) 推荐(0)

公告