摘要: Claude Opus 4.8 把少装懂变成工程能力,代码 Agent 离生产更近了一步。 阅读全文
posted @ 2026-06-03 09:02 AI小老六 阅读(7) 评论(0) 推荐(0)
摘要: 复用通用 Agent 基座,把业务知识、工具、流程和评测做成可验证增强层。 阅读全文
posted @ 2026-06-03 08:51 AI小老六 阅读(232) 评论(0) 推荐(1)
摘要: AI 代理越能干,越需要沙箱、虚拟机和出口控制来锁住破坏半径。 阅读全文
posted @ 2026-06-02 09:02 AI小老六 阅读(8) 评论(0) 推荐(0)
摘要: 从 Codex Remote Compact 看长程 Agent 如何保存现场、重建规则并继续执行。 阅读全文
posted @ 2026-06-02 08:48 AI小老六 阅读(175) 评论(0) 推荐(1)
摘要: 从价格、基准、动态工作流和诚实性,看 Opus 4.8 如何提升复杂 Agent 交付率。 阅读全文
posted @ 2026-06-01 09:19 AI小老六 阅读(9) 评论(0) 推荐(0)
摘要: 把多 Agent 编排迁出聊天上下文,用可执行脚本承载复杂工程任务。 阅读全文
posted @ 2026-06-01 09:04 AI小老六 阅读(196) 评论(0) 推荐(1)
摘要: AI 进入招聘、授信、客服、教育和公共服务后,真正不能外包的不是效率,而是 可追责、可复核、可纠错 的人类责任链。 阅读全文
posted @ 2026-05-29 09:40 AI小老六 阅读(20) 评论(0) 推荐(0)
摘要: 很多团队在知识建设上都会经历同一个阶段:文档越来越多,检索越来越强,问答也能跑起来,但真正需要复用的判断却始终沉不下来 阅读全文
posted @ 2026-05-29 09:22 AI小老六 阅读(192) 评论(0) 推荐(0)
摘要: AI 提速了原型,却没有解决收尾、验证和维护,大组织往往会先被低质量代码反噬。 阅读全文
posted @ 2026-05-28 14:13 AI小老六 阅读(25) 评论(0) 推荐(0)
摘要: 拆解 Agent Harness 的上下文分层、Skill 延迟加载与 SubAgent 隔离设计。 阅读全文
posted @ 2026-05-28 13:55 AI小老六 阅读(212) 评论(0) 推荐(0)