摘要: FastMCP 很快,但第一步不是把所有函数都暴露成工具 FastMCP 的吸引力很直接:你写一个普通 Python 函数,加上 @mcp.tool,它就可以变成 MCP 客户端能发现和调用的工具。对正在给 Claude Code、Codex、Cursor 或 Aider 接工具的人来说,这条路径比 阅读全文
posted @ 2026-06-30 10:56 weigangwin 阅读(0) 评论(0) 推荐(0)
摘要: smolagents 的 CodeAgent 很适合代码式行动,但进入 AI 宿主前,必须先明确执行环境、工具权限、密钥边界和 smoke check。 阅读全文
posted @ 2026-06-29 10:57 weigangwin 阅读(1) 评论(0) 推荐(0)
摘要: browser-use 不是简单的网页点击工具。它更像一套浏览器 Agent 执行循环:观察页面、提取 DOM、调用 LLM 决策、执行动作、记录历史,再通过截图、history、judge 和边界卡留下可复核证据。本文从 Doramagic 项目手册出发,整理接入 AI 宿主前最该先定义的权限、验收和避坑契约。 阅读全文
posted @ 2026-06-28 18:05 weigangwin 阅读(4) 评论(0) 推荐(0)
摘要: 不要把 Pydantic AI 当成 Agent 魔法层:先写清工具权限和输出合同 Pydantic AI 最容易被误读成“又一个 Python Agent 框架”。这个理解不算错,但太粗了。它真正适合的场景不是把一个 prompt 包成 Agent(...),而是把模型、工具、依赖注入、结构化输出 阅读全文
posted @ 2026-06-27 15:26 weigangwin 阅读(3) 评论(0) 推荐(0)
摘要: DeepEval 更适合放在 Agent 发布前的失败样本闸门,而不是上线后的评分面板。本文用失败样本、指标选择、trace、golden 生成和本地/云端边界解释如何把它用起来。 阅读全文
posted @ 2026-06-26 11:06 weigangwin 阅读(1) 评论(0) 推荐(0)
摘要: 给 Agent 接入 Qdrant 前,先把检索意图、collection、payload filter、score 语义和空结果处理写成可验收的检索合同。 阅读全文
posted @ 2026-06-25 10:24 weigangwin 阅读(4) 评论(0) 推荐(0)
摘要: 把 E2B 接给 AI Agent 前,先定义沙箱合同:无密钥、允许命令、文件/网络边界、timeout、artifact 导出和 cleanup。 阅读全文
posted @ 2026-06-24 10:28 weigangwin 阅读(8) 评论(0) 推荐(0)
摘要: 很多人第一次看 LangGraph,会把它理解成“更复杂一点的 LangChain”。这个理解容易把重点带偏。 LangGraph 更适合的场景不是“我想把几个 prompt 串起来”,而是:你的 agent 已经开始有状态、有分支、有工具调用、有失败恢复、有人工确认,并且这些行为需要被检查、复盘和 阅读全文
posted @ 2026-06-23 15:03 weigangwin 阅读(4) 评论(0) 推荐(0)
摘要: 很多团队接入 LLM 应用时,会先把 prompt 调顺,再补一个“评测脚本”。这个顺序很容易出问题:等到线上开始失败时,大家才发现自己没有定义过什么叫通过、什么叫失败、哪些失败必须阻断发布。 这里的核心判断是:Doramagic 不是提示词库,也不是把 README 换一种说法。它要把一个开源项目 阅读全文
posted @ 2026-06-22 10:58 weigangwin 阅读(4) 评论(0) 推荐(0)
摘要: MarkItDown 很容易被误用成一句话工具:把 PDF、Office、图片、网页、音频转成 Markdown,然后扔给 LLM。 真正落地时,我会先把它当成一个边界问题,而不是格式转换问题。 原因很简单:一旦这个工具被 AI agent 调用,它处理的就不只是文件内容,还包括本地文件路径、URL 阅读全文
posted @ 2026-06-22 08:11 weigangwin 阅读(13) 评论(0) 推荐(0)