会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
weigangwin
博客园
首页
新随笔
联系
订阅
管理
2026年6月30日
FastMCP 很快,但第一步不是把所有函数都暴露成工具
摘要: FastMCP 很快,但第一步不是把所有函数都暴露成工具 FastMCP 的吸引力很直接:你写一个普通 Python 函数,加上 @mcp.tool,它就可以变成 MCP 客户端能发现和调用的工具。对正在给 Claude Code、Codex、Cursor 或 Aider 接工具的人来说,这条路径比
阅读全文
posted @ 2026-06-30 10:56 weigangwin
阅读(0)
评论(0)
推荐(0)
2026年6月29日
smolagents 真正强的地方是代码型行动,但第一步不是放权
摘要: smolagents 的 CodeAgent 很适合代码式行动,但进入 AI 宿主前,必须先明确执行环境、工具权限、密钥边界和 smoke check。
阅读全文
posted @ 2026-06-29 10:57 weigangwin
阅读(1)
评论(0)
推荐(0)
2026年6月28日
不要把 browser-use 当成“会点网页的模型”:先给浏览器 Agent 设计执行契约
摘要: browser-use 不是简单的网页点击工具。它更像一套浏览器 Agent 执行循环:观察页面、提取 DOM、调用 LLM 决策、执行动作、记录历史,再通过截图、history、judge 和边界卡留下可复核证据。本文从 Doramagic 项目手册出发,整理接入 AI 宿主前最该先定义的权限、验收和避坑契约。
阅读全文
posted @ 2026-06-28 18:05 weigangwin
阅读(4)
评论(0)
推荐(0)
2026年6月27日
不要把 Pydantic AI 当成 Agent 魔法层:先写清工具权限和输出合同
摘要: 不要把 Pydantic AI 当成 Agent 魔法层:先写清工具权限和输出合同 Pydantic AI 最容易被误读成“又一个 Python Agent 框架”。这个理解不算错,但太粗了。它真正适合的场景不是把一个 prompt 包成 Agent(...),而是把模型、工具、依赖注入、结构化输出
阅读全文
posted @ 2026-06-27 15:26 weigangwin
阅读(3)
评论(0)
推荐(0)
2026年6月26日
别等 Agent 上线后补评估:先用 DeepEval 写失败样本
摘要: DeepEval 更适合放在 Agent 发布前的失败样本闸门,而不是上线后的评分面板。本文用失败样本、指标选择、trace、golden 生成和本地/云端边界解释如何把它用起来。
阅读全文
posted @ 2026-06-26 11:06 weigangwin
阅读(1)
评论(0)
推荐(0)
2026年6月25日
给 Agent 接入 Qdrant 前,先写清楚检索合同
摘要: 给 Agent 接入 Qdrant 前,先把检索意图、collection、payload filter、score 语义和空结果处理写成可验收的检索合同。
阅读全文
posted @ 2026-06-25 10:24 weigangwin
阅读(4)
评论(0)
推荐(0)
2026年6月24日
让 Agent 用 E2B 跑代码前,先写清楚沙箱合同
摘要: 把 E2B 接给 AI Agent 前,先定义沙箱合同:无密钥、允许命令、文件/网络边界、timeout、artifact 导出和 cleanup。
阅读全文
posted @ 2026-06-24 10:28 weigangwin
阅读(8)
评论(0)
推荐(0)
2026年6月23日
别把 LangGraph 当成更长的 Chain:先把状态、打断和恢复路径写清楚
摘要: 很多人第一次看 LangGraph,会把它理解成“更复杂一点的 LangChain”。这个理解容易把重点带偏。 LangGraph 更适合的场景不是“我想把几个 prompt 串起来”,而是:你的 agent 已经开始有状态、有分支、有工具调用、有失败恢复、有人工确认,并且这些行为需要被检查、复盘和
阅读全文
posted @ 2026-06-23 15:03 weigangwin
阅读(4)
评论(0)
推荐(0)
2026年6月22日
不要等 LLM 工作流上线后再补 eval:promptfoo 最该先定义的是失败边界
摘要: 很多团队接入 LLM 应用时,会先把 prompt 调顺,再补一个“评测脚本”。这个顺序很容易出问题:等到线上开始失败时,大家才发现自己没有定义过什么叫通过、什么叫失败、哪些失败必须阻断发布。 这里的核心判断是:Doramagic 不是提示词库,也不是把 README 换一种说法。它要把一个开源项目
阅读全文
posted @ 2026-06-22 10:58 weigangwin
阅读(4)
评论(0)
推荐(0)
给 AI Agent 接入 MarkItDown 前,先把文档入口收窄
摘要: MarkItDown 很容易被误用成一句话工具:把 PDF、Office、图片、网页、音频转成 Markdown,然后扔给 LLM。 真正落地时,我会先把它当成一个边界问题,而不是格式转换问题。 原因很简单:一旦这个工具被 AI agent 调用,它处理的就不只是文件内容,还包括本地文件路径、URL
阅读全文
posted @ 2026-06-22 08:11 weigangwin
阅读(13)
评论(0)
推荐(0)
下一页
公告