摘要:
引子 我之前花了不少时间折腾 AI Agent。遇到的核心难题就一个:工具调度。 用户说一句话,你怎么判断该调哪个工具?调完之后结果怎么回传给模型?多个工具之间有依赖关系怎么处理? 这些问题看似简单,写起来都是坑。 最近在用 Strands Agents SDK,发现它的设计思路很干脆——不做意图路 阅读全文
posted @ 2026-03-23 11:07
亚马逊云开发者
阅读(3)
评论(0)
推荐(0)
摘要:
公司有十几台 EC2 跑在 Private Subnet,运维流程是这样的: 连 VPN SSH 到堡垒机 从堡垒机 SSH 到目标实例 三层跳转,光认证就两分钟。堡垒机还得维护——打补丁、轮密钥、开安全审计。说白了它本身就是个攻击面,放在公网上等人来扫。 后来用了亚马逊云科技的 EC2 Insta 阅读全文
posted @ 2026-03-23 11:07
亚马逊云开发者
阅读(2)
评论(0)
推荐(0)
摘要:
上周五晚上 11 点,手机响了——线上服务 CPU 飙到 95%,用户开始投诉卡顿。 等我打开电脑登上服务器,已经过去 15 分钟了。手动扩了一台实例,又花了 5 分钟。整个故障影响了将近 20 分钟。 后来我花了一个下午搭了一套 CloudWatch 告警 + 自动响应系统。现在 CPU 超过 8 阅读全文
posted @ 2026-03-23 09:03
亚马逊云开发者
阅读(2)
评论(0)
推荐(0)
摘要:
项目背景 在一个用户行为分析系统中,原有架构使用 RDS MySQL (db.r5.large) 存储操作日志。随着业务增长,写入量从每秒几十条增加到每秒数千条,MySQL 方案暴露出几个问题: 高峰期 CPU 持续 90%+,影响查询响应 扩容需要停机或切换,无法平滑应对突发流量 为抗住峰值需要预 阅读全文
posted @ 2026-03-23 08:07
亚马逊云开发者
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号