摘要: 本文分析 Claude Code 企业级使用中的代码安全和成本优化问题,通过 Amazon SageMaker 部署开源模型、LiteLLM Proxy 实现任务动态路由的完整架构方案。包括 SGLang 推理引擎部署、Task Router 实现和流式响应适配的技术细节。 两个核心痛点 代码安全: 阅读全文
posted @ 2026-05-05 20:04 亚马逊云开发者 阅读(17) 评论(0) 推荐(0)
摘要: 深入理解 EKS 节点自愈架构:NPD + npd-node-replace 的设计与实现 管 K8s 集群的人都绕不开一个问题——节点故障处理。内核崩溃、OOM、硬件坏了,节点变成 NotReady。手动 drain、手动替换,半夜来一次谁都受不了。这篇从架构层面拆解一下 npd-node-rep 阅读全文
posted @ 2026-05-05 11:04 亚马逊云开发者 阅读(12) 评论(0) 推荐(0)
摘要: 深入理解 Strands Agents SDK:从 @tool 装饰器到多 Agent 协作的工程实践 引子 我之前花了不少时间折腾 AI Agent。遇到的核心难题就一个:工具调度。 用户说一句话,你怎么判断该调哪个工具?调完之后结果怎么回传给模型?多个工具之间有依赖关系怎么处理? 这些问题看似简 阅读全文
posted @ 2026-05-05 08:03 亚马逊云开发者 阅读(17) 评论(0) 推荐(0)
摘要: 一、问题的起点 去年底我接手了一个棘手的任务:把团队三个 Aurora PostgreSQL 14.9 集群升级到 16.4。说实话接到这个活儿的时候心里是拒绝的——数据库是有状态服务,出了问题不是重启一下能搞定的事。 但没得选。PG 14 的社区 EOL 是 2026 年 11 月,亚马逊云科技的 阅读全文
posted @ 2026-05-05 07:35 亚马逊云开发者 阅读(8) 评论(0) 推荐(0)