1 2 3 4 5 ··· 47 下一页
摘要: 我最近在研究亚马逊云科技新推出的 Lambda Durable Functions。这东西解决了一个 Lambda 用户长期面对的问题——如何在无服务器函数里跑长时间、多步骤的工作流。 以前要跑一个超过 15 分钟的流程,通常得自己搞一套状态机:多个 Lambda + SQS + DynamoDB 阅读全文
posted @ 2026-03-26 11:00 亚马逊云开发者 阅读(0) 评论(0) 推荐(0)
摘要: 本文以 Whisper 语音识别模型为例,深入分析 SageMaker HyperPod Cluster 的架构原理,包括异构 GPU 节点调度、TensorRT-LLM 编译优化、Triton 推理服务部署,以及基于 AMP/Grafana 的可观测性体系搭建。 为什么要聊这个 我最近在做一个语音 阅读全文
posted @ 2026-03-26 07:32 亚马逊云开发者 阅读(2) 评论(0) 推荐(0)
摘要: 背景 大模型联网搜索后做精确数值计算容易翻车。我测试过让模型搜两只股票市盈率做对比,搜到了正确网页,"推理"出来的数字却跟真实数据差了 30%。 根本原因:大模型做精确计数、排序、数值提取这类任务,天生不靠谱。它会数错、估错、跳过数据项。 Dynamic Filtering 解决这个问题的思路很直接 阅读全文
posted @ 2026-03-25 18:48 亚马逊云开发者 阅读(2) 评论(0) 推荐(0)
摘要: 最近在做 x86 到 ARM64 的迁移评估。发现亚马逊云科技和 Arm 联合推出了 Kiro Graviton Migration Power——一个基于 MCP 协议的 AI 迁移分析工具。 拿两个项目实测了一下,记录技术细节。 为什么迁移评估这么耗时 x86→ARM64 迁移的三个核心痛点: 阅读全文
posted @ 2026-03-25 17:16 亚马逊云开发者 阅读(4) 评论(0) 推荐(0)
摘要: 需求场景 团队想在飞书群里用上 AI 聊天机器人——代码审查、知识库问答、运维查询。从零搭 Agent 运行时工作量太大,需要一个轻量方案。 Kiro CLI 支持 Agent Client Protocol(ACP),可以直接做 Agent 后端。写一层桥接服务翻译飞书消息格式,Agent 推理/ 阅读全文
posted @ 2026-03-25 12:09 亚马逊云开发者 阅读(5) 评论(0) 推荐(0)
摘要: 搞 MCP 开发的应该都碰过这个问题——server 不记状态。每次请求都是从零开始,上一轮用户说了什么完全不知道。 这在简单场景没啥,但做复杂 agent 就很烦。比如订机票,用户得一口气把目的地、日期、人数、舱位全说清楚,不能分步来。 上周亚马逊云科技给 Bedrock AgentCore Ru 阅读全文
posted @ 2026-03-24 15:42 亚马逊云开发者 阅读(3) 评论(0) 推荐(0)
摘要: 搞 MCP 开发的应该都碰过这个问题——server 不记状态。每次请求都是从零开始,上一轮用户说了什么完全不知道。 这在简单场景没啥,但做复杂 agent 就很烦。比如订机票,用户得一口气把目的地、日期、人数、舱位全说清楚,不能分步来。 上周亚马逊云科技给 Bedrock AgentCore Ru 阅读全文
posted @ 2026-03-24 10:18 亚马逊云开发者 阅读(1) 评论(0) 推荐(0)
摘要: 引子 我之前花了不少时间折腾 AI Agent。遇到的核心难题就一个:工具调度。 用户说一句话,你怎么判断该调哪个工具?调完之后结果怎么回传给模型?多个工具之间有依赖关系怎么处理? 这些问题看似简单,写起来都是坑。 最近在用 Strands Agents SDK,发现它的设计思路很干脆——不做意图路 阅读全文
posted @ 2026-03-23 11:07 亚马逊云开发者 阅读(5) 评论(0) 推荐(0)
摘要: 公司有十几台 EC2 跑在 Private Subnet,运维流程是这样的: 连 VPN SSH 到堡垒机 从堡垒机 SSH 到目标实例 三层跳转,光认证就两分钟。堡垒机还得维护——打补丁、轮密钥、开安全审计。说白了它本身就是个攻击面,放在公网上等人来扫。 后来用了亚马逊云科技的 EC2 Insta 阅读全文
posted @ 2026-03-23 11:07 亚马逊云开发者 阅读(2) 评论(0) 推荐(0)
摘要: 上周五晚上 11 点,手机响了——线上服务 CPU 飙到 95%,用户开始投诉卡顿。 等我打开电脑登上服务器,已经过去 15 分钟了。手动扩了一台实例,又花了 5 分钟。整个故障影响了将近 20 分钟。 后来我花了一个下午搭了一套 CloudWatch 告警 + 自动响应系统。现在 CPU 超过 8 阅读全文
posted @ 2026-03-23 09:03 亚马逊云开发者 阅读(3) 评论(0) 推荐(0)
1 2 3 4 5 ··· 47 下一页