摘要:
大模型推理成本是一个工程问题,不是调参问题。核心在于根据任务特征选择合适的计费模式,而不是试图压缩单次推理的 token 数。 Bedrock 定价体系分析 Amazon Bedrock 的定价体系有四个层级,从亚马逊云科技官方定价页面(aws.amazon.com/cn/bedrock/prici 阅读全文
posted @ 2026-03-17 19:44
亚马逊云开发者
阅读(59)
评论(0)
推荐(0)
摘要:
AI 编程工具的核心矛盾是什么? 速度和可控性的 trade-off。即兴生成(给一句话直接出代码)速度快,但复杂项目的可控性差——生成的代码偏离意图、多人协作风格不一、缺乏文档沉淀。 Kiro 是亚马逊云科技推出的 AI 原生 IDE,选择了另一条路:先写规范,再写代码。我花两天时间完整体验了一遍 阅读全文
posted @ 2026-03-17 12:03
亚马逊云开发者
阅读(63)
评论(0)
推荐(0)
摘要:
前言 在做技术选型的时候,"用不用 Serverless" 这个问题经常被讨论。这篇文章不谈理论,记录一次真实的迁移过程——把一个跑在 EC2 上的 AI 问答服务,迁移到 Lambda + Bedrock 的 Serverless 架构。重点分析迁移动机、技术实现、踩坑过程和最终效果。 迁移动机 阅读全文
posted @ 2026-03-17 08:03
亚马逊云开发者
阅读(10)
评论(0)
推荐(0)

浙公网安备 33010602011771号