上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 64 下一页
摘要: 大模型推理成本是一个工程问题,不是调参问题。核心在于根据任务特征选择合适的计费模式,而不是试图压缩单次推理的 token 数。 Bedrock 定价体系分析 Amazon Bedrock 的定价体系有四个层级,从亚马逊云科技官方定价页面(aws.amazon.com/cn/bedrock/prici 阅读全文
posted @ 2026-03-17 19:44 亚马逊云开发者 阅读(123) 评论(0) 推荐(0)
摘要: AI 编程工具的核心矛盾是什么? 速度和可控性的 trade-off。即兴生成(给一句话直接出代码)速度快,但复杂项目的可控性差——生成的代码偏离意图、多人协作风格不一、缺乏文档沉淀。 Kiro 是亚马逊云科技推出的 AI 原生 IDE,选择了另一条路:先写规范,再写代码。我花两天时间完整体验了一遍 阅读全文
posted @ 2026-03-17 12:03 亚马逊云开发者 阅读(108) 评论(0) 推荐(0)
摘要: 前言 在做技术选型的时候,"用不用 Serverless" 这个问题经常被讨论。这篇文章不谈理论,记录一次真实的迁移过程——把一个跑在 EC2 上的 AI 问答服务,迁移到 Lambda + Bedrock 的 Serverless 架构。重点分析迁移动机、技术实现、踩坑过程和最终效果。 迁移动机 阅读全文
posted @ 2026-03-17 08:03 亚马逊云开发者 阅读(25) 评论(0) 推荐(0)
摘要: 问题定义 大语言模型的全参数微调(Full-rank SFT)存在一个固有矛盾:参数空间是共享的,学习领域特定模式时会不可避免地干扰原有的通用能力编码。这就是灾难性遗忘(Catastrophic Forgetting)。 表现为:微调后领域任务指标提升,但 MMLU 等通用基准分数显著下降,指令遵循 阅读全文
posted @ 2026-03-16 20:22 亚马逊云开发者 阅读(31) 评论(0) 推荐(0)
摘要: 问题定义 大语言模型的全参数微调(Full-rank SFT)存在一个固有矛盾:参数空间是共享的,学习领域特定模式时会不可避免地干扰原有的通用能力编码。这就是灾难性遗忘(Catastrophic Forgetting)。 表现为:微调后领域任务指标提升,但 MMLU 等通用基准分数显著下降,指令遵循 阅读全文
posted @ 2026-03-16 19:52 亚马逊云开发者 阅读(29) 评论(0) 推荐(0)
摘要: 背景 RAG(Retrieval Augmented Generation)系统中,向量存储是核心组件之一。传统方案使用专用向量数据库,性能优异但运维成本高——集群需要 7×24 运行,不管是否有查询请求。 Amazon S3 Vectors 提供了一种不同的思路:将向量存储能力作为 S3 的原生 阅读全文
posted @ 2026-03-16 16:08 亚马逊云开发者 阅读(20) 评论(0) 推荐(0)
摘要: 问题背景 长期运行的 AI Agent 面临一个工程问题:如何管理持续增长的对话历史? 简单方案是把所有对话塞进 context window,但这带来三个问题:token 消耗线性增长、信息冲突无法自动解决、冗余数据拉低检索精度。另一个极端是只保留最近 N 轮,代价是丢失用户偏好和历史经验。 本文 阅读全文
posted @ 2026-03-16 15:03 亚马逊云开发者 阅读(109) 评论(0) 推荐(0)
摘要: 背景 AI Agent 的能力边界取决于它能调用的工具。当前主流的工具接入方式是 function calling——模型输出结构化的函数调用请求,应用层解析后执行。 这个方案在工具数量少的时候够用。但随着 Agent 需要接入的工具增多(存储、数据库、消息队列、内部 API...),每个工具都需要 阅读全文
posted @ 2026-03-13 20:00 亚马逊云开发者 阅读(62) 评论(0) 推荐(0)
摘要: 问题定义 传统应用的安全模型建立在一个假设上:应用的行为是确定性的。代码审查通过了,行为就是可预测的。 AI Agent 打破了这个假设。Agent 根据自然语言 prompt 和运行时上下文动态决定调用哪些 API、传递什么参数。即使代码不变,不同的用户输入可能导致完全不同的 API 调用序列。 阅读全文
posted @ 2026-03-13 11:30 亚马逊云开发者 阅读(82) 评论(0) 推荐(0)
摘要: 引子 AI 辅助编程工具发展到今天,一个核心矛盾越来越明显:模型能力在涨,但开发者对生成代码的控制力在降。 你让 AI 写一个函数,它可能写得比你好。但你让它写一个系统,它大概率会把架构搞砸——不是因为它不会写代码,而是因为它不知道你要什么。 传统 chat 式 AI 编程交互缓解了这个问题,但没有 阅读全文
posted @ 2026-03-13 07:30 亚马逊云开发者 阅读(190) 评论(0) 推荐(0)
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 64 下一页