摘要: 你的 AI 代理服务为何频繁 OOM?接口响应为何高达 3 秒?本文作者三味复盘了一次深夜生产事故,深度拆解了从“贪婪 Buffer 拼接”到“零拷贝流式管道”的重构过程。通过手写异步生成器、启用 HTTP/2 及熔断机制,我们将内存占用降低 90%,延迟压缩至 50ms。 阅读全文
posted @ 2026-01-30 13:02 Earic 阅读(20) 评论(0) 推荐(0)