小七-七牛开发者

2026年6月

摘要：

本文以世界杯进球瞬间的流量高峰为切入点，剖析体育App背后的高并发工程体系：通过流量分层（静态/热点/动态/互动）、事件驱动、多模式数据更新（WebSocket/SSE/轮询）、分层缓存、消息队列削峰解耦、视频智能分发及精细化降级限流等策略，系统性保障核心体验。阅读全文

posted @ 2026-06-17 18:10 小七-七牛开发者阅读(6) 评论(0) 推荐(0)

世界杯一粒进球被吹掉，背后可能有多少 AI？

摘要：

世界杯进球被吹？背后是VAR+AI的精密协作：摄像机追踪29个身体点、球内传感器锁定传球瞬间、AI自动生成越位线与3D动画，再经VAR复核、主裁终裁。AI负责“测得准”，裁判负责“判得明”——技术让判罚更透明，却未消除规则语境下的争议。阅读全文

posted @ 2026-06-17 08:21 小七-七牛开发者阅读(180) 评论(0) 推荐(1)

周一上线｜瑞幸把咖啡做进 CLI，Fable 5 短暂登场，Stonk Rider 骑上 K 线图

摘要：

一边，模型和开发者工具还在继续往真实工作流里走：Gemini 3.5 Live Translate 开始做近实时语音翻译，Kimi-K2.7-Code 开源，DiffusionGemma 探索更快的文本生成，Codex 和 Chrome DevTools 也在继续给 Agent 补浏览器能力。另一边，社区里照样很会玩：有人把咖啡下单做成 CLI，有人把股票走势变成摩托赛道，有人给终端塞进会吞文字的黑洞，还有一张“前端兄弟快回来吧”的梗图讲完了全栈开发的精神状态。阅读全文

posted @ 2026-06-16 09:27 小七-七牛开发者阅读(219) 评论(0) 推荐(1)

面向 DeepSeek-V4 的 FlashMemory：长上下文 KV Cache 如何压到约 1/10

摘要：

长上下文模型的能力越来越强，能读的内容也越来越长。但一到真实推理服务里，问题很快就会落到显存上。更准确地说，是 KV Cache。在大模型自回归生成过程中，模型每生成一个 token，都需要参考此前已经读过的上下文。为了避免每一步都重新计算历史内容，推理系统会把历史 token 对应的 Key 和 Value 缓存下来。上下文越长，这部分缓存就越大。到了 128K、500K 甚至更长的上下文，KV Cache 往往会成为长上下文服务里最沉重的一笔显存开销。阅读全文

posted @ 2026-06-15 18:15 小七-七牛开发者阅读(16) 评论(0) 推荐(0)

Codex 实践系列 Vol.02：让 Codex 读懂开源项目 Typer

摘要：

这次用 Codex 读 Typer，最重要的一点是：面对一个新项目，第一步先别急着让它写代码。比较稳妥的做法，是先让 Codex 读目录、找入口、解释核心文件，再沿着一个具体功能追下去，最后通过测试理解项目如何验证行为。阅读全文

posted @ 2026-06-15 16:18 小七-七牛开发者阅读(339) 评论(0) 推荐(1)

世界杯开幕了，手把手教你做个看球小工具

摘要：

这个小工具不复杂，但它能练到几个很实用的点：结构化数据怎么设计、命令行参数怎么接、跨时区时间怎么换算，以及为什么“按日期查比赛”这件事在世界杯这种跨时区场景里并不简单。阅读全文

posted @ 2026-06-12 18:42 小七-七牛开发者阅读(50) 评论(0) 推荐(0)

Skills 是什么？Claude 官方教你做一个好用的 Skill

摘要：

Skills 可以理解成 Claude Code 给 Agent 准备的任务经验包。它把一类任务里反复出现的说明、脚本、模板、配置、坑点和历史记录放在一起，让 Claude 下次遇到类似任务时，可以直接复用已有经验。阅读全文

posted @ 2026-06-11 17:03 小七-七牛开发者阅读(73) 评论(0) 推荐(0)

AI Agent 的 4 个工程关键词：Prompt、Context、Loop、Harness 到底是什么？

摘要：

Prompt、Context、Loop、Harness 这四个词，可以看成 AI Agent 工作流里的四个关注点：怎么问、给它看什么、怎么持续推进，以及在哪里安全运行。其中，Loop Engineering，重点关注“持续推进”这一环节。它关心的是，如何把原本由人一轮轮推动的“提示—执行—检查—修正”过程，设计成一个清晰、可控、容易沉淀经验的循环。这也是 AI Agent 从“能回答问题”，走向“能完成任务”时，一个很关键的变化。阅读全文

posted @ 2026-06-11 16:03 小七-七牛开发者阅读(400) 评论(0) 推荐(0)

为什么Analytics Agent 总答错？来自 Anthropic 的数据分析最佳实践

摘要：

数据分析 Agent 的核心瓶颈，不是 SQL 生成能力，而是业务上下文。不要指望 Agent 在混乱的数据体系里自动找出标准答案。你需要先把数据环境整理成 Agent 能导航、能理解、能验证的结构。阅读全文

posted @ 2026-06-10 15:39 小七-七牛开发者阅读(21) 评论(0) 推荐(0)

从 Claude Code 动态工作流看 Agent Harness 设计

摘要：

复杂任务不能只靠一个上下文一路做到底。任务需要拆分，上下文需要隔离，验证需要独立，流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算，避免所有事情都挤在同一个执行路径里。这些设计放在 Claude Code 里，是 Dynamic Workflows；放到更大的 Agent 系统里，其实就是 Agent Harness 要解决的问题。阅读全文

posted @ 2026-06-10 15:19 小七-七牛开发者阅读(42) 评论(0) 推荐(0)

公告