AI
刷新
15天学会AI应用开发(七)有了大模型为什么还要引入RAG

博主头像 ​前面的文章依次介绍了如何截断历史会话的对话记录,包括按照记录数量截断、按照Token长度截断,以及浓缩为摘要截断等等,其中摘要操作又分为三大类: 1、使用第三方的摘要库对文本摘要; 2、使用在线大模型对文本摘要; 3、使用离线大模型对文本摘要; 以上对会话记录的各种处理操作,统称为AI应用的上下文 ...

从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线

博主头像 一、前言 作为一名普通开发人员,我对 AI 工具的上手其实算比较晚。今年五月以前,基本还只是把 AI 当作聊天机器人使用。有时听同事提到一些关键词都听不懂,甚至不知道该如何提问,心里多少有些惭愧。直到最近因为一个契机,沉下心认真摸索了一段时间,才真正感受到 AI 工具的魅力和强大,也切身体会到它对生 ...

深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力

博主头像 上一篇我们把现代大模型的五个核心模块拼回了 LLaMA 这个完整案例中,可以看到注意力机制仍然是计算最密集的部分。 而这个密集程度在序列变长时,会变得越来越恐怖: 标准自注意力的计算复杂度和空间复杂度都是 \(O(n^2)\):序列长度翻倍,计算量翻四倍,内存占用也翻四倍。 而在之前,我们用 KV ...

给 AI Agent 使用 Puppeteer 之前,先定义浏览器边界

Puppeteer 是非常适合 AI coding agent 使用的工具。它用 Node.js API 控制 Chrome 或 Firefox,可以做浏览器自动化、截图、网页抓取、页面检查、网络请求观察和重复性 Web 任务。 但这也是风险来源。 一旦 Agent 能打开浏览器,它就可能接触真实网 ...

六个视频类Agent Skills

博主头像 6 个的视频类Skills: 1. HyperFrames 一句话生成动效视频,文章、推文、产品介绍都能变成 MP4。适合产品宣发、教程开场、社交短视频。 https://github.com/heygen-com/hyperframes 2. video-use 让 coding agent 帮你 ...

工业级 AI Skill 构建指南

博主头像 工业级 AI Skill 构建指南:从单次指令到工程化工作流 在 AI 原生应用的软件工程范式中,我们正经历从“提示词工程(Prompt Engineering)”向“技能工程(Skill Engineering)”的战略跃迁。对于架构师而言,单次 Prompt 的随机性是生产环境的死敌。工业级 S ...

杀疯了!OpenAI 宣布 Codex 可以免费重置额度了,最多可以免费重置 4 次(附重置指南,赶快冲!!)

博主头像 大家好,我是R哥。 奥特曼大善人啊,今天无意间发现 Codex 可以免费重置次额度了,最多可以重置 4 次,没有任何套路,简单粗暴,,重置方法如下。 先说第一种: 首先点击左下角设置菜单: 如果你看不到这个重置菜单项,请更新到最新版本再看下。 然后再点击「1 次可用重置」菜单: 再点击「重置使用次数 ...

<1234···50>