会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
沐子馨
博客园
首页
新随笔
联系
管理
订阅
2026年5月31日
写出让 AI “秒懂”的技能Skill
摘要: 心法一:编写 Skill,需要人类的“同理心”和“共情能力” 这可能听起来有些反直觉。我们在写代码时,面对的是冷冰冰的编译器;但在写 Skill 时,我们面对的是具有极强“心智理论能力”的大语言模型(如 Gemini 3.x pro、Claude 4.6、GPT 5.x 等)。 过去,我们在写 Pr
阅读全文
posted @ 2026-05-31 16:42 沐子馨
阅读(4)
评论(0)
推荐(0)
2026年5月29日
深入理解 RAG 中的格式化生成与函数调用
摘要: 从大语言模型(LLM)那里获得一段非结构化的文本在应用中常常不满足实际需求。为了实现更复杂的逻辑、与外部工具交互或以用户友好的方式展示数据,需要模型能够输出具有特定结构的数据,例如 JSON 或 XML。 本篇将讨论实现格式化生成的几种主流方法,包括 LangChain、LlamaIndex 等框架
阅读全文
posted @ 2026-05-29 12:37 沐子馨
阅读(6)
评论(0)
推荐(0)
2026年5月26日
解锁 RAG 系统中的高级检索与重排序策略
摘要: 在基础的 RAG 流程中,依赖向量相似度从知识库中检索信息。不过,这种方法存在一些固有的局限性,例如最相关的文档不总是在检索结果的顶端,以及语义理解的偏差等。为了构建更强大、更精准的生产级 RAG 应用,需要引入更高级的检索技术。 一、重排序 (Re-ranking) 1.1 RRF (Recipr
阅读全文
posted @ 2026-05-26 13:18 沐子馨
阅读(15)
评论(0)
推荐(0)
2026年5月25日
掌握查询重构与智能路由的艺术
摘要: 此前已经学习了如何从不同类型的数据源(如向量数据库、关系型数据库)中构建查询。然而,用户的原始问题往往不是最优的检索输入。它可能过于复杂、包含歧义,或者与文档的实际措辞存在偏差。为了解决这些问题,我们需要在检索之前对用户的查询进行“预处理”,这就是本节要探讨的查询重构与分发。 这个阶段主要包含两个关
阅读全文
posted @ 2026-05-25 14:06 沐子馨
阅读(9)
评论(0)
推荐(0)
2026年5月24日
告别黑盒:手把手实现一个可解释、可调试的 Text2SQL 代理系统
摘要: 本篇聚焦于结构化数据领域中一个常见的应用。在数据世界中,除了向量数据库能够处理的非结构化数据,关系型数据库(如 MySQL, PostgreSQL, SQLite)同样是存储和管理结构化数据的重点。文本到SQL(Text-to-SQL)1 正是为了打破人与结构化数据之间的语言障碍而生。它利用大语言模
阅读全文
posted @ 2026-05-24 23:37 沐子馨
阅读(9)
评论(0)
推荐(0)
2026年5月23日
告别简单向量搜索:RAG 中的高级查询构建与优化策略
摘要: 在实际应用中,我们常常需要处理更加复杂和多样化的数据,包括结构化数据(如SQL数据库)、半结构化数据(如带有元数据的文档)以及图数据。用户的查询也可能不仅仅是简单的语义匹配,而是包含复杂的过滤条件、聚合操作或关系查询。 查询构建(Query Construction)1 正是应对这一挑战的关键技术。
阅读全文
posted @ 2026-05-23 22:11 沐子馨
阅读(6)
评论(0)
推荐(0)
2026年5月22日
深入理解 RAG 中的混合搜索策略
摘要: 混合检索(Hybrid Search)是一种结合了 稀疏向量(Sparse Vectors) 和 密集向量(Dense Vectors) 优势的先进搜索技术。旨在同时利用稀疏向量的关键词精确匹配能力和密集向量的语义理解能力,以克服单一向量检索的局限性,从而在各种搜索场景下提供更准确、更鲁棒的检索结果
阅读全文
posted @ 2026-05-22 14:42 沐子馨
阅读(10)
评论(0)
推荐(0)
2026年5月21日
告别基础检索:掌握 RAG 中的句子窗口与递归路由策略
摘要: 一、上下文扩展 在RAG系统中,常常面临一个权衡问题:使用小块文本进行检索可以获得更高的精确度,但小块文本缺乏足够的上下文,可能导致大语言模型(LLM)无法生成高质量的答案;而使用大块文本虽然上下文丰富,却容易引入噪音,降低检索的相关性。为了解决这一矛盾,LlamaIndex 提出了一种实用的索引策
阅读全文
posted @ 2026-05-21 11:59 沐子馨
阅读(16)
评论(0)
推荐(0)
2026年5月18日
构建多模态检索系统:Milvus 部署、Schema 设计与混合检索实践
摘要: 一、简介 Milvus 是一个开源的、专为大规模向量相似性搜索和分析而设计的向量数据库。它诞生于 Zilliz 公司,并已成为 LF AI & Data 基金会的顶级项目,在AI领域拥有广泛的应用。 与 FAISS、ChromaDB 等轻量级本地存储方案不同,Milvus 从设计之初就瞄准了生产环境
阅读全文
posted @ 2026-05-18 16:15 沐子馨
阅读(23)
评论(0)
推荐(0)
2026年5月17日
向量数据库原理与实战:从核心机制到 FAISS 应用
摘要: 一、向量数据库的作用 在前面我们学习了如何使用嵌入模型将文本、图像等非结构化数据转换为高维向量。这些向量是 RAG 系统能够进行语义理解的基础。然而,当向量数量从几百个增长到数百万甚至数十亿时,一个核心问题随之而来:如何快速、准确地从海量向量中找到与用户查询最相似的那几个? 1.1 向量数据库主要功
阅读全文
posted @ 2026-05-17 12:38 沐子馨
阅读(39)
评论(0)
推荐(0)
下一页
公告