SegaLee - 博客园

2026年6月

摘要：在上一节里，我们介绍了现在的语义缓存层是怎么做的。它的逻辑很简单：把用户的问题转成向量在向量数据库里匹配最接近的问题最相似的问题相似度是否 >=0.9 ？如果是，就直接返回这个问题的答案否则走完整个RAG流程博主的配置如下：项配置备注成本向量数据库 milvus-lite 本地阅读全文

posted @ 2026-06-01 19:55 SegaLee 阅读(4) 评论(0) 推荐(0)

2026年5月

浅谈RAG前的语义缓存层（2） —— 通过语义匹配找到相似问题

摘要：在上一篇文章里，我介绍了我在构建机器人MVP时处理数据时的发现。本章中，我会介绍一下近来的一些存在做法，以及把这个逻辑运用到我的系统中时出现的问题。一、方案调研我在五月初完成我的智能体构建和评估。demo通过之后，我开始着手研究有什么办法来处理这种问答对类型的知识。显然我并不是第一个注意到这种问阅读全文

posted @ 2026-05-31 15:07 SegaLee 阅读(5) 评论(0) 推荐(0)

浅谈RAG前的语义缓存层（1） —— 历史问答对适合直接丢知识库吗？

摘要：最近给一个大规模代码仓库构建了一个问答智能体，知识库的范围包括大概18个子仓库，数据大概包括三类：历史问答对（后面我会把它们叫做QA），来自开源共建答疑群，大约50条；开发文档，主要是设计文档，包括各个板块，加起来大约七八十个doc文档；开源代码仓库，二十多个.md文档，还有源代码；整个过程阅读全文

posted @ 2026-05-30 21:37 SegaLee 阅读(4) 评论(0) 推荐(0)

公告