摘要: 在上一节里,我们介绍了现在的语义缓存层是怎么做的。它的逻辑很简单: 把用户的问题转成向量 在向量数据库里匹配最接近的问题 最相似的问题相似度是否 >=0.9 ? 如果是,就直接返回这个问题的答案 否则走完整个RAG流程 博主的配置如下: 项 配置 备注 成本 向量数据库 milvus-lite 本地 阅读全文
posted @ 2026-06-01 19:55 SegaLee 阅读(4) 评论(0) 推荐(0)
摘要: 在上一篇文章里,我介绍了我在构建机器人MVP时处理数据时的发现。本章中,我会介绍一下近来的一些存在做法,以及把这个逻辑运用到我的系统中时出现的问题。 一、方案调研 我在五月初完成我的智能体构建和评估。demo通过之后,我开始着手研究有什么办法来处理这种问答对类型的知识。显然我并不是第一个注意到这种问 阅读全文
posted @ 2026-05-31 15:07 SegaLee 阅读(5) 评论(0) 推荐(0)
摘要: 最近给一个大规模代码仓库构建了一个问答智能体,知识库的范围包括大概18个子仓库,数据大概包括三类: 历史问答对(后面我会把它们叫做QA),来自开源共建答疑群,大约50条; 开发文档,主要是设计文档,包括各个板块,加起来大约七八十个doc文档; 开源代码仓库,二十多个.md文档,还有源代码; 整个过程 阅读全文
posted @ 2026-05-30 21:37 SegaLee 阅读(4) 评论(0) 推荐(0)