RAG全栈学习笔记

RAG技术全栈指南第一章学习笔记

RAG的定位

大模型私有知识库，低成本补充预训练+指令微调阶段缺少的“知识储备”
（对比：高成本SFT vs 手工Prompt）

RAG的作用

增加上下文知识
减少大模型幻觉
增加生成的专业性

RAG的基本逻辑

Indexing -> Retrieval -> Generation

RAG的演进方向

问题优化、嵌入优化、流程优化（第一章先搭建思维，后续技术细节可参考论文提炼），比如 Advanced RAG、Modular RAG
P.S: 项目中需考虑召回率（随复杂度提高）、检索速度（随复杂度降低）之间的平衡。

RAG的合规性

私有化数据隔离
参与实物交付和决策时需人工审核

RAG的框架

LangChain / LlamaIndex / 手工（不推荐）

RAG的向量库选择

主流向量库对比 (DeepSeek总结)

数据库	核心优势	适用场景	注意事项
Milvus	高扩展、分布式、生态成熟	超大规模向量检索、多模态	运维复杂度较高，适合企业级
Qdrant (Select)	Rust开发、高性能、强过滤	高QPS、复杂过滤查询	云服务(Qdrant Cloud)简化部署
Weaviate	内置模块（重排序、多模态）	混合检索、一体化AI应用	学习曲线较陡
Chroma	轻量、易用、Python原生	原型开发、小规模应用	生产级功能较弱
pgvector	PostgreSQL扩展、ACID支持	已用PG、需事务一致性	性能受单机限制
Elasticsearch	全文检索+向量、生态成熟	已用ES、需混合搜索	向量检索性能非最优

RAG的环境配置

已完成

RAG的代码实践

采用 LangChain 框架（可操作度高）
采用 Qdrant 向量库（高性能、强过滤）

posted @ 2025-12-15 17:32 卞玮阅读(3) 评论(0) 收藏举报

刷新页面返回顶部