RAG全栈学习笔记
RAG技术全栈指南第一章学习笔记
RAG的定位
- 大模型私有知识库,低成本补充预训练+指令微调阶段缺少的“知识储备”
- (对比:高成本SFT vs 手工Prompt)
RAG的作用
- 增加上下文知识
- 减少大模型幻觉
- 增加生成的专业性
RAG的基本逻辑
Indexing -> Retrieval -> Generation
RAG的演进方向
- 问题优化、嵌入优化、流程优化(第一章先搭建思维,后续技术细节可参考论文提炼),比如 Advanced RAG、Modular RAG
- P.S: 项目中需考虑召回率(随复杂度提高)、检索速度(随复杂度降低)之间的平衡。
RAG的合规性
- 私有化数据隔离
- 参与实物交付和决策时需人工审核
RAG的框架
- LangChain / LlamaIndex / 手工(不推荐)
RAG的向量库选择
主流向量库对比 (DeepSeek总结)
| 数据库 | 核心优势 | 适用场景 | 注意事项 |
|---|---|---|---|
| Milvus | 高扩展、分布式、生态成熟 | 超大规模向量检索、多模态 | 运维复杂度较高,适合企业级 |
| Qdrant (Select) | Rust开发、高性能、强过滤 | 高QPS、复杂过滤查询 | 云服务(Qdrant Cloud)简化部署 |
| Weaviate | 内置模块(重排序、多模态) | 混合检索、一体化AI应用 | 学习曲线较陡 |
| Chroma | 轻量、易用、Python原生 | 原型开发、小规模应用 | 生产级功能较弱 |
| pgvector | PostgreSQL扩展、ACID支持 | 已用PG、需事务一致性 | 性能受单机限制 |
| Elasticsearch | 全文检索+向量、生态成熟 | 已用ES、需混合搜索 | 向量检索性能非最优 |
RAG的环境配置
- 已完成
RAG的代码实践
- 采用 LangChain 框架(可操作度高)
- 采用 Qdrant 向量库(高性能、强过滤)

浙公网安备 33010602011771号