RAG全栈学习笔记

RAG技术全栈指南第一章学习笔记

RAG的定位

  • 大模型私有知识库,低成本补充预训练+指令微调阶段缺少的“知识储备”
  • (对比:高成本SFT vs 手工Prompt)

RAG的作用

  • 增加上下文知识
  • 减少大模型幻觉
  • 增加生成的专业性

RAG的基本逻辑

Indexing -> Retrieval -> Generation

RAG的演进方向

  • 问题优化、嵌入优化、流程优化(第一章先搭建思维,后续技术细节可参考论文提炼),比如 Advanced RAG、Modular RAG
  • P.S: 项目中需考虑召回率(随复杂度提高)、检索速度(随复杂度降低)之间的平衡。

RAG的合规性

  • 私有化数据隔离
  • 参与实物交付和决策时需人工审核

RAG的框架

  • LangChain / LlamaIndex / 手工(不推荐)

RAG的向量库选择

主流向量库对比 (DeepSeek总结)

数据库 核心优势 适用场景 注意事项
Milvus 高扩展、分布式、生态成熟 超大规模向量检索、多模态 运维复杂度较高,适合企业级
Qdrant (Select) Rust开发、高性能、强过滤 高QPS、复杂过滤查询 云服务(Qdrant Cloud)简化部署
Weaviate 内置模块(重排序、多模态) 混合检索、一体化AI应用 学习曲线较陡
Chroma 轻量、易用、Python原生 原型开发、小规模应用 生产级功能较弱
pgvector PostgreSQL扩展、ACID支持 已用PG、需事务一致性 性能受单机限制
Elasticsearch 全文检索+向量、生态成熟 已用ES、需混合搜索 向量检索性能非最优

RAG的环境配置

  • 已完成

RAG的代码实践

  • 采用 LangChain 框架(可操作度高)
  • 采用 Qdrant 向量库(高性能、强过滤)
posted @ 2025-12-15 17:32  卞玮  阅读(3)  评论(0)    收藏  举报