智能化-技术体系
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
LangChain 是一个用于构建大语言模型(LLM)应用的开源开发框架,核心是把 LLM、外部数据、工具与业务流程标准化串联,快速开发出具备上下文感知、数据检索、工具调用能力的复杂 AI 应用LangChain。
一、核心定位与价值
- 不是大模型本身,而是LLM 应用的 “中间件 / 编排层”。
- 解决 LLM 三大痛点:无实时 / 私有数据、无工具操作能力、难做多步骤复杂任务。
- 提供模块化、可组合、可扩展的组件,像搭积木一样快速构建应用。
- 支持 Python / JavaScript 双栈,生态完善LangChain。
二、核心组件(最常用)
1. Model I/O(模型层)
- LLM Wrappers:统一接口封装 OpenAI、Anthropic、Gemini、LLaMA、ChatGLM 等,一键切换模型。
- Prompt Templates:提示词模板,复用与动态填充变量。
- Output Parsers:把模型输出解析为结构化数据(JSON、列表、SQL 等)。
2. Chains(链式调用,核心)
- 把多个组件按顺序 / 条件串成可复用流程。
- 常用内置链:
- LLMChain:最基础的 “提示词 + 模型调用”。
- SequentialChain:多步骤顺序执行。
- RetrievalQA / RAGChain:检索增强生成(RAG),先查知识库再生成。
- SQLDatabaseChain:自然语言转 SQL、查库、返回自然语言答案。
- LCEL(LangChain Expression Language):声明式语法,灵活组合组件,支持流式、并行、异常处理。
3. Retrieval(数据检索,RAG 核心)
- Document Loaders:加载 PDF、Word、Markdown、数据库、网页、API 等数据。
- Text Splitters:长文本分块,适配模型上下文窗口。
- Embeddings:文本转向量(OpenAI、BGE、文心等)。
- Vector Stores:向量数据库(Chroma、FAISS、Pinecone、Milvus 等),做语义检索。
- Retrievers:从向量库 / 文档中检索相关上下文。
4. Memory(记忆管理)
- 让 LLM 记住对话历史与上下文LangChain。
- 常用:
- ConversationBufferMemory:缓存完整对话。
- ConversationSummaryMemory:对话摘要,节省 tokens。
- VectorStoreRetrieverMemory:长期记忆(向量库)。
5. Agents & Tools(智能代理)
- Agent:让 LLM 自主决策、动态调用工具、完成多步骤复杂任务。
- Tools:内置 / 自定义工具(搜索引擎、计算器、代码解释器、API、数据库、文件操作等)。
- 典型场景:自然语言查数据库、联网搜索、写代码并运行、调用第三方服务。
三、典型应用场景
- 企业知识库问答 / 智能客服(RAG + 记忆)。
- 自然语言数据分析 / SQL 生成。
- 文档处理(总结、翻译、信息抽取、问答)。
- 聊天机器人 / 虚拟助手(多轮对话 + 工具调用)。
- 代码助手(生成、解释、调试、运行)。
- 自动化工作流(邮件、报表、审批、数据同步)。
四、生态工具
- LangSmith:调试、测试、评估、监控 LLM 应用Langchain。
- LangServe:把 Chain/Agent 快速部署为 REST APILangchain。
- LangGraph:构建复杂、循环、状态 ful 的工作流与智能体。
- LangChain Templates:开箱即用的应用模板(RAG、SQL Agent、Chatbot 等)Langchain。
五、一句话总结
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
向量化 / 召回 / 重排、图像 OCR 版面、基础大模型、行业大模型,一次性讲透。
模型层整体定位
- 表示模型:把文本 / 图像变成向量
- 感知模型:看懂文档、图片、表格
- 大语言模型:理解、推理、生成
- 行业大模型:垂直领域专精
一、表示学习模型(向量、召回、排序)
1. 向量模型(Embedding)
BGE-M3(当前最主流通用)
- 机构:BAAI 智源
- 特点:多语言、超长上下文、统一向量空间
- 能力:
- 支持短文本 / 长文档
- 支持中英文混合
- 检索精度极高
- 用途:RAG 召回主干
其他常用向量
- bge-base、bge-large
- text-embedding-ada-002(OpenAI)
- jina-embeddings-v2(长上下文强)
- Qwen-Embedding、GLM-Embedding(国产)
2. 召回模型(Retrieval)
- 向量召回( you have: bge-m3 )
- 关键词召回(BM25)
- 混合召回 = 向量 + 关键词(最稳)
3. 排序模型(Reranker)
bge-reranker-v2-m3(最强开源重排之一)
- 作用:给召回的段落重新排序
- 输入:query + 文本
- 输出:0~1 相关性分数
- 效果:直接决定 RAG 答案准不准
其他常用
- bge-reranker-large
- Cohere Rerank
- Jina-Reranker
二、感知类模型(图像 / OCR / 版面分析)
1. OCR 模型
- PaddleOCR(百度飞浆,国产最强、开源、多语言)
- EasyOCR
- Tesseract
- 阿里 / 腾讯云 OCR
2. 版面分析模型(Layout Analysis)
- LayoutLMv3(微软)
- PaddleLayout(百度)
- UniDoc(文档通用)
3. 表格识别(Table Recognition)
- TableTransformer
- PaddleTable
- StructEqTable(表格 + 公式)
4. 图像识别 / 多模态模型
- Qwen-VL
- GLM-4V
- Llama 3.2 Vision
- MiniCPM-V
三、基础大模型(基座 LLM)
1. Qwen(阿里通义千问)
- 版本:Qwen 3 / 3.5 / Qwen-MoE
- 优势:中文极强、长上下文、多模态、推理强
- 适合:RAG、Agent、企业通用、客服、知识库
2. DeepSeek(深度求索)
- 版本:DeepSeek-V3 / V3.2
- 优势:代码、数学、推理顶尖
- 许可:MIT(最宽松)
- 适合:NL2SQL、代码助手、数据分析、Agent
3. ChatGLM / GLM(智谱)
- 版本:GLM-4 / GLM-4.7 / GLM-5
- 优势:对话自然、工程化强、国产芯片适配好
- 适合:政企私有化、办公助手、长文本
4. 其他国际基座
- Llama 3 / 4(Meta)
- Mistral
- Phi(微软小模型)
四、行业大模型(垂直领域专用)
1. 法律大模型
ChatLaw
- 机构:北大 / 智谱
- 定位:法律问答、法条检索、案件分析
LawGPT
- 开源法律 LLM
- 功能:法律咨询、合同审查、法律文书生成
LexPro
- 法律专业级
- 面向律所、法务、法院场景
通用能力
- 法条检索
- 合同审查、风险点提取
- 法律文书生成
- 案件预测、类案匹配
2. 其他常见行业大模型(你方案里可直接写)
- 医疗大模型:MedGPT、HuatuoGPT
- 教育大模型:教育对话、题库、批改
- 金融大模型:研报分析、合规、风控
- 政企 / 政务大模型:公文、政策、脱敏、合规
- 代码大模型:CodeLlama、Qwen-Coder、DeepSeek-Coder
五、模型层整体架构(可直接复制进方案)
模型层
├─ 表示学习模型
│ ├─ 向量模型:bge-m3、bge-large、Qwen-Embedding
│ └─ 排序模型:bge-reranker-v2-m3
├─ 感知模型
│ ├─ OCR:PaddleOCR
│ ├─ 版面分析:LayoutLMv3、PaddleLayout
│ ├─ 表格识别
│ └─ 多模态:Qwen-VL、GLM-4V
├─ 基础大模型
│ ├─ Qwen 系列
│ ├─ DeepSeek 系列
│ ├─ GLM / ChatGLM 系列
│ └─ Llama、Mistral
└─ 行业大模型
├─ 法律:ChatLaw、LawGPT、LexPro
├─ 医疗
├─ 金融
└─ 代码/政企/教育
- 可插入 PPT 的 Mermaid 模型层架构图
- 一份 正式方案版《模型层技术设计》文档
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



浙公网安备 33010602011771号