上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 499 下一页
摘要: 在实际开发 AI 应用的过程中,我们经常会遇到重复输入的情况: 同一用户多次询问相同的问题 刷新页面或误触按钮触发了相同请求 不同用户提出了内容高度相似的问题 如果每次都让大模型重新生成响应,不仅效率低下,还会带来不必要的计算成本。为了解决这个问题,我们可以引入“缓存机制”。 启用缓存的好处 提升响 阅读全文
posted @ 2025-10-18 17:05 Zhentiw 阅读(44) 评论(0) 推荐(0)
摘要: LangChain 支持两类主流语言模型: 文本补全模型 对话模型 文本补全模型 Text Completion Models 这类模型以一段纯文本作为输入,输出结果是一段连续生成的文字(这里的输出文本其实就是对前面输入文本的一个补全),不区分说话角色,也不会自动记录上下文。它们通常用于单轮任务,如 阅读全文
posted @ 2025-10-15 19:39 Zhentiw 阅读(71) 评论(0) 推荐(0)
摘要: 在大模型时代,LangChain 是一个帮助开发者快速构建“智能应用” 的工具框架。它像是你搭建 AI 应用时的“万能胶水”——把大模型(如 OpenAI、LLM API)、工具(如搜索引擎、数据库)、记忆能力、链式调用等模块统统串联起来,组成一个可交互、可记忆、有逻辑的智能体(Agent)。 基本 阅读全文
posted @ 2025-10-15 19:24 Zhentiw 阅读(278) 评论(0) 推荐(0)
摘要: LoRA 英文全称为 Low-Rank Adaptation,中文:“低秩适配器” 秩的概念 英文 Rank 中文:秩 所谓秩,指的就是一个矩阵中 真正包含的信息量 有多少。 🙋小红买了 3 个苹果 4 个桃子,花了 18 元,小明买了 2 个苹果 3 个桃子,花了 13 元,请问苹果和桃子各多少 阅读全文
posted @ 2025-10-13 13:52 Zhentiw 阅读(68) 评论(0) 推荐(0)
摘要: 英文:Fine-tuning 中文:大模型微调 大模型的构建其实分为 2 个阶段: 预训练(pre-training):此阶段模型会在 大规模、多样化的数据集 上进行训练,从而形成全面的语言理解能力。 微调(fine-tuning):在规模较小的 特定任务或特定领域数据集 上对模型进行 针对性的训练 阅读全文
posted @ 2025-10-13 13:52 Zhentiw 阅读(68) 评论(0) 推荐(0)
摘要: RAG架构演进 RAG 的概念和思想最早是在 2020 年由 Meta 公司的技术团队在文章 “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks” 中正式提出的,用于给当时已经开始出现的大型预训练语言模型提供来自外部的 阅读全文
posted @ 2025-10-12 16:42 Zhentiw 阅读(97) 评论(0) 推荐(0)
摘要: RAG经典架构: 数据索引 读取外挂语料库的时候,语料库是一个 pdf 文件,需要一个额外的依赖:pdf-parse 转化为向量嵌入:nomic-embed-text function getEmbedding(text) { const res = await fetch("http://loca 阅读全文
posted @ 2025-10-12 16:41 Zhentiw 阅读(28) 评论(0) 推荐(0)
摘要: type ErrorWithMessage = { message: string } function isErrorWithMessage(error: unknown): error is ErrorWithMessage { return ( typeof error 'object' && 阅读全文
posted @ 2025-10-09 19:06 Zhentiw 阅读(12) 评论(0) 推荐(0)
摘要: 远程通信方式 通信方式: Stdio: 推荐,高效、简洁、本地 Streamable HTTP: 远程 前置知识 SSE 全称 Server-Sent Events,中文是“服务器发送事件”。是一种基于 HTTP 的单向通信协议,由浏览器发起连接,服务器可以持续不断地向客户端推送数据。 你可以把它想 阅读全文
posted @ 2025-10-06 14:22 Zhentiw 阅读(208) 评论(0) 推荐(0)
摘要: 远程通信方式 通信方式: Stdio: 推荐,高效、简洁、本地 Streamable HTTP: 远程 前置知识 SSE 全称 Server-Sent Events,中文是“服务器发送事件”。是一种基于 HTTP 的单向通信协议,由浏览器发起连接,服务器可以持续不断地向客户端推送数据。 你可以把它想 阅读全文
posted @ 2025-10-06 02:53 Zhentiw 阅读(40) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 499 下一页