会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Answer1215
博客园
首页
新随笔
联系
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
499
下一页
2025年10月18日
[LangChain] 03. 缓存
摘要: 在实际开发 AI 应用的过程中,我们经常会遇到重复输入的情况: 同一用户多次询问相同的问题 刷新页面或误触按钮触发了相同请求 不同用户提出了内容高度相似的问题 如果每次都让大模型重新生成响应,不仅效率低下,还会带来不必要的计算成本。为了解决这个问题,我们可以引入“缓存机制”。 启用缓存的好处 提升响
阅读全文
posted @ 2025-10-18 17:05 Zhentiw
阅读(44)
评论(0)
推荐(0)
2025年10月15日
[LangChain] 02. 模型接口
摘要: LangChain 支持两类主流语言模型: 文本补全模型 对话模型 文本补全模型 Text Completion Models 这类模型以一段纯文本作为输入,输出结果是一段连续生成的文字(这里的输出文本其实就是对前面输入文本的一个补全),不区分说话角色,也不会自动记录上下文。它们通常用于单轮任务,如
阅读全文
posted @ 2025-10-15 19:39 Zhentiw
阅读(71)
评论(0)
推荐(0)
[LangChain] 基本介绍
摘要: 在大模型时代,LangChain 是一个帮助开发者快速构建“智能应用” 的工具框架。它像是你搭建 AI 应用时的“万能胶水”——把大模型(如 OpenAI、LLM API)、工具(如搜索引擎、数据库)、记忆能力、链式调用等模块统统串联起来,组成一个可交互、可记忆、有逻辑的智能体(Agent)。 基本
阅读全文
posted @ 2025-10-15 19:24 Zhentiw
阅读(278)
评论(0)
推荐(0)
2025年10月13日
[GenAI] LoRA微调
摘要: LoRA 英文全称为 Low-Rank Adaptation,中文:“低秩适配器” 秩的概念 英文 Rank 中文:秩 所谓秩,指的就是一个矩阵中 真正包含的信息量 有多少。 🙋小红买了 3 个苹果 4 个桃子,花了 18 元,小明买了 2 个苹果 3 个桃子,花了 13 元,请问苹果和桃子各多少
阅读全文
posted @ 2025-10-13 13:52 Zhentiw
阅读(68)
评论(0)
推荐(0)
[GenAI] 大模型微调
摘要: 英文:Fine-tuning 中文:大模型微调 大模型的构建其实分为 2 个阶段: 预训练(pre-training):此阶段模型会在 大规模、多样化的数据集 上进行训练,从而形成全面的语言理解能力。 微调(fine-tuning):在规模较小的 特定任务或特定领域数据集 上对模型进行 针对性的训练
阅读全文
posted @ 2025-10-13 13:52 Zhentiw
阅读(68)
评论(0)
推荐(0)
2025年10月12日
[GenAI] RAG架构演进
摘要: RAG架构演进 RAG 的概念和思想最早是在 2020 年由 Meta 公司的技术团队在文章 “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks” 中正式提出的,用于给当时已经开始出现的大型预训练语言模型提供来自外部的
阅读全文
posted @ 2025-10-12 16:42 Zhentiw
阅读(97)
评论(0)
推荐(0)
[GenAI] RAG实践
摘要: RAG经典架构: 数据索引 读取外挂语料库的时候,语料库是一个 pdf 文件,需要一个额外的依赖:pdf-parse 转化为向量嵌入:nomic-embed-text function getEmbedding(text) { const res = await fetch("http://loca
阅读全文
posted @ 2025-10-12 16:41 Zhentiw
阅读(28)
评论(0)
推荐(0)
2025年10月9日
[Typescript] Error Wrapper
摘要: type ErrorWithMessage = { message: string } function isErrorWithMessage(error: unknown): error is ErrorWithMessage { return ( typeof error 'object' &&
阅读全文
posted @ 2025-10-09 19:06 Zhentiw
阅读(12)
评论(0)
推荐(0)
2025年10月6日
[MCP] StreamableHTTPServer
摘要: 远程通信方式 通信方式: Stdio: 推荐,高效、简洁、本地 Streamable HTTP: 远程 前置知识 SSE 全称 Server-Sent Events,中文是“服务器发送事件”。是一种基于 HTTP 的单向通信协议,由浏览器发起连接,服务器可以持续不断地向客户端推送数据。 你可以把它想
阅读全文
posted @ 2025-10-06 14:22 Zhentiw
阅读(208)
评论(0)
推荐(0)
[Node.js] Server-Sent Events
摘要: 远程通信方式 通信方式: Stdio: 推荐,高效、简洁、本地 Streamable HTTP: 远程 前置知识 SSE 全称 Server-Sent Events,中文是“服务器发送事件”。是一种基于 HTTP 的单向通信协议,由浏览器发起连接,服务器可以持续不断地向客户端推送数据。 你可以把它想
阅读全文
posted @ 2025-10-06 02:53 Zhentiw
阅读(40)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
499
下一页
公告