向着朝阳 - 博客园

2026年1月13日

摘要：目录面试总结话术模板知识库提示词版本，灰度，路由管理策略一、整体架构思路1️⃣ 提示词存储与管理2️⃣ Python 代码加载逻辑3️⃣ 回滚 & 灰度扩展二、面试可说版本Action降级策略一、核心结论二、Action 分级示例三、工业实践：降级策略设计原则面试总结在工业智能客服系统中，Ac 阅读全文

posted @ 2026-01-13 22:17 向着朝阳阅读(19) 评论(0) 推荐(0)

智能体上线后质量闭环

摘要：目录一、结论先行（非常重要）二、为什么不把“用户行为异常”当成一个普通比例？1️⃣ 因为它们不是“概率事件”，而是“已发生风险”2️⃣ 如果放进比例里，会被严重稀释（这是工业大坑）三、工业里的正确做法：三层抽样结构第一层：事件触发型（不占比例，最高优先）触发条件（你列的全对）：第二层：风险权重抽样（阅读全文

posted @ 2026-01-13 20:21 向着朝阳阅读(28) 评论(0) 推荐(0)

智能体上线和上线后质量闭环

摘要：目录二、工业里的标准做法：上线前 vs 上线后一句话总览三、上线前怎么测（你大概率已经理解的）1️⃣ 事实正确性（Hard Constraint）2️⃣ 业务红线3️⃣ 最小可用门槛四、上线后怎么测（这是面试加分点）null一、什么叫“按风险权重抽样”（先给精确定义）1️⃣ 定义（工业口径）2️⃣ 阅读全文

posted @ 2026-01-13 19:39 向着朝阳阅读(18) 评论(0) 推荐(0)

智能体上线评测指标

摘要：目录一、先给结论：95% ≠ 单一模型 Accuracy二、拆解：95% 通常由哪几层指标共同构成1️⃣ 意图识别层（Routing Accuracy）2️⃣ 事实正确性（Answer Correctness）3️⃣ 业务可接受度（Business Acceptance）4️⃣ 用户行为侧指标（隐式阅读全文

posted @ 2026-01-13 19:23 向着朝阳阅读(75) 评论(0) 推荐(0)

智能体生产关键指标

摘要：目录一、先给总览结论（帮助面试官快速对齐）二、准确率（Accuracy）——只衡量“系统自主承担的正确性”1️⃣ 定义（工业口径）数学表达（简化版）：2️⃣ 关键边界（非常重要）3️⃣ 为什么不能把兜底算进准确率三、覆盖率（Coverage）——系统“敢接”的比例1️⃣ 定义2️⃣ 覆盖率在衡量什么阅读全文

posted @ 2026-01-13 15:36 向着朝阳阅读(72) 评论(0) 推荐(0)

RAG-准确度提升之-前置过滤（3）-A/B测试 T_MULTI / T_MIN / K_MAX微调

摘要：目录一、总体原则（先说清楚，避免踩雷）二、实验分层设计（这是关键）1️⃣ 实验单元2️⃣ 只做「单变量 + 小范围」实验❌ 不要这样✅ 正确方式（推荐顺序）三、具体 A/B 方案设计（可直接用）阶段 1：T_MIN 主锚点阈值实验实验桶设计核心假设阶段 2：K_MAX 语义发散实验阶段 3：T_MU 阅读全文

posted @ 2026-01-13 08:20 向着朝阳阅读(15) 评论(0) 推荐(0)

RAG 二路召回（向量召回+ES）

摘要：目录一、结论先行（非常重要）但它出现的原因，不是为了提升“整体准确率”，而是为了兜住向量检索天然不擅长的那一类 query。二、你当前方案的能力边界这个架构非常合理，但它天然有 4 个盲区。三、向量检索的 4 类“硬伤场景”1️⃣ 精确词 / 结构化信息查询（ES 擅长）2️⃣ 否定 / 对比 / 阅读全文

posted @ 2026-01-13 07:46 向着朝阳阅读(76) 评论(0) 推荐(0)

2026年1月12日

RAG-准确度提升之-前置过滤-向量召回法-持续改进

摘要：目录一、先给你一个总判断（非常重要）二、持续提升准确度的 5 条“硬机制”1️⃣ 用「路由原因」反推哪里不准（最关键）你应该长期看什么？2️⃣ 只用 LLM 失败样本，反向喂给 MiniLM（闭环）闭环流程（强烈推荐）一、整体思路二、数据集结构（最标准的格式）1️⃣ 基本样式（JSON / CSV 阅读全文

posted @ 2026-01-12 19:52 向着朝阳阅读(28) 评论(0) 推荐(0)

Milvus 的ANN（Approximate Nearest Neighbor）算法

摘要：目录一、Milvus 支持的 ANN 算法概览二、算法特点对比（工业级参考）三、选型参考四、Milvus ANN 使用流程简述五、总结一句话明白，你想深入 Milvus 的ANN（Approximate Nearest Neighbor）算法实现细节。下面我帮你梳理得工业级完整、直接可落地理解：阅读全文

posted @ 2026-01-12 17:19 向着朝阳阅读(40) 评论(0) 推荐(0)

意图识别小模型和embeding 模型选择

摘要：目录一、总体判断（一句话）二、逐项评估你的选型1️⃣ 意图识别：MiniLM-12L（优先） + LLM 兜底为什么合适唯一提醒2️⃣ RAG embedding：Sentence-BERTSentence-BERT 的问题不在“准不准”三、为什么「MiniLM + Sentence-BERT」不是阅读全文

posted @ 2026-01-12 17:13 向着朝阳阅读(152) 评论(0) 推荐(0)

aibi1

公告