摘要:
目录Coordinator 决策评测Langfuse Trace Contract v1.0一、层级与生命周期规范(必须遵守)1️⃣ Trace(一次测试用例 / 用户请求)2️⃣ Chain(一个 Agent 的完整决策)3️⃣ Span(可选)二、Input Contract(评测 Ground 阅读全文
posted @ 2025-12-22 22:21
向着朝阳
阅读(17)
评论(0)
推荐(0)
摘要:
1️⃣ input 通常记录函数处理的上下文或前置条件,包括: test_id 用户输入(user_input / user_message) 历史对话 messages dataset 中的期望值(expected_intent、expected_agent、expected_action) 这里 阅读全文
posted @ 2025-12-22 20:35
向着朝阳
阅读(169)
评论(0)
推荐(0)
摘要:
目录action vs expected_action意图 VS action VS objection一个意图多action的例子场景:PRICE_QUERY(价格相关意图)用户原始意图(不变)上下文变量(决定 action 的关键)一、不同上下文 → 不同 action(业务视角)情况 1:只问 阅读全文
posted @ 2025-12-22 15:39
向着朝阳
阅读(33)
评论(0)
推荐(0)
摘要:
目录一、推荐的数据结构(JSON)二、三条 Dataset 示例1️⃣ INVENTORY_CHECK(库存查询)2️⃣ PRICE_QUERY(价格查询)3️⃣ ORDER_QUERY(订单查询)三、如何与 Langfuse Trace 绑定(关键)四、这 3 条数据能评测什么?下一步建议(很重要 阅读全文
posted @ 2025-12-22 15:23
向着朝阳
阅读(33)
评论(0)
推荐(0)
摘要:
目录@observe 用法as_typeSpan:Chain:capture_input,capture_output @observe 用法 as_type 在 Langfuse 中,chain 和 span 都是用于追踪应用逻辑的观测类型(observation),但它们在 UI 展示和数据模型 阅读全文
posted @ 2025-12-22 11:05
向着朝阳
阅读(266)
评论(0)
推荐(0)
摘要:
目录一、先给结论(读书笔记一句话版)二、为什么“架构师”和 TL 会天然重叠三、现代团队中“正确的架构师”在做什么1. 关注“结构性、长期、不可逆”的决策2. 作为“架构一致性的守门人”3. 把“隐性复杂度”显性化4. 架构师的产出不是“图”,而是“约束”四、TL 在现代团队中的“不可替代职责”TL 阅读全文
posted @ 2025-12-22 09:24
向着朝阳
阅读(29)
评论(0)
推荐(0)
摘要:
目录项目前期在特定情况下有效,在项目中后期一定无效。一、什么是“项目前期”(Brooks 语境下的定义)项目前期的定义项目前期的典型特征为什么项目前期“加人”可能有效二、什么是“项目中后期”(Brooks 语境下的定义)项目中后期的定义三、为什么项目中后期“加人”是无效甚至有害的1. 新人引入培训成 阅读全文
posted @ 2025-12-22 08:20
向着朝阳
阅读(20)
评论(0)
推荐(0)

浙公网安备 33010602011771号