使用 Logistic Regression 或 LightGBM预测用户成交概率
目录
非常好,这个问题问到核心中的核心。
下面我完全不假设你有算法背景,用“产品经理 / 创业者视角”一步一步把 成交概率(Conversion Probability) 讲清楚,讲到你可以自己盯着工程团队把它做出来。
我会分 7 个步骤,每一步都回答三个问题:
- 你在做什么
- 为什么要这样做
- 工程上具体怎么做
成交概率(Conversion Probability)到底是什么?
一句话定义:
成交概率 = 某个用户,在当前状态下,在未来一段时间内下单的可能性
不是“这个人会不会买”,而是:
- 未来多长时间? → 比如 48 小时
- 在什么状态下? → 当前聊天、行为、犹豫点
- 给一个 0–1 的分数 → 0.72 表示 72% 概率
Step 0:先选一个「预测时间窗口」(非常重要)
不要一上来就复杂。
建议你直接用:
48 小时成交概率
为什么?
- 贴合你“第二天要不要继续跟”的业务
- 聊天数据信号最强
- 样本最干净
工程定义:
预测目标:
用户在最后一次聊天后的 48 小时内,是否下单
Step 1:准备你已经有的数据(不需要算法)
你需要的不是“聪明”,而是把数据摊平
每一行 = 一个用户在某一时刻的状态
表结构示例(你照这个让工程建表):
| 字段 | 含义 |
|---|---|
| user_id | 用户 |
| snapshot_time | 当前时间 |
| chat_cnt_24h | 24h 聊天次数 |
| ask_price | 是否问价 |
| compare | 是否对比 |
| objection_price | 是否价格异议 |
| add_to_cart | 是否加购 |
| checkout_no_pay | 是否到 checkout |
| last_reply_gap | 平均回复间隔 |
| decision_cycle | 即时 / 几天 |
| converted_48h | 标签(重要) |
Step 2:什么是「标签」(你最容易搞错的地方)
标签 = 你想预测的结果
你的标签只需要一个字段:
converted_48h
规则:
1→ 这个用户在 snapshot_time 之后 48h 内完成下单0→ 没有
工程实现逻辑(伪代码):
if order_time <= snapshot_time + 48h:
converted_48h = 1
else:
converted_48h = 0
👉 这一步不涉及任何模型,但 80% 的项目死在这里
Step 3:先不用“模型”,用「打分规则」跑通(强烈建议)
在你有 1 万条以上样本前,不要碰算法模型
先做一个「成交打分表」
示例(你可以直接用):
| 行为 | 分数 |
|---|---|
| 问价格 | +10 |
| 对比产品 | +10 |
| 加购 | +20 |
| checkout 未支付 | +30 |
| 价格异议 | -15 |
| 24h 未回复 | -20 |
计算方式:
成交分 = 所有命中行为分数相加
映射成概率(非常关键)
| 成交分 | 成交概率 |
|---|---|
| ≥ 60 | 0.7 |
| 40–59 | 0.5 |
| 20–39 | 0.3 |
| < 20 | 0.1 |
👉 这一步就已经能驱动 P0 / P1 / P2 跟进了
Step 4:当你有数据了,再上「真正的模型」
等你有:
- ≥ 10,000 个样本
- 行为 + 标签都稳定
再用模型。
你要用什么模型?(不需要懂原理)
直接告诉工程:
用 Logistic Regression 或 LightGBM
为什么?
| 模型 | 好处 |
|---|---|
| Logistic Regression | 简单、稳定、可解释 |
| LightGBM | 自动学权重,效果更好 |
Step 5:模型在干什么(用人话解释)
模型本质只干一件事:
自动学习:什么行为组合,更容易在 48h 内成交
比如它可能学到:
- 问价 + 加购 → 很容易成交
- 问价 + 价格异议 → 成交下降
- 快速回复 + checkout → 极高概率
你不用写这些规则,模型自己学。
Step 6:模型输出长什么样(你要盯这个)
模型对每个用户输出一个数:
{
"conversion_prob": 0.73
}
不是 yes / no,而是概率。
Step 7:把概率变成「业务可用的东西」
千万不要直接用概率
你要做一层 策略映射
示例:
if prob >= 0.6:
follow_priority = "P0"
elif prob >= 0.4:
follow_priority = "P1"
else:
follow_priority = "P2"
一张「人话版」完整流程图
聊天 & 行为
↓
状态快照(一行数据)
↓
是否 48h 成交?(标签)
↓
规则打分(早期)
↓
模型学习(后期)
↓
成交概率(0~1)
↓
P0 / P1 / P2 跟进策略
给你一句「你以后可以反复用的话」
成交概率不是“算命”,而是把“用户当前状态”转成一个可决策的分数。
下一步我可以继续帮你做三件事(你选一个)
1️⃣ 帮你写一份 《成交概率计算 PRD(给工程用)》
2️⃣ 给你一张 成交概率模型 + 策略一页 PPT 架构图
3️⃣ 帮你把「成交概率 + FSM + CTA」完整串成销售 Agent 决策流程
你现在最想推进哪一步?

浙公网安备 33010602011771号