摘要:
定义与核心思想 人类反馈强化学习(RLHF)是一种结合传统强化学习与人类主观判断的机器学习范式。其核心思想是通过人类对智能体行为的直接评价(如偏好排序、评分或修正),动态调整模型的优化目标,使智能体在复杂、模糊的任务中逐步逼近人类期望的行为模式。与传统强化学习依赖预设的数学化奖励函数不同,RLHF 阅读全文
posted @ 2025-04-02 11:40
JackYang
阅读(405)
评论(0)
推荐(0)
浙公网安备 33010602011771号