会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
yanlishao
博客园
首页
新随笔
联系
订阅
管理
2026年3月8日
SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models
摘要: 背景 LLM文本模型存在SimpleQA和Chinese SimpleQA检验幻觉问题,但MLLM在此类benchmark中有缺失,因此作者提出了Simple VQA。 数据集特点 数据集基本信息: 该数据集旨在评估模型的两个特性: 视觉理解能力:指模型能否准确识别出图像中被提问的主体 真实世界知识
阅读全文
posted @ 2026-03-08 20:34 啊哈哈哈哈312
阅读(48)
评论(0)
推荐(0)
公告