Loading

摘要: 背景 LLM文本模型存在SimpleQA和Chinese SimpleQA检验幻觉问题,但MLLM在此类benchmark中有缺失,因此作者提出了Simple VQA。 数据集特点 数据集基本信息: 该数据集旨在评估模型的两个特性: 视觉理解能力:指模型能否准确识别出图像中被提问的主体 真实世界知识 阅读全文
posted @ 2026-03-08 20:34 啊哈哈哈哈312 阅读(48) 评论(0) 推荐(0)