随笔档案「2026年3月8日」：SimpleVQA: Multimodal Factuality Evaluat... - 啊哈哈哈哈312

2026年3月8日

SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models

摘要：背景 LLM文本模型存在SimpleQA和Chinese SimpleQA检验幻觉问题，但MLLM在此类benchmark中有缺失，因此作者提出了Simple VQA。数据集特点数据集基本信息：该数据集旨在评估模型的两个特性：视觉理解能力：指模型能否准确识别出图像中被提问的主体真实世界知识阅读全文

posted @ 2026-03-08 20:34 啊哈哈哈哈312 阅读(48) 评论(0) 推荐(0)

Loading

yanlishao

公告