MMMU:大学级别的多学科多模态评测集,旨在考察模型视觉相关的综合理解和推理能力
MathVista:数学相关的视觉推理测试集,评估拼图测试图形的逻辑推理、函数图的代数推理和学术论文图形的科学推理等能力
MathVision:高质量多模态数学推理测试集,来自于真实的数学竞赛,相比于MathVista具有更多的问题多样性和学科广度
OlympiadBench:奥林匹克竞赛级别的双语多模态科学基准测试集,包含来自奥林匹克数学和物理竞赛的8,476个问题,包括中国高考。每个问题都附有专家级别的注释,详细说明了逐步推理的过程
-=||=-收藏赞 (0)
评论 ( 0 )