好吃好在
注册
当前位置:首页 » 文章

四个测试集

MMMU:大学级别的多学科多模态评测集,旨在考察模型视觉相关的综合理解和推理能力

MathVista:数学相关的视觉推理测试集,评估拼图测试图形的逻辑推理、函数图的代数推理和学术论文图形的科学推理等能力

MathVision:高质量多模态数学推理测试集,来自于真实的数学竞赛,相比于MathVista具有更多的问题多样性和学科广度

OlympiadBench:奥林匹克竞赛级别的双语多模态科学基准测试集,包含来自奥林匹克数学和物理竞赛的8,476个问题,包括中国高考。每个问题都附有专家级别的注释,详细说明了逐步推理的过程

-=||=-收藏赞 (0)

评论 ( 0 )

联系客服

关注公众号

qrcode

回顶部