MMBench 由上海人工智能实验室联合多所顶尖高校打造,是面向视觉-语言大模型的权威中文评测平台。它围绕“感知→认知”链路,把多模态能力拆成 20 个细粒度维度,精选近 3000 道单选题,并配套 OpenCompass 分布式评测框架,提供可复现、可对比、可追踪的在线测试与排行榜服务。用户无需本地部署,浏览器即可提交模型或查看报告,帮助产学研快速定位模型短板、指导迭代优化。
MMBench 由上海人工智能实验室联合多所顶尖高校打造,是面向视觉-语言大模型的权威中文评测平台。它围绕“感知→认知”链路,把多模态能力拆成 20 个细粒度维度,精选近 3000 道单选题,并配套 OpenCompass 分布式评测框架,提供可复现、可对比、可追踪的在线测试与排行榜服务。用户无需本地部署,浏览器即可提交模型或查看报告,帮助产学研快速定位模型短板、指导迭代优化。