Papers with Code 的 MMLU 子站聚焦“大规模多任务语言理解”基准。它实时汇总全球研究机构在 57 个学科(从初等数学到国际法)的测评结果,以排行榜形式展示模型准确率、参数量、发表出处及开源代码。页面按 0-shot、5-shot 等设置分栏,支持一键跳转论文、GitHub 与复现脚本,是 NLP 研究者快速锁定最强通用模型与研究趋势的窗口。
Papers with Code 的 MMLU 子站聚焦“大规模多任务语言理解”基准。它实时汇总全球研究机构在 57 个学科(从初等数学到国际法)的测评结果,以排行榜形式展示模型准确率、参数量、发表出处及开源代码。页面按 0-shot、5-shot 等设置分栏,支持一键跳转论文、GitHub 与复现脚本,是 NLP 研究者快速锁定最强通用模型与研究趋势的窗口。