SuperCLUE 是 CLUE 团队面向中文通用大模型推出的综合性评测基准与排行榜站点,实时展示国内外主流大模型在基础能力、专业能力与中文特性三大维度 70 余项子任务上的得分与排名。网站以自动化测评为主、人工校验为辅,提供模型与人类基线的对比曲线,并持续更新数据集与评测方法,帮助研究者、企业及开发者快速了解各模型在中文语境下的真实水平与差距。
SuperCLUE 是 CLUE 团队面向中文通用大模型推出的综合性评测基准与排行榜站点,实时展示国内外主流大模型在基础能力、专业能力与中文特性三大维度 70 余项子任务上的得分与排名。网站以自动化测评为主、人工校验为辅,提供模型与人类基线的对比曲线,并持续更新数据集与评测方法,帮助研究者、企业及开发者快速了解各模型在中文语境下的真实水平与差距。