Open LLM Leaderboard 是 Hugging Face 官方托管的公开排行榜空间,实时汇总全球主流开源大语言模型在 60+ 权威基准(ARC、HellaSwag、MMLU、TruthfulQA、GSM8K、HumanEval 等)上的评测结果。排行榜每小时自动抓取 Hugging Face Hub 最新模型权重,使用 EleutherAI 的 Language Model Evaluation Harness 统一脚本,在固定硬件(A100-80G×8)与超参数下重跑任务,保证横向可比。结果以分数、排名、趋势图、雷达图等多维可视化呈现,并提供模型卡片、训练数据、许可证、部署代码一键跳转,方便开发者、研究者与企业快速洞察开源社区最前沿进展。