首页
AI应用列表
行业进展
热门
AI对话
AI表格
AI写作
AI文档
AI简历
AI视频
PPT
AI编程
设计
语音
会议
搜索
智能体
3D模型
AI办公
翻译
法律
思维导图
AI图片
AI开发
AI列表网
AI开发
AI模型评测
MMLU
MMLU 权威榜单:追踪大模型多任务语言理解 SOTA。
Open LLM Leaderboard
HuggingFace 4号空间实时展示全球开源大模型排行榜。
C-Eval
中文大模型综合测评第一站
FlagEval
大模型权威评测与排行榜平台
SuperCLUE
中文大模型权威排行榜与评测基准
AGI-Eval
AGIEval:AI模型权威评测与榜单社区
OpenCompass
国产权威大模型排行榜
CMMLU
中文大模型多任务理解与评估中心
MMBench
MMBench:多模态大模型一站式评测门户
HELM
> HELM:斯坦福一站式大模型透明评估平台
LMArena
匿名对战投票选最佳AI
LLMEval3
一站式 LLM 评测与优化平台
H2O EvalGPT
EvalGPT:一键评测大模型,开发者效率神器。
PubMedQA
PubMedQA:为生物医学研究设计的问答数据集与排行榜。
1