MMLU
MMLU 457
AI评测基准
大规模多任务语言理解基准