MMLU
MMLU 430
AI评测基准
大规模多任务语言理解基准