大模型评估体系：Rouue

2026-03-11 22:33:33   0  举报





该思维导图展示了大语言模型（LLM）的综合评估体系。以“LLM Evaluation”为核心，从准确性（Accuracy）、鲁棒性（Robustness）、公平性（Fairness）和效率（Efficiency）四个关键维度展开。详细拆解了BLEU、ROUGE等具体指标，以及对抗攻击、偏见检测、延迟吞吐量等细分评估点，为研究人员构建科学的模型评估框架提供了清晰的结构指引。

大模型评估

LLM指标体系

模板推荐

作者其他创作

大纲/内容