大模型评估体系:Rouue

大模型评估体系:Rouue

2026-03-11 22:33:33 0 举报
该思维导图展示了大语言模型(LLM)的综合评估体系。以“LLM Evaluation”为核心,从准确性(Accuracy)、鲁棒性(Robustness)、公平性(Fairness)和效率(Efficiency)四个关键维度展开。详细拆解了BLEU、ROUGE等具体指标,以及对抗攻击、偏见检测、延迟吞吐量等细分评估点,为研究人员构建科学的模型评估框架提供了清晰的结构指引。
大模型评估
LLM指标体系
模版推荐
作者其他创作
大纲/内容
评论
0 条评论
下一页