登录免费注册

首页  思维导图  详情

智能评阅算法综合评价

2025-04-27 23:25:53   6  举报





AI智能生成

智能评阅算法综合评价体系

工具推荐

作者其他创作

大纲/内容

稳定性

评分标准差(std_AI)

评估AI自身评分的波动性，过高说明算法不稳定。

人工-AI Kappa一致性

Cohen&apos;s Kappa （需将得分率离散化为等级，如 A/B/C/D）

消除随机性后的分类一致性，适用于等级评价场景(如作文分档)。

准确性

绝对误差(MAE)

直接衡量AI与人工终评的偏差。

相对误差(MRE)

反映误差占人工评分的比例，避免满分值差异的影响(如作文vs选择题)。

高分段一致性(P_top)

针对高分考生，验证AI能否识别优质答案。

鲁棒性

极端误差比例(Extreme_error)

阈值建议:附件3标准，识别AI严重失误(如异常标记题型)。

 收藏

立即使用

智能评阅算法综合评价

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



机器学习算法分类

评价体系－new



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定