知识蒸馏
2023-02-04 22:39:35 3 举报
登录查看完整内容
为你推荐
查看更多
教师学生网络训练过程
作者其他创作
大纲/内容
softmax(T=1)
input
loss Fn
distillation loss
softmax(T=t)
Student
hard predictions
student loss
soft labels
soft predictions
total loss
Teacher
hard label y(ground truth)
0 条评论
回复 删除
下一页