RoBERTa模型

2023-04-11 17:52:28 0 举报
RoBERTa模型
RoBERTa 相较于 BERT 模型,RoBERTa 在预训练阶段,采用了更多的语料以及动态掩码机制(不同轮次同一样本掩码不同的单词),去掉了下一 句预测任务,同时采用了更大的批大小。
作者其他创作
大纲/内容
评论
0 条评论
回复 删除
取消
回复
下一页