Bert结构
2023-02-27 14:44:12 10 举报
登录查看完整内容
基于Transformer的Bert模型基本结构
作者其他创作
大纲/内容
BertLayer
TokenEmbedding
BertAttention
BertIntermediateFeed Forward
SegmentEmbedding
BertSelfOutputLayer Normal & Dropout
Layer Normal & Dropout
BertEncoder
Downstream Tasks
BertOutputFeed ForwardLayer Normal & Dropout
Input Embedding
Position Ids
Input Ids
× N
Transformer Blocks
Token Type Ids
PositionalEmbedding
BertSelfAttentionMulti-head Attention
0 条评论
回复 删除
下一页