Bert与GPT bert与gpt的区别

发表时间：2023-06-19 00:18:05

BERT的三个Embedding详解

有藤壶的小海龟:输入的序列不一样，不同embedding层的输出的向量不一样

BERT的三个Embedding详解

还卿一钵无情泪:补充回答看了一些相关介绍之前的回答有误Transformer的位置编码是一个固定值，因此只能标记位置，但是不能标记这个位置有什么用。BERT的位置编码是可学习的Embedding，因此不仅可以标记位置，还可以学习到这个位置有什么用

BERT的三个Embedding详解

还卿一钵无情泪:这个指的是bert词表的大小，图是想表示这个模型有一个30522大小的词向量词表，后续进行lookup，然后产生result

BERT的三个Embedding详解

还卿一钵无情泪:这个指的是bert词表的大小，图是想表示这个模型有一个30522大小的词向量词表，后续进行lookup，然后产生result

BERT的三个Embedding详解

weixin_56855785:请问下tokenemb的30522是什么含义呢