GPT
5.3 GPT
GPT是一个单向语言模型,输入的句子是从左到右的,因此在训练的时候,每个位置的词都可以看到前面的词,但是不能看到后面的词。
可以将BERT理解为Transformer的Encoder,而GPT可以理解为Transformer的Decoder。
参考资料
https://arxiv.org/pdf/1810.04805
https://zhuanlan.zhihu.com/p/403495863
Last updated
GPT是一个单向语言模型,输入的句子是从左到右的,因此在训练的时候,每个位置的词都可以看到前面的词,但是不能看到后面的词。
可以将BERT理解为Transformer的Encoder,而GPT可以理解为Transformer的Decoder。
https://arxiv.org/pdf/1810.04805
https://zhuanlan.zhihu.com/p/403495863
Last updated