Transformer 등장 이전의 자연어처리 Backbone 모델

2024. 3. 3. 19:05· Deep Learning/NLP

	RNN	LSTM	GRU
Gates	0	3(input, forget, output)	2(update, reset)
Long-term dependencies	Poor	Good	Fair
Vanishing & Exploding Gradient	Yes	Less	Less
Computational Complexity	Low	High	Medium

1. RNN(Recurrent Neural Network)