LSTM

2018-05-29 14:43:06 680 举报
LSTM
LSTM(Long Short-Term Memory)是一种特殊的循环神经网络,它能够学习长期依赖性信息。LSTM由Hochreiter & Schmidhuber (1997)提出,主要解决了长序列训练过程中的梯度消失和梯度爆炸问题。在长短时记忆网络中,信息能够在任意长度的序列中传递。其中使用了独特的内部结构——门控机制,包括输入门、遗忘门和输出门。这些门控机制可以控制信息的流动,使得网络能够自适应地选择保留或遗忘过去的状态。LSTM广泛应用于各种自然语言处理任务,如机器翻译、语音识别和文本生成等。
作者其他创作
大纲/内容
评论
0 条评论
回复 删除
取消
回复
下一页