![深度学习视频理解](https://wfqqreader-1252317822.image.myqcloud.com/cover/920/43737920/b_43737920.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.2.1 RNN
我们使用下标表示输入时序序列的时序位置,即不同时刻,用
表示在
时刻的系统隐层状态(Hidden State)向量,用
表示
时刻的输入。
时刻的隐层状态向量
依赖于当前词
和前一时刻的隐层状态向量
:
![img](https://epubservercos.yuewen.com/E5C1AE/23020634309724506/epubprivate/OEBPS/Images/txt002_274.jpg?sign=1739268500-vN4WEZx1jUW12I7yhHXpJyYxZ07FhZz4-0-46c6cb45fc8ae022cf6614d4232abb95)
(2.15)
其中,是一个非线性映射函数。一种通常的做法是计算
的线性变换后经过一个非线性激活函数,例如:
![img](https://epubservercos.yuewen.com/E5C1AE/23020634309724506/epubprivate/OEBPS/Images/txt002_277.jpg?sign=1739268500-qhXAelk0VE0Y19HLEgOWdR9mj30m6Chp-0-795072f3ab9cc32f63c2186539c8030b)
(2.16)
其中,是可学习的参数矩阵,激活函数
独立地应用到其输入的每个元素。
RNN的计算过程如图2-26所示,图中左边是输入,右边是输出
。计算从左向右进行,整个运算包括3步:输入
并分别乘以
,两者结果相加,以及最后经过
非线性变换输出。
![img](https://epubservercos.yuewen.com/E5C1AE/23020634309724506/epubprivate/OEBPS/Images/txt002_285.jpg?sign=1739268500-yT1Vv5K7mnOLuYWsEPn1kHy5aEN8qDam-0-4b124406995908dde07601b92e21a555)
图2-26 RNN的计算过程
我们可以认为存储了网络中的记忆(Memory),RNN 学习的目标是使得
记录了在
时刻之前(包含
时刻)的输入信息
。在新词
输入到网络之后,之前的隐状态向量
就转换为和当前输入
有关的
。