当前位置:首页 » 新媒体运营 » 正文

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU

6473 人参与  2022年09月14日 15:47  分类 : 新媒体运营  评论

递归神经网络(RNNs)是一类常用的序列数据人工神经网络。三种最常见的递归神经网络类型分别是:

  1. vanilla RNN

  2. 长短记忆RNN(LSTM),由 Hochreiter和 Schmidhuber 在年提出

  3. 门控循环单元(GRU),由Cho等人在年提出賽普·霍克賴特

要指出的一点是,我将使用"RNNS"来统称本质上是递归神经网络结构,"vanilla RNN"来指代在图一所展示的最简单的循环神经网络结构.

有很多关于递归神经网络的图解.

我个人最喜欢的一个是Michael Nguyen发表在《走向数据科学》(Towards Data Science)的这篇文章,因为他不仅给我们提供了对这些模型的直觉,更重要的是这些漂亮的插图,使我们更容易理解。但我发表这篇文章的动机是为了更好地理解这些单元中发生了什么,节点是如何共享的,以及它们是如何转换为输出节点。这里,我也受到了Michael的动画启发。

本文研究了vanilla RNN、LSTM和GRU单元。这是一个简短的概述,是为那些读过关于这些主题的文章的人准备的。(我建议在阅读本文之前先阅读Michael的文章),需要注意的是,以下动画是按顺序引导的,但在向量化的机器计算过程中并不反映时间上的顺序。

下面是我用来做说明的图例:

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:动画图例

在我的动画中,我使用了大小为(绿色)的输入和个隐藏单元(红色),批量大小为。

让我们开始吧!


Vanilla RNN

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:vanilla RNN 示意动画

  • t—时间步长

  • X—输入

  • h—隐藏状态

  • X的长度—输入的大小

  • h的长度—隐藏单元。请注意不同的库以不同的方式调用它们,但它们的含义相同:

    - Keras — state_size ,units

    - PyTorch — hidden_size

    - TensorFlow — num_units


LSTM(长短期记忆网络)

图:LSTM 示意动画

  • C - 单元状态

注意,单元状态的维度与隐藏状态的维度相同。


GRU

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:GRU 示意动画

希望这些动画能以某种方式帮助你!以下是静态图像中的概况:

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:Vanilla RNN 单元

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:LSTM 单元

神经网络应用实例,从动图中理解 RNN,LSTM 和 GRU-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

图:GRU 单元

一个提醒:我使用Google绘图来创建的这些示意图。


参考资料
  • 了解LSTM Networks - colah 的博客。
    https://colah.github.io/posts/--Understanding-LSTMs/

  • LSTM和GRU的插图指南:逐步解释
    https://towardsdatascience.com/illustrated-guide-to-lstms-and-gru-s-a-step-by-step-explanation-eebbf

想要继续查看该篇文章相关链接和参考文献?雷锋网雷锋网雷锋网

点击【从动图中理解 RNN,LSTM 和 GRU】即可访问!

今日资源推荐:CCF-GAIR | 张大鹏教授演讲 PPT:生物特征识别的新进展 - 纪念中国人工智能年

非常高兴受邀参加本次会议,让我有机会汇报我的最新工作。今天我的讲题是“纪念中国人工智能周年”,而我本人是中国学位法公布后首届入学的研究生,也是哈工大毕业的首个计算机博士,从 年入学开始算起,我基本见证了中国人工智能这 年的发展历程。

本文链接:https://www.woshiqian.com/post/138311.html

百度分享获取地址:https://share.baidu.com/code
RNN是一类用于处理序列数据的神经网络  

我是钱微信/QQ:5087088

广告位、广告合作QQ:5087088

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

       

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。