【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记
创始人
2024-03-13 06:15:58
0

Recurrent Neural Network(RNN)

Example Application

Slot Filling
智慧订票系统:
在这里插入图片描述
在这里插入图片描述
How to represent each word as a vector?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
但是光这样,feedforward Network是无法solve这一问题的,因为他无法区别是leave Taipei还是arrive Taipei。
那我们就希望这个neuron network是有记忆的,即看到过arrive/leave这个词。
在这里插入图片描述
这种有记忆的network就叫做 recurrent neural network(rnn)
在这里插入图片描述

举例:

我们假设所有的w=1,没有bias;所有的激活函数都是线性的;
要给memory(每一个时间点都会被洗掉)一个初始值,我们假设给0
在这里插入图片描述
在这里插入图片描述
接下来2被存到memory中
在这里插入图片描述
在这里插入图片描述
rnn会考虑input sequence的order
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

of course it can be deep…

在这里插入图片描述

Elman Network & Jordan Network

在这里插入图片描述

Bidirectional RNN

同时train 一个正向的rnn和逆向的rnn
在这里插入图片描述
在这里插入图片描述

Long Short-term Memory(LSTM)

Input/Output/Forget Gate何时打开/关闭 是需要网络自己学的
LSTM有三个操控信号,一个输入信号
在这里插入图片描述
“-”为什么放在short-term之间,而不是long short之间?
因为他只是比较长的short term。是否遗忘取决于forget gate,关闭时代表遗忘
在这里插入图片描述
假设在四个z输入之前,cell中存了一个“c”
在这里插入图片描述
在这里插入图片描述
如果选择不遗忘c(由f(zf)决定),则需要再加起来即c‘
在这里插入图片描述
在这里插入图片描述

LSTM-Example

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
original network
在这里插入图片描述
LSTM 直接将neurons替换成LSTM的cell即可
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
GRU是LSTM的simple版本,他只有两个gate,参数较少,所以比较不容易overfitting。simpleRNN指最原始的RNN,下图是目前标准的RNN。
在这里插入图片描述

Learning Target

在这里插入图片描述
RNN 用 Gradient Descent是可以train的
Backpropagation through time(BPTT) 基于时间的反向传播算法。
在这里插入图片描述
在这里插入图片描述
Why?
在这里插入图片描述
在这里插入图片描述
如何解决?
Clipping.
裁剪,当梯度过大时候进行裁剪。
在这里插入图片描述
为什么rnn会有这种奇特的特性呢?
sigmoid function? no
在这里插入图片描述
在这里插入图片描述
有什么样的技巧可以帮助我们解决这个问题呢?
在这里插入图片描述
可以让你的error surface不要那么崎岖, 在做LSTM时,你可以放心的把learning rate设置的特别小。

为什么我们要把RNN换成LSTM? LSTM可以handle gradient vanishing的问题。

为什么可以handle gradient vanishing的问题?
一旦你的weight,可以对memory的值发生影响时,这个影响会一直存在,除非forget gate关闭。不像rnn,其在每一个时间的会被forget掉。
在这里插入图片描述
在这里插入图片描述

Application

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如何解决?
CTC
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
句法解析
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Attention-based Model

可以想成RNN的进阶版本
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Deep&Structured

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...