2022-08-24 00:24 北京科技大学算法工程师发布于浙江

关注

算法面试高频知识点：模型梯度爆炸和梯度消失的原因及解决方法

图片说明

梯度爆炸和梯度消失问题

一般在深层神经网络中，我们需要预防梯度爆炸和梯度消失的情况。

梯度消失（gradient vanishing problem）和梯度爆炸（gradient exploding problem）一般随着网络层数的增加会变得越来越明显。

例如下面所示的含有三个隐藏层的神经网络，梯度消失问题发生时，接近输出层的hiden layer3的权重更新比较正常，但是前面的hidden layer1的权重更新会变得很慢，导致前面的权重几乎不变，仍然接近初始化的权重，==这相当于hidden layer1没有学到任何东西，此时深层网络只有后面的几层网络在学习，而且网络在实际上也等价变成了浅层网络。==

在这里插入图片描述

那么产生这种现象的原因是什么呢？

我们来看看看反向传播的过程：

（假设网络每一层只有一个神经元，并且对于每一层 $y_{i} = \sigma(z_{i}) = \sigma(w_{i}x_{i} + b_{i})$ ）

在这里插入图片描述

可以推导出：

在这里插入图片描述

而sigmoid的导数 $\sigma^{'}(x)$ 如下图所示：

在这里插入图片描述

可以知道， $\sigma^{'}(x)$ 的最大值是 $\frac{1}{4}$ ，而我们初始化的权重 $|w|$ 通常都小于1，因此 $\sigma^{'}(x)|w| <= \frac{1}{4}$ ，而且链式求导层数非常多，不断相乘的话，最后的结果越来越小，趋向于0，就会出现梯度消失的情况。

梯度爆炸则相反， $\sigma^{'}(x)|w| > 1$ 时，不断相乘结果变得很大。

梯度爆炸和梯度消失问题都是因为网络太深，网络权重更新不稳定造成的，本质上是因为梯度方向传播的连乘效应。

梯度爆炸和梯度消失的解决方法

预训练加微调。
梯度截断。
使用ReLU、LeakyReLU等激活函数。
加BN层。
使用残差结构。

#秋招##实习##面经##面霸的自我修养##面试八股文#

全部评论

推荐最新楼层

猪猪也不容易

中国石化_技术部_计算机

点赞回复分享

发布于 2022-08-24 20:35 江苏

乌云遇皎月

广州大学后端

每天来学习一下

点赞回复分享

发布于 2022-08-24 09:00 江苏

07-23 15:04

贵州大学嵌入式工程师

提前批投递记录📒——拓竹科技

拓竹校园招聘7.13投递，至今没有动静，先放着

投递拓竹科技等公司10个岗位

点赞评论收藏

分享

07-23 10:45

东华理工大学 Java

求大佬点评，boss上沟通305，20已投，但是20份简历投出去都没后文😭

26届双非，简历难得投出去，投出去石沉大海太搞心态了#简历# #简历求拷打# #投了多少份简历才上岸# #如何写一份好简历#

点赞评论收藏

分享

06-26 22:20

门头沟学院 Java

怎么老是有这种啊

码农索隆：让你把简历发给她，她说一些套话，然后让你加一个人，说这个人给你改简历，然后开始卖课

我的求职精神状态

点赞评论收藏

分享

07-23 18:09

中北大学 Java

摆子求尻打

已经一年没有做新项目了

点赞评论收藏

分享

07-23 11:19

复旦大学硬件开发

长鑫提前批

这种情况是不是挂了呀，我看其他岗位比我晚投递的都约面试了，这个现在都没有通知

投递长鑫存储等公司10个岗位

点赞评论收藏

分享

评论

4

5

招聘动态

滴滴

2026届秋季校招提前批

Touch CIB

数字兴业科技挑战赛

26届校招投递表格

7月更新166条网申投递链接

快手

快Star-X特别技术人才计划启动

莉莉丝游戏

2026届秋招提前批

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何快速融入团队？ #

1636次浏览 31人参与

# 我对___祛魅了 #

3493次浏览 43人参与

# 中兴秋招 #

183744次浏览 2047人参与

# 工作中哪个瞬间让你想离职 #

33314次浏览 244人参与

# 26届的你，投了哪些公司？ #

655次浏览 24人参与

# 和同事相处最忌讳的是__ #

3630次浏览 36人参与

# 职场常用语录大全 #

5214次浏览 41人参与

# 你遇到最难的面试题目是_ #

879次浏览 22人参与

# 简历上的经历如何包装 #

2315次浏览 78人参与

# 什么样的背景能拿SSP? #

4130次浏览 51人参与

# 哪些公司校招卡第一学历 #

84585次浏览 366人参与

# 你最讨厌面试问你什么？ #

2677次浏览 50人参与

# 工作中的卑微时刻 #

20000次浏览 164人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

42311次浏览 336人参与

# 在职场上，你最讨厌什么样的同事 #

17804次浏览 175人参与

# 担心入职之后被发现很菜怎么办 #

142572次浏览 822人参与

# 打工人的精神状态 #

63094次浏览 1053人参与

# 如果重来一次你还会读研吗 #

181044次浏览 1816人参与

# 元戎启行求职进展汇总 #

34436次浏览 256人参与

# 职场人，说说你的烦心事 #

12744次浏览 107人参与

# 软开人，秋招你打算投哪些公司呢 #

110029次浏览 992人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务