首页 > 试题广场 >

什么是梯度爆炸和梯度消失?它们的原因是什么?

[问答题]
什么是梯度爆炸和梯度消失?它们的原因是什么?
梯度消失指的是在多层迭代中传输数据会越来越小导致最终输出为0的结果,权重无法更新;而梯度爆炸指的是初始化权重过大导致前面层训练更新的速度要快于后面层,导致网络权重的大幅更新,影响最终训练效果。
发表于 2025-12-23 15:19:35 回复(0)