算法打工人阿旺

10-26 22:39 中山大学算法工程师发布于山东

关注

深度模型训练出现NaN的原因及对策

一、模型问题
1.梯度爆炸（ Gradient Explosion )
⭕原因：反向传播时梯度指数级增长，导致权重更新后输出溢出。表现为 Loss 骤增后突变为 NaN ，梯度
值远超正常范围（如＞1e5)。
✅解决：
1️⃣梯度裁剪：限制梯度范数（如 PyTorch 的 clip _ grad _ norm _( max _ norm =1.0))。
2️⃣降低学习率：初始学习率设为较小值（如1e-4)，或使用自适应优化器（ Adam )。
2.权重初始化不当
⭕原因：初始权重过大（如方差过大）或过小，引发激活值指数级变化。
✅解决：
1️⃣使用 Xavier ( Tanh / Sigmoid ）或 He 初始化( ReLU )。
2️⃣避免全零初始化导致对称性破坏。
二、数据问题
1．输入数据含异常值
⭕原因：数据中存在 NaN 、 Inf 或极端值（如全零、极大／极小值），导致前向传播计算溢出。
✅解决：
1️⃣使用 numpy . isnan ()或 torch . isnan (）检查输入和标签数据。
2️⃣确保数据预处理正确（如归一化、标准化），避免未处理的离群值。
2．数据预处理缺陷
⭕原因：未归一化的数据（如图像未除以255）或缺失值处理不当，引发激活值过大。
✅解决：
1️⃣对输入数据执行归一化（如缩放到［0,1］或［-1,1])。
2️⃣对缺失值填充合理数值（如均值）或剔除异常样本。
三、训练策略问题
1.混合精度训练问题
⭕原因：FP16精度下数值范围小，易出现上／下溢出。
✅方案：
1️⃣启用梯度缩放（ GradScaler in PyTorch )。
2️⃣关键计算（如 Softmax ）转为FP32。
2．学习率过高
⭕原因：过大学习率使权重更新剧烈，输出超出浮点范围。
✅调整：使用学习率调度器（如余弦退火、 Warmup 等学习率调整策略）。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

昨天 10:28

联想_后端开发部_语音算法工程师(准入职员工)

联想内推，联想内推码

26届联想 | 材料工程师 |面试经验分享！1. 请做一个简短的自我介绍。2. 为什么选择联想材料工程师岗位？你对“材料创新支撑产品竞争力”的理解是什么？3. 分享一次你参与材料实验或研究项目的经历，关键思路是什么？4. 如果研发团队与生产部门对材料工艺有分歧，你会如何沟通协调？5. 你认为材料工程师最核心的非专业能力是什么？你的优势在哪里？6. 描述一次你通过主动学习掌握新材料分析方法的经历，如何应用于实践？7. 如何看待“材料性能指标”与“生产成本控制”的关系？请举例说明平衡策略。8. 分享一次你在团队中推动实验项目落地的经历，遇到的最大挑战是什么？9. 如果你负责高分子涂层材料研究，如何...

点赞评论收藏

分享

11-02 23:28

National University of Singapore 风控

普本新二硕风控策略求大佬帮看

没辙了，秋招投了100+，到现在只有3个面试，还有一个是群面，求大佬指点。还有一个问题想请教各位，像我这样的简历，除了投风控，还有什么别的适合我的岗吗

点赞评论收藏

分享

10-13 10:25

门头沟学院 Java

找工作乐子

为爱发电了属于是！！！  

找工作中的意难平

点赞评论收藏

分享

09-12 14:26

已编辑

门头沟学院 Java

为什么啊为什么啊 别人找实习我也在找实习 别人找暑期还在找实习 别人秋招我还是在找实习 哪里都投遍了为什么一个机会都没有 😅😅好累好累 友友们可以看看有什么问题吗😭😭

点赞评论收藏

分享

11-03 14:12

已编辑

携程_旅游事业部_前端实习生(实习员工)

好未来-面试多久会有后续啊

双非还是太难了，一投一个挂，本以为混个title会好一点🐬厂的实习也要到期了，只能换个实习了，秋招根本没有面本周六（11.1）面了好未来实习岗，一面，二面隔了半小时一般多久会有通知啊

我的实习求职记录

点赞评论收藏

分享

评论

1

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 同bg的你秋招战况如何？ #

171638次浏览 999人参与

# 扒一扒那些奇葩实习经历 #

125365次浏览 1094人参与

# 360集团校招 #

18739次浏览 146人参与

# 你实习是赚钱了还是亏钱了？ #

26621次浏览 224人参与

# 去哪儿求职进展汇总 #

145479次浏览 994人参与

# 用一句话形容你的团队氛围 #

16679次浏览 172人参与

# 联影求职进展汇总 #

49698次浏览 320人参与

# 毕业论文进行时 #

5108次浏览 74人参与

# 面对逼签的应对技巧 #

5379次浏览 29人参与

# 我来点评面试官 #

14210次浏览 103人参与

# 牛友的国庆旅行碎片 #

20792次浏览 125人参与

# 今年秋招是回暖还是遇冷 #

27896次浏览 173人参与

# 秋招开始捡漏了吗 #

72818次浏览 513人参与

# 找工作八股要背到什么程度？ #

15832次浏览 232人参与

# 三一集团提前批进度交流 #

41322次浏览 229人参与

# 社会教会你的第一课 #

110003次浏览 859人参与

# 工作后，谈恋爱还和学生时代一样吗？ #

40944次浏览 377人参与

# 上班后，才发现大学__白学了 #

14085次浏览 100人参与

# 你找工作是从容有余 or 匆忙滚爬？ #

10099次浏览 85人参与

# 阿里云工作体验 #

33258次浏览 108人参与

# 你的领导最像哪种动物，为什么? #

25640次浏览 136人参与

# 职场破冰，你们都聊什么？ #

30789次浏览 154人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务