首页 > 试题广场 >

在训练大语言模型时,为缓解梯度爆炸问题并确保训练稳定,最有效

[单选题]
在训练大语言模型时,为缓解梯度爆炸问题并确保训练稳定,最有效的技术方案是什么?
  • 梯度裁剪
  • 使用更大的批量尺寸
  • 增加神经元激活函数的非线性度
  • 应用动态学习率衰减
梯度爆炸 梯度裁剪
发表于 2026-04-11 08:19:45 回复(0)