首页 > 试题广场 >

在 GPT-NeoX、Llama 等新一代 LLM 中,用

[单选题]
在 GPT-NeoX、Llama 等新一代 LLM 中,用 RMSNorm 取代 LayerNorm 的直接收益主要体现在
  • 训练中减少一次矩阵乘法
  • 减少参数总量约 10%
  • 去掉均值计算,推理与训练均可省去一次减法
  • 可用更高学习率

这道题你会答吗?花几分钟告诉大家答案吧!