攒人品 智海星河大模型面经

  1. 用没用什么训练框架,还是pytorch直接?
  2. 怎么不考虑用一些主流的训练框架?
  3. 你认为有什么亮点?
  4. lora微调改的哪里?
  5. 介绍lora
  6. dpo和ppo之间的区别?
  7. 介绍下dpo的损失函数和ppo的损失函数?
  8. 有没有了解过其他的强化学习方法?
  9. 是否了解主流的一些模型?qwen?deepseek?
  10. transformer中decoder和encoder的差别?注意力机制的差别?
  11. decoder相比于encoder更善于什么?不善于什么?
  12. 注意力计算的公式是什么?复杂度是多少?

#荣耀##接好运#
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务