混元大模型算法-日常实习-一面

给我面没招了,发点面经攒攒人品~
1.实习拷打
2.了解哪些大模型, Qwen 和 DeepSeek 各自的特点?
3.MoE 跟 Dense 比,收益主要体现在哪?代价又是什么?
4.有没有做过全参微调?没有的话你怎么判断它和值不值得做?
5.如果你要把 LoRA 和全参做对比,你会怎么设计实验、控制变量、看哪些指标?
6.RLHF 解决什么,在对齐里起什么作用? RLHF 这一块会继续深挖:
7.你知道哪些主流的对齐/强化学习做法?
8.代码题:括号生成+手写多头自注意力
全部评论
项目里面有lora吗?
点赞 回复 分享
发布于 03-17 21:28 北京

相关推荐

03-15 10:59
已编辑
美团_后端开发(实习员工)
爱写代码的菜code...:哎,自己当时拿到字节offer的时候也在感叹终于拿到了,自己当时最想去的企业就是字节,结果还是阴差阳错去了鹅厂。祝uu一切顺利!!!
点赞 评论 收藏
分享
查看16道真题和解析
点赞 评论 收藏
分享
985柜员:开发还敢还叫,全部让自测就老实了
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务