26校招腾讯LLM算法一面 1h

继续来分享下之前的面经~欢迎友好讨论,信息共享
八股
1. 为什么用decode-only,相比于encoder-only和encoder-decoder的区别;
2. 对attention的了解、MHA、GQA这些;
3. 分布式训练方式deepspeed这些;
4. ppo的了解,grpo,dapo的了解,grpo可能存在哪些劣势
5. ppo相比于之前的RL方法的创新点

 coding
将一个整数拆成k个和的形式,求最大乘积
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 03-27 09:23 广东

相关推荐

03-08 18:11
门头沟学院 Java
Java抽象小篮子:海投就完事了,简历没什么问题,最大问题是学历
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务