03-18 14:40 门头沟学院推荐算法

关注

小红书大模型算法实习面经

继续来分享下之前的面经~欢迎友好讨论，信息共享
1. LLaMA 相比原始 Transformer 架构有哪些改进？
2. 微调（Fine-tuning）和对齐（Alignment）的区别？
3. 模型微调到什么程度才需要进行对齐？
4. 四种对齐算法的区别：PPO、DPO、GRPO、DSPO？
5. 位置编码的作用？为什么相对位置编码通常比绝对位置编码更好？
6. GAE（Generalized Advantage Estimation）以及重要性采样（Importance Sampling）？
7. 损失采样（Loss Sampling）相关问题？
8. 目前了解哪些大模型架构？例如 LLaMA 等。
9. 是否了解 PagedAttention？
10. LoRA 中两个低秩矩阵是如何初始化的？
11. PPO 中的四种模型分别是什么？各自的作用是什么？

全部评论

推荐最新楼层

03-15 23:11

南开大学 Java

零实习三次字节一面挂

零实习，没什么经验，其实很怕，不敢面，但是其他厂都不捞我的，只能硬着头皮面了。感觉最主要还是项目不熟悉的问题，追问一下就只能沉默表示不知道说什么。八股勉强还能把基础的答出来，算法也是入门的水平。感觉自己面试时说话都不利索，有些内容说着说着自己都觉得没讲明白，只好最后来个总结句期望面试官能听懂我在说什么。感觉三回都是差不多的问题。后面有点不知道怎么办，字节HR在ssob上确实很热情，但感觉是kpi，其他的话，没面过，希望最近有笔试的几家能捞我去面面。不过话说回来可能还是要沉淀？但这学期又过得挺快的。

牛客91882925...：慢慢来，别给自己那么大压力，天无绝人之路。学习中成长，这背景已经超越绝大多数牛友了。多面几次就好了，我第一次面试前睡都睡不好，不过面试官人还好，进行一会面试就注意力全在题上了。所以跟面试官关系也很大

点赞评论收藏

分享

昨天 15:01

已编辑

同济大学算法工程师

百度大模型后训练一面

📍面试公司：百度 文心一言🕐面试时间：2026.03.18💻面试岗位：大模型RL后训练❓面试问题：自我介绍，教育背景，项目经历项目介绍，基于大语言模型的信号灯控制，问题是什么，如何结合熵，怎么评测，指标结果如何强化学习理论内容，trust-range和PPO的关系PPO是off-policy or on-policy? on-policy为什么会有importance sampling，采样的策略模型和要训练的策略模型有偏差，重要性采样加以修正PPO的clip在优势A 正/负时 限制上/下届，A为正限制上届，A为负限制下届PPO的损失函数怎么计算的？广义优势估计是怎么计算？GAE中lam...

查看17道真题和解析

点赞评论收藏

分享

昨天 13:50

门头沟学院推荐算法

字节llm大模型实习一面

继续来分享下之前的面经~欢迎友好讨论，信息共享1.项目相关2.讲讲设计的初衷，模型结构3.为什么会想在重排做生成式4.如果是做生成式召回对模型结构怎么修改5.召回怎么构造负样本6.需要热度纠偏吗，减的那个概率和什么有关7.稀疏 MOE 怎么做的8.beamsearch 怎么做的9.大模型了解多少，强化学习了解什么10.DPO 的全称是什么，公式是什么11.手撕:计算逆序对数量

查看10道真题和解析

点赞评论收藏

分享

02-21 15:47

上海交通大学算法工程师

阿里大模型一面

岗位名称：大语言模型算法面试时长：1h–1.5h自评分：8/10是否下一轮：是模型架构与基础原理目前主流大语言模型在架构设计上有哪些异同点？（追问）Decoder-only 和 Encoder-Decoder 在实际应用场景上有什么区别？介绍一下大语言模型中的注意力机制，多头相比单头注意力有何优势？（追问）如果减少头数会发生什么？是否一定性能下降？什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？（追问）涌现能力是否和模型规模线性相关？什么是 Embedding？词嵌入和句嵌入有何不同？（追问）Embedding 层是否会参与微调？为什么？大语言模型中的 Tokenization 是如...

技术必备题库

点赞评论收藏

分享

03-18 16:52

合肥工业大学 C++

腾讯QQ后台开发一面

前言：面试官说不方便开摄像头，而且有很大杂音，感觉应该是没在会议室设备不好之类的。不知道是不是KPI面面试总时长1个小时，没有录音，以下是回忆：1. 先在聊天里给了一个代码（主要与可变参数函数和越界访问段错误有关），让我判断编译能不能通过，运行会不会崩溃（这块是print函数输出，平时本菜狗很少用，连%d输出的是整数还是浮点都忘记了，尬死我了，但最后回答应该是没错的）2. 现在我在一个客户端向服务端发送数据，什么情况下会导致发送阻塞，底层原因是什么？（这里从socket发送缓冲区和TCP滑动窗口机制回答的）3. 直接开始项目，问了我的第一个项目，提了一嘴很少看到有人写这个，让我讲述一下动机，从前期技术选型到中期代码实现到后期优化测试都讲了一遍，然后问了项目中io_uring和eventfd实现、Reactor和Proactor模型区别，有栈协程和无栈协程，ucontext与其他协程上下文实现有做过对比（没做过）4. 问第二个项目，主要问了Raft算法，引申出一个分布式场景题：一个分布式集群，每个节点存储的数据量很大，其中一个节点宕机，为了恢复服务需要新加入一个节点，那么就要将其他节点的备份数据复制到新节点，问因为数据量很大，复制导致带宽占用很大，影响了其他节点的正常服务，你会如何解决？（答了在低峰期复制，在高峰期使用转发机制）5. 写项目的时候有没有用到AI，是如何用的？6. 如果让你借助AI从0实现一个Raft算法，你会如何与AI交流？7. 写给AI看的文档和写给人看的文档有什么区别？（内心OS：这是什么问题？）8. 反问：部门业务，实习时间要求，下一面时间（这里面试官说“在我这没问题”，是不是过了）

查看16道真题和解析

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

27604次浏览 190人参与

# 面试官最爱问的 AI 问题是...... #

14507次浏览 503人参与

# 巨人网络春招 #

9915次浏览 163人参与

# 春招/暑实第一面是哪家？ #

18289次浏览 219人参与

# 你的嫡系AI是哪个？ #

3900次浏览 102人参与

# 跟HR说什么能被秒回？ #

8618次浏览 154人参与

# MiniMax求职进展汇总 #

13609次浏览 227人参与

# 现在入门AI应该走哪些方向？ #

3814次浏览 89人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2697次浏览 82人参与

# 你收到了哪些公司的笔试？ #

16208次浏览 86人参与

# 不卡学历的大厂有哪些？ #

161415次浏览 685人参与

# 你现在的工作，是“成长”还是“消耗”？ #

8026次浏览 136人参与

361018次浏览 2915人参与

# 迅雷笔试 #

5382次浏览 27人参与

# 设计人秋招体验最好的公司 #

85996次浏览 743人参与

# 27届实习投递记录 #

4315次浏览 81人参与

# 电信求职进展汇总 #

45267次浏览 207人参与

# 重来一次，你会对开始求职的自己说 #

39508次浏览 436人参与

# 26届秋招公司红黑榜 #

80274次浏览 279人参与

# 你最近一次加班是什么时候？ #

114600次浏览 561人参与

# 联想求职进展汇总 #

340686次浏览 2229人参与

# 职场上哪些行为很加分？ #

343741次浏览 3935人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务