牛客341032222号

2025-03-25 00:03 已编辑南昌大学自然语言处理发布于重庆

关注

网易互娱-n星计划-AI研究工程师面经

ailab，base 广州，做游戏npc，代码生成等业务
9.19 一面
1、项目相关
2、llama用的什么注意力？
3、flashattention简单讲一下？
4、ppl是什么？
5、如何选取训练后的模型？
6、有试过将多个模型权重合并吗？
7、训练时loss暴增可能是什么原因，怎么解决
8、有哪些节省显存的方式？
=======================
9.25 二面
1、项目相关
2、介绍一下SFT，lora，reward model，DPO
3、SFT只计算回答部分的损失合适吗？
4、模型蒸馏了解吗？损失是什么？可以用KL散度吗
5、交叉熵和KL散度的公式是什么
6、MQA，GQA是什么，deepseek的MLA了解了吗
7、如何训练一个代码检索模型？
8、reranker的训练目标？训练目标和我们希望的目标是否有不一致的地方，就比如训练时q-d对的匹配概率，但我们希望是检索的文档对大模型有用，这两个目标是否存在不一致呢？
========================
10.17 三面
全程问项目
========================
10.23 hr面
========================
无意向，目前还在泡池子
=================
首页第一条帖子招大模型应用算法实习生，欢迎投递

全部评论

推荐最新楼层

门头沟学院算法工程师

差不多同时间hr面，还没结果

点赞回复分享

发布于 2024-12-12 19:37 北京

03-23 09:02

广西大学算法工程师

网易 AI Agent开发二面

1. 说一下 SFT、RLHF、DPO 的区别，线上项目里你会怎么选？答：SFT 是监督微调，核心是让模型学会“像人一样回答”，训练数据一般是 prompt-response 对，优点是简单直接、稳定、成本低，适合把基座模型先拉到业务可用水平。RLHF 是先做 SFT，再训练奖励模型，然后通过 PPO 之类的方法让模型朝着“人类更偏好”的方向优化。优点是能更细致地对齐人类偏好，缺点是链路长、训练复杂、容易不稳定。DPO 可以理解成不显式训练奖励模型、也不走复杂强化学习，而是直接利用偏好对做优化，训练上比 RLHF 更简单，效果在很多场景下也不错。如果是企业大模型应用，通常优先级往往是 SFT ...

AI-Agent面试实战...

点赞评论收藏

分享

03-30 04:40

门头沟学院算法工程师

京东日常实习-大模型应用算法凉经

被横向挂了，希望发出来对大家有帮助！项目拷打+实习拷打1. GRPO在线学习策略过程，listwise 数据如何训练reward模型。2.MOE模型相关原理和微调经验。3. 逆序对实现和讲解（计算逆序对时如何避免重复计算）

查看3道真题和解析

点赞评论收藏

分享

03-19 15:01

已编辑

同济大学算法工程师

百度大模型后训练一面

📍面试公司：百度 文心一言🕐面试时间：2026.03.18💻面试岗位：大模型RL后训练❓面试问题：自我介绍，教育背景，项目经历项目介绍，基于大语言模型的信号灯控制，问题是什么，如何结合熵，怎么评测，指标结果如何强化学习理论内容，trust-range和PPO的关系PPO是off-policy or on-policy? on-policy为什么会有importance sampling，采样的策略模型和要训练的策略模型有偏差，重要性采样加以修正PPO的clip在优势A 正/负时 限制上/下届，A为正限制上届，A为负限制下届PPO的损失函数怎么计算的？广义优势估计是怎么计算？GAE中lam...

查看17道真题和解析

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

04-02 16:08

华南理工大学算法工程师

网易互娱（AI应用）实习岗位一面

1. 自我介绍2. 项目介绍3. 多智能体项目中，工具调用是怎么实现的？4. MCP 有哪些协议是否了解？5. RAG 的工作流程6. Tranformer 为什么出现？解决了什么问题？注意力机制介绍一下7. 大模型生命周期相关，训练，微调，量化，剪枝，蒸馏，部署，分布式等，从头到尾串了一遍8. 有一个垂域大模型，部署成本过高，如果要降低部署成本，你会选择蒸馏还是量化？9. Linux 进程与线程的区别10. Python GIL 锁有没有了解？怎么绕过 GIL 锁？11. Git 多人协作的时候怎么处理合并冲突？12. 开放性问题：你在学术项目中印象最深/感触最大的一件事13. 开放性问题：...

查看13道真题和解析

点赞评论收藏

分享

评论

3

16

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 父母问你工作找得怎么样，怎么回 #

8325次浏览 118人参与

# 面试被问期望薪资时该如何回答 #

389576次浏览 2176人参与

# 厦门银行科技岗值不值得投 #

19672次浏览 427人参与

# 哪些公司面试还在问八股？ #

3871次浏览 43人参与

# 想从事Agent应该学习哪些技术？ #

1696次浏览 55人参与

# 从投递到OC，你用了多久 #

8427次浏览 74人参与

# 你的秋招第一面感觉怎么样 #

146765次浏览 821人参与

# 有哪些公司在面试时考察AICoding？ #

3060次浏览 42人参与

# 什么人最适合大厂？ #

4256次浏览 39人参与

# 你觉得机械有必要实习吗 #

82158次浏览 515人参与

# HR面都在聊什么？ #

2847次浏览 42人参与

# AI时代还有必要刷leetcode吗？ #

1720次浏览 29人参与

# 哪一刻你突然觉得实习“有点值了” #

6919次浏览 53人参与

# kpi面有什么特征 #

106082次浏览 504人参与

# 硬件人的简历怎么写 #

341268次浏览 3120人参与

# 一人一道大厂面试题 #

133281次浏览 1331人参与

# 稳定和高薪机械人更看重哪个？ #

582452次浏览 5568人参与

# 总结:哪家公司最喜欢泡池子 #

171651次浏览 620人参与

# 四大天坑是哪四家？ #

113814次浏览 246人参与

# 计算机有哪些岗位值得去？ #

395237次浏览 2928人参与

# 哪些公司一直卡在简历筛选 #

109870次浏览 384人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务