算法打工人阿旺 level
获赞
326
粉丝
369
关注
0
看过 TA
2340
中山大学
2026
算法工程师
IP属地:山东
高级算法工程师,多模态/大模型/搜广推方向辅导
私信
关注
05-25 22:17
已编辑
中山大学 算法工程师
一面(1小时30分钟):上来先做题1. 手撕AdamW2. 手撕无重复字母的字串(hot100)3. 出了两个题都是对数据库的操作,我以为是让写大模拟,写到一半结果面试官告诉我是用sql写🐱,不会遂罢。4. 面对海量数据的时候怎么对数据进行处理,比如说去除掉敏感词等等,面对海量数据会出现哪些问题,该如何去处理5. 介绍发表的顶会论文6. 介绍Q-learning和DQN二面(2小时30分钟)实习乃至秋招面的最久的一轮面试了,从晚上七点多面到十点,最后人都麻了🥵,面试官估计要下班了结束了面试🐱1. 介绍论文,主包是做强化学习相关的,围绕问了很多强化学习算法(GRPO,PPO,reward model),介绍马尔可夫决策过程。2. bf16、fp16和fp32,并进行计算。3. lora微调的细节,量化相关知识然后开始漫长的手撕过程🥵4. 手撕ppo5. 算马尔可夫决策过程的γ阈值,我感觉是个无穷级数?6. 算模型sft的参数量大小及显卡利用率7. 是否重合链表(hot100)8. 如何使得一个输入向量x在经过一个或多个全连接层后,其输出向量y所在子空间基底尽可能接近标准正交基三面(面委会面)(30分钟)1. 介绍第一篇顶会论文(共享屏幕)2. 介绍第二篇顶会论文3. 不同强化学习之间的区别4. 和使用强化学习训练大模型相比,使用强化学习训练小模型需要做出哪些改变hr面(30分钟)常规的hr面问题,主要问来wx的意向。感觉前几面比较侧重技术细节,面委会感觉就比较侧重聊未来技术的发展,个人感觉前几面的压力比较大😼📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看18道真题和解析
0 点赞 评论 收藏
分享
1️⃣一面 1. 介绍第一篇论文,reward model怎么设计。2. 过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。3. 如何保证强化学习的训练效率(平衡效率和稳定),grpo训练过程中出现了全0或者全1怎么解决。4. 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。5. 现在大模型还有那些能力值得增强。6. 介绍第二篇论文7. 介绍第一段实习,介绍落地的场景。8. 写题,非hot100的模拟2️⃣二面1. 介绍第二段实习,中间会打断提问,问看过qwen2.5‑vl的报告了吗,问具体业务细节,强化学习数据集的构建方法,问部门几个人2. 介绍第一段实习,主包这一段实习是基座的,问了很多部门的情况,包括后训练、预训练、数据生成等等3. 介绍第一篇论文,介绍背景和方法4. 面试官感觉很真诚,共享屏幕介绍他们组的业务3️⃣三面1. 问是保研的吗,论文是研究生阶段发的吗,大四在干什么,研究生的毕业论文写好了吗,两篇论文是一个领域的吗2. 介绍第一篇论文,中途打断,说不了解你们这个领域,针对强化学习的底层设计,怎么去设计的,强化学习能解决什么问题,强化学习每一轮用的数据是多少,模型用的多大的,用小模型做强化学习效果会好吗,实验室里有多少张卡,训练的时候都用了几张。3. 研究生阶段在做科研时遇到了什么困难,花费时间最长的是哪个阶段,研究生有什么成功的经验,有没有失败的经历,发现某条技术路线不行。4. 你认为未来会有什么新技术,还会有强化学习这种路线吗,agent调用工具时工具需要很多参数,幻觉现象很严重,未来可能会有什么解决方案4️⃣四面1. 共享屏幕介绍论文,面试官听不懂,打开word讲述,问论文的创新点,输入输出是什么。2. 介绍第二篇论文。你的方法有泛化性吗,可以泛化到垂直领域吗3. 介绍第一段实习,问有什么经验,有哪些失败的尝试4. 介绍第二段实习,觉得我的介绍太平铺直叙了,说可以后面做个PPT📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务