蚂蚁大模型算法实习一面

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.实习拷打
3.数据集使用的是公开数据集还在有自己构造数据集
大模型相关八股提问
4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别
5.讲一下MoE的 路由机制是如何做的
6.训练完验证使用的是什么数据集
7.做这个工作的过程中的难点在哪
8.如何做的 SFT
9.介绍一下 PPO
10.讲一下 RAG 项目
11.分类任务常用的评测指标有哪些
12.讲一下 LoRA 微调的原理
全部评论
没有手撕吗
点赞 回复 分享
发布于 03-30 20:18 四川
是电话面试吗
点赞 回复 分享
发布于 03-29 18:47 广东
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
点赞 回复 分享
发布于 03-29 13:38 上海

相关推荐

一面(1小时30分钟):上来先做题1. 手撕AdamW2. 手撕无重复字母的字串(hot100)3. 出了两个题都是对数据库的操作,我以为是让写大模拟,写到一半结果面试官告诉我是用sql写🐱,不会遂罢。4. 面对海量数据的时候怎么对数据进行处理,比如说去除掉敏感词等等,面对海量数据会出现哪些问题,该如何去处理5. 介绍发表的顶会论文6. 介绍Q-learning和DQN二面(2小时30分钟)实习乃至秋招面的最久的一轮面试了,从晚上七点多面到十点,最后人都麻了🥵,面试官估计要下班了结束了面试🐱1. 介绍论文,主包是做强化学习相关的,围绕问了很多强化学习算法(GRPO,PPO,reward model),介绍马尔可夫决策过程。2. bf16、fp16和fp32,并进行计算。3. lora微调的细节,量化相关知识然后开始漫长的手撕过程🥵4. 手撕ppo5. 算马尔可夫决策过程的γ阈值,我感觉是个无穷级数?6. 算模型sft的参数量大小及显卡利用率7. 是否重合链表(hot100)8. 如何使得一个输入向量x在经过一个或多个全连接层后,其输出向量y所在子空间基底尽可能接近标准正交基三面(面委会面)(30分钟)1. 介绍第一篇顶会论文(共享屏幕)2. 介绍第二篇顶会论文3. 不同强化学习之间的区别4. 和使用强化学习训练大模型相比,使用强化学习训练小模型需要做出哪些改变hr面(30分钟)常规的hr面问题,主要问来wx的意向。感觉前几面比较侧重技术细节,面委会感觉就比较侧重聊未来技术的发展,个人感觉前几面的压力比较大😼
查看18道真题和解析
点赞 评论 收藏
分享
评论
1
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务