达摩院 暑期实习 决策智能实验室 大模型算法

个人背景可以看之前写的腾讯LLM面经

一面/技术面 2024/3/20 下午15:00-16:00

一面是电话面

  1. 你对大模型有什么了解?简单说了大致的流程,预训练、有监督微调,RLHF之类的
  2. 说一下RLHF的具体流程
  3. 给了一个场景:如果现在给你一个预训练模型,然后场景是要帮助小学生做数学题,你会如何从头到尾来做这件事?大概提了数据收集,清洗,然后有监督微调,思维链分解过程之类的东西,还有幻觉问题
  4. 你刚刚提到了幻觉问题,请问你知道有哪些缓解幻觉问题的思路吗?(结合之前写的基金本子回答了一波)
  5. 你刚刚提到了思维链,大概说一下流程
  6. 说一下NIPS那篇论文,中间问了大概十多个问题
  7. 写代码,以为会是LeetCode那种,没想到是让生成一个numpy随机矩阵,然后进行什么诸如判断数字是否在数组内,求数组均值方差,还有索引之类的东西
  8. 如果进来后,想做什么方向,要求将现在做的方向和LLM进行一个结合
  9. 进来后如果让你发一篇论文,你倾向于做些什么东西出来,有思考吗
  10. 问了下能实习多久
  11. 反问环节:进去后会偏向于做哪方面的东西

二面/技术面 2024/3/29 上午11:00-11:50

二面依然是电话面

  1. 没有自我介绍,面试官说和一面面试官聊了一会儿关于我前一面的表现,所以不需要介绍了
  2. 让我介绍一下NeurIPS的论文
  3. 问了下我主要在论文中干了些什么
  4. 面试官介绍了他们目前主要做的东西,主要是逻辑推理,思维链之类的
  5. 面试官问我对做这些事感不感兴趣,并且举了更细致的一些例子
  6. 反问了一些业务上的细节,进去后主要做什么
  7. 没有做题
  8. 问能实习多久,能不能接受去杭州

目前依然没有接到三面通知,但官网流程显示是面试中,发邮件询问了一下,说会尽快安排

#阿里##达摩院##暑期实习##大模型#
全部评论
蹲蹲后续
点赞 回复 分享
发布于 2024-05-15 15:57 安徽
有后续了吗
点赞 回复 分享
发布于 2024-05-07 15:53 湖南
想问一下楼主 电话面试写代码是怎么实现的啊 不是没有共享吗
点赞 回复 分享
发布于 2024-04-26 13:52 浙江

相关推荐

 总时长38分钟老套路,先是进行了自我介绍,3分钟完成。自我介绍完,我主动的问面试官,我要不要对我的主要工作做一个简要的汇报,面试官说可以,于是我便开始照着ppt阿巴阿巴。我发现这是一个很有用的技巧,因为若面试官同意汇报,相当于是把面试官引入了我的节奏,我讲的所有东西都是我亲手做过的,而且这样后,面试官问的问题也会和项目中内容相关,这样就会回答起来非常得心应手。这样就比你什么都不说,然后面试官突然提一个冷门的知识,你在那支支吾吾半天答不上来好太多了。而且,他在这问的问题越多,由于时长原因,后面问的其它问题就会越少。这场面试印象比较深的一个问题的是,PPO相对于其它策略梯度的算法有什么优势?我画图讲解了PPO使用了优势函数,让训练过程更加快速和稳定。然后面试官说,除了优势函数,PPO还有一个技巧来方法网络更新是参数差距过大,没等他说完,我赶紧抢着说,PPO有两种方式来实现更新时参数差距过大,一个是KL散度。。。。。。一个是截断函数。。。。。。通过这两种方式来实现早停。。。。。。讲完ppt后,面试官也没问其它的问题,进入了手撕代码环节。给了两个题目,让二选一。第一题又臭又长,我看都没看完,貌似是让你用python实现某个机器学习过程。第二题就比较简单,给定一个二叉树,让你输出每层节点的最大值,果断选择第二题,并几分钟写完了代码。然后面试官看我写的比较快,又让我用pythorch手动实现一下MLP,当时也没想那么多,就写了一个单层的MLP。最后反问环节,我还是问了老掉牙的问题,进去后主要干什么?是否有人带。现在想想估计面试官听这些也都听腻了吧。下次就问应该提前学些什么或准备些什么吧。
查看6道真题和解析
点赞 评论 收藏
分享
评论
3
18
分享

创作者周榜

更多
牛客网
牛客企业服务