【25暑期实习】商汤科技多模态二面

首先申明,这次面试官也很温柔,甚至感觉有点i呢,但面试过程略显尴尬,对st不做更多评价。

面试时间55分钟,没有写代码。面了一趟下来很多很多问题都忘了,因为不熟…回忆版面试题如下:

1. 不用开摄像头。
2. 自我介绍(开始前提示是算法岗,别介绍太多开发工作)
3. 开始介绍他们的工作内容
4. 我反问:你跟一面面试官不是一个组吗? 面试官答:你已经一面过了吗?(开始反应过来莫名其妙被不明来历的一面拷打,面试内容可见前几天的面经)

下面是正式面试过程
问的问题太碎了太碎了,而且面试官也在想要怎么问^ - ^

5. 项目经历问了很久,面试官是做多模态的,对llm不是很懂(我也不知道怎么进这个组的面试了)
6. 问题集中在diffusionc model,stylegan,因为项目用了这个,他问为什么用stylegan,这么老的模型,问了些细节,真回忆不起来了。
7. unet,resnet,clip都问了一下…主要是都没回答好。
8. lora具体是怎么实现的,一般训哪些参数?
9. p-tuning v1/2问了下细节
10. llama的loss函数
11. 用没用过DDP和deepspeed,有什么区别
12. 多分类任务如果发现都分到了一个label,怎么排查原因,怎么解决,数据不均匀怎么办,不改数据集pytorch代码怎么改?
13. 常见的位置编码知道哪些?图像怎么处理?超过长度怎么办?padding?截断?
14. transformer结构讲一下
15. 给你text讲一下转成embedding的流程
16. clip的位置编码,好像问了怎么外推
17. 有没有自己实现过dataload?
…其他的想不起来了就这样吧

自由提问
1. 组里后面的工作计划,面试官好像也不太清楚
2. 想篇research,组里有实习生纯research,有一半一半的
3. 问我对这个工作感不感兴趣,因为不完全是llm
4. 他们之前只用过llama2,又说现在换了个更好的,但是没想起来是啥,也只是微调了一下
5. 没啥想问的,确实没很大兴趣。

全部评论
oc了?
1 回复 分享
发布于 2024-04-29 17:41 美国
大佬之前在哪边实习呀
点赞 回复 分享
发布于 2024-04-29 18:04 美国

相关推荐

攒人品中,祝大家都能拿到满意的Offer!1.项目拷打2. 实习拷打3. 你们选用的训练方法是什么?训练数据具体是怎么构造的?4. 这里的训练过程,我理解是前面有一段医学语料的预训练,然后再加一段对齐过程,是这样吗?5. 关于 SFT 阶段,数据具体是怎么生成的?6. SFT 之后,后面的 DPO 过程又是如何开展的?7. DPO 需要 Chosen 和 Rejected 至少两组对比数据,这两组数据你们是怎么得到的?8. 我们现在这边可能对于医疗业务关系比较远,问一下更加基础的知识。既然谈到 DPO,谈一下 DPO 以及后续其他偏好学习算法的区别,以及各自的优劣。9. 那么 GRPO 算法呢?10. DPO 算法有哪些缺点?11. 谈谈强化学习中 On-policy 和 Off-policy 的区别,你是怎么理解的?12. 看你不仅做训练,还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗?13. 当时是在哪个项目里面参与 Infra 工作的14. 你刚才提到了 Megatron,你们试过 PyTorch 原生的 FSDP 吗?15. 既然试过 FSDP,为什么最终还是选用了 Megatron?,你们当时的选型考量是什么?16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别,FSDP 实现了 ZeRO 的哪几个阶段?ZeRO-1, 2 还是 3?17. 探讨一个现实的业务问题:我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节,将客户请求分发到不同的子 Agent,由于子 Agent 功能实现完全不同,不能混在一起,所以路由非常关键,一旦路由错误就无法满意回答。另外,作为全链路的必经点,路由必须足够快。我们考虑在最前端用一个相对较小(如 7B 或 13B)的模型,通过后训练使其掌握特定领域知识,实现低延迟的路由。如果让你做这个模型,你会怎么去做?
查看15道真题和解析
点赞 评论 收藏
分享
04-08 09:25
门头沟学院 Java
最开始面 Agent 岗,我天真地以为,只要把 ReAct、RAG、LangChain 的概念背熟,再把自己做的 demo 项目讲清楚,就能应付面试了。结果第一场面试,就被面试官问得哑口无言。那是杭州一家做企业级 Agent 的初创公司,一面开场,面试官先笑着问:“先简单讲一下,你理解的 AI Agent 是什么?和普通的大模型 API 调用有什么本质区别?”我照着背的概念念了一遍,本以为能过关,结果面试官的连环追问直接给我干懵了:“那你说 Agent 的核心是自主决策,那你在项目里是怎么实现决策逻辑的?ReAct 框架里,思考和行动的环节你是怎么设计的?”“你做的这个 Agent 项目,遇到过大模型输出格式不规范,工具调用失败的情况吗?你是怎么解决的?”“如果让你给这个 Agent 加多轮对话的记忆能力,你会怎么设计?短期记忆和长期记忆分别怎么处理?”一连串的问题下来,我支支吾吾半天答不上来,因为这个项目我只是跟着教程跑了个 demo,根本没考虑过这些细节。那场面试只进行了 25 分钟就草草结束,挂掉面试的那一刻,我坐在电脑前,满脑子都是 “我是不是根本不适合做 Agent 开发”。后来我才明白,Agent 面试最不缺的就是背概念的人,面试官想知道的,永远是你真的做过、真的踩过坑、真的思考过 Agent 落地的问题。
奶茶三分糖去冰加珍珠:太真实了!Agent 面试真的不是背概念就行,面试官要的是你真落地、真踩坑、真思考过工程问题😭
查看5道真题和解析
点赞 评论 收藏
分享
评论
8
38
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务