快手 快star 大模型应用 一面凉经

整体50分钟

1.面试官先介绍了团队,说是快手商业化那边的,然后我自我介绍

2.直接开始写题,出了一道求数组第k大的题

3.开始拷问实习,先让我讲了一下实习干什么,问我如何让模型更好的感知人设信息,然后问我模型评估相关的,然后问我vllm的原理;问我用的模型是多大规模,然后问我llama2的结构特点,我说了几个rope、swiglu、rmsnorm啥的,每个都拷打底层数学原理

4.拷问第一个项目,我的是一个rag的项目,先讲了一下原理,然后他让我讲对比解码,讲完让我说说rerank怎么做的

5.拷问论文项目,我直接共享开始讲,讲完他问了几个问题

6.拷打八股,先问我假如说把分类问题的交叉熵损失换成均方损失,具体会怎么样;然后问我、交叉熵、熵、kl散度具体有什么区别

#如何一边实习一边秋招#  #大模型#  #如何判断面试是否凉了#  #正在实习的碎碎念#  #24届软开秋招面试经验大赏#  #实习中的菜狗时刻#  #面试中,你被问过哪些奇葩问题?#  #软件开发笔面经#
全部评论
边实习边面试确实很多忘光了
5 回复 分享
发布于 2024-07-25 16:00 北京
我6篇一作A,面对这种问题也一时半会想不起来,还是要好好复习学习
2 回复 分享
发布于 2024-07-28 00:46 新加坡
感谢分享
1 回复 分享
发布于 2024-08-08 18:38 黑龙江
大佬你在伏羲做roleplay的吗
1 回复 分享
发布于 2024-07-25 17:06 江苏
这种人才计划大概是啥bar能见面呀,好强啊
点赞 回复 分享
发布于 2024-08-05 11:59 北京
大佬什么bg
点赞 回复 分享
发布于 2024-07-28 00:45 新加坡
兄弟,为啥不冲转正
点赞 回复 分享
发布于 2024-07-26 04:26 浙江
考虑我司么
点赞 回复 分享
发布于 2024-07-25 17:31 上海
佬,你是啥状态现在,我这边前天面完一直没有约面。
点赞 回复 分享
发布于 2024-07-25 16:29 北京

相关推荐

✅一面 1.首先是自我介绍和过项目,面试官还一起探讨项目用到的方法,可行性之类的2.介绍一下 CLIP3.了解 LoRA 吗, LoRA 微调的原理是什么4.了解哪些多模态大模型,简要介绍几个5.BLIP的三个损失函数分别是什么,数据是怎样清洗的6.BLIP2相对于 BLIP 有哪些改进,BLIP3又有哪些改进7.Qwen- VL 的三个训练流程分别是什么,有什么作用8.视觉编码器和 LLM 连接时,使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好,说说各自的优缺点9.代码:实现多头自注意力一面比较常规,几乎都是八股问题,我觉得只要了解常见的多模态大模型都问题不大,主要还是要理解各个模型设计的动机是什么,这也是面试最喜欢考察的✅二面1.自我介绍和过项目,简要问了项目中使用某些方法的动机,以及是否会导致其他的问题2.了解 Transformer 吗,编码器和解码器的注意力有什么区别,在计算注意力中时除以 dk \ sqrt { d _ k }\ sqrt [ d _ k }的原因是什么3.后来有哪些比较经典的基于 Transformer 的语言模型, Qwen 相比于原始 Transformer 有哪些结构上的改动,Qwen2又有哪些改进4.了解 RLHF 吗, DPO 和 PPO 有什么区别, Loss 是什么样的,各自的优缺点是什么5.介绍一下 CLIP ,还了解什么其他的对比学习方法6.开放题:了解哪些多模态大模型,目前多模态大模型最的问题是什么7.代码:1143.最长公共子序列二面其实也偏常规,几乎也都是八股问题,但是也考察了一些对模型的理解以及知识面的广度,整体来说比一面的难度大一些✅三面:1.自我介绍,然后详细过了一下项目2.了解哪些大模型和多模态大模型,然后就聊了大模型这一路是怎么发展过来的,Transformer 、 BERT 、 GPT 、 LLaMA 、 Qwen ix ,以及当时的o1推理模型3.平常有尝试过训练过大模型吗,规模小一点的也没关系4.聊天,包括职业规划等等三面比较轻松,面试官说知识点前面两面都考察过了,三面就轻松一些,大概40来分钟吧📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
点赞 评论 收藏
分享
评论
21
80
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务