大模型暑期实习面经|腾讯音乐娱乐集团 技术研究—自然语言处理

  • 部门:QQ音乐
  • base地:深圳
  • 流程:一面+二面+三面+HR面
  • 推进速度:非常快,每一面在一小时内出结果

一面 50min

  1. 自我介绍
  2. 论文介绍
  3. 什么是MHA
  4. Attention运算公式
  5. 为什么除以根号dk
  6. 介绍现有相对位置编码和绝对位置编码的异同点,都有哪些结构
  7. RoPE的结构
  8. RoPE相比于绝对位置编码的优势是什么?为什么外推性更好?
  9. 为什么RoPE理论上可以无限外推?
  10. RoPE为什么可以利用绝对位置和相对位置的优势?
  11. 介绍RAG项目(基座模型是什么?几b ?全参微调用了多少卡?数据多大?问答对的形式有图片吗?
  12. 对RAG的理解是什么?为什么要用RAG?
  13. BGE模型的结构
  14. 什么是LoRA?有个两层神经网络,参数1万*一万,低秩r =100, LoRA参数量是多少?
  15. 为什么用KV Cache?
  16. KV Cache有哪些优化方法?
  17. 文生图/图生文结构了解吗?文生图的怎么解码的
  18. CLIP了解吗?
  19. Deepseek MOE架构路由机制的细节
  20. 场景题
  21. 手撕:快速排序
  22. 反问

二面 60min

  1. 自我介绍
  2. 论文拷打,提出质疑
  3. RAG项目介绍
  4. 分块的策略是什么
  5. PDF的表格和图片怎么解析的?图片和表格的信息丢失了怎么办?
  6. RAG的关键词检索和重排细节
  7. 异构图方式和传统的多模态拼接方式有什么性能上的改进吗?
  8. 多模态之间的特征的对齐你是怎么做的?现有工作怎么做的
  9. Prompt有什么系统性优化的方法?
  10. 代码:199: 二叉树右视图
  11. 简单介绍一下Prefix Cache ? Deepseek 是怎么开启Prefix Cache的?
  12. 位置编码的作用的实现方式有哪些?
  13. LLM推理部署的时候,会用vLLM, 这主要从哪些方面提升?怎么提升的推理速度?
  14. 文本生成解码策略,贪心搜索和束搜索的优劣是什么?
  15. 实习时间,反问

三面 50min

  1. 自我介绍
  2. 论文拷打,细到实验结果数据
  3. RAG项目400万文字怎么分块,索引,embedding的
  4. 微调的指标和RAG的指标是什么?ROUGE指标怎么计算
  5. 评估方式是不是太简单了,对SFT的指标还有没有更好的
  6. 项目中负责的部分
  7. 用的最多的GPU时间是多少
  8. 有做过多机多卡训练吗
  9. 为什么去前端实习了后又转算法
  10. 对未来的规划是什么,想做什么技术
  11. 实验室的方向是什么
  12. 大模型的预训练和SFT的不同是什么
  13. 限制大模型输入长度的因素有哪些?
  14. 目前的大模型如何解决长上下文?

HR面 30min

主要问项目、规划等,氛围比较轻松

#大模型算法工程师##NLP##大模型##腾讯音乐26届实习#
全部评论
确实厉害,膜拜一下大佬。(许愿三面过)
2 回复 分享
发布于 04-23 00:24 陕西
佬了解过是哪个业务线吗,做的什么方向,我目前手上有个集团公线的自然语言处理,在考虑要不要去,不清楚跟 QQ 音乐业务线的差距。
点赞 回复 分享
发布于 05-13 00:41 北京
大佬投了多久约面的
点赞 回复 分享
发布于 04-26 23:20 四川
八股这么难么
点赞 回复 分享
发布于 04-26 07:01 四川

相关推荐

05-08 17:04
已编辑
浙江大学 算法工程师
面试问题:- (针对简历提问)你工作里主要关注哪些指标?解释一下AUC含义、计算和作用- 主流的开源大模型结构有哪些?(prefix decoder,casual decoder、encoder-decoder)- 介绍一下layernorm和batchnorm的区别?- 在机器学习里,怎么处理长尾数据和多峰数据?- 怎么解决模型的冷启动问题,你觉得LLM在冷启动方面能够起到什么作用?- 介绍一下常见的优化算法(SGD ->Adagrad ->RMSProp ->Adam -> AdamW)?优缺点- 为什么Adam不一定最优而SGD最优的?怎么理解分析?- (针对简历提问)你工作里的对比损失是怎么构造的,有什么作用?介绍常见的对比损失的公式。代码题:- 数组第K大。给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。(力扣215原题)- 手写对比损失的计算(结合项目),并简单说了一下原理。(大概写出来就好)二面我这个是交叉面,提问的有部分设计大模型,也当然我简历上有大模型,所以问了一些llm+搜推的内容,但这部分交叉问题比较浅,能说个大概就很好,同时也有很多经典的机器学习面经问题。因为项目里提到了对标学习,所以面试官在代码考核部分让我写个示例,所以写进简历的一定要准备好(包括流程步骤,代码实现大概要清楚)。面广告算法的岗位,机器学习面经暴率很高,建议熟背,就算是看过有印象,问到的时候也会基本很稳。
点赞 评论 收藏
分享
评论
11
47
分享

创作者周榜

更多
牛客网
牛客企业服务