算法打工人阿旺

05-11 21:41 中山大学算法工程师发布于山东

关注

爱奇艺大模型算法岗面经

1️⃣一面
1. Transformer、CLIP原理，图文对齐层工作机制
2. CLIP衍生进阶模型；检索场景模型适配改造思路
3. Transformer各类Decoder结构
4. 大模型通用预训练流程；电商垂域预训练必要性及原因
5. GRPO公式推导；PPO四大组成模型
手撕：多头注意力MHA代码
2️⃣二面
1. LoRA落地场景、常用超参配置
2. 长文本模型结构优化；Qwen3-VL RoPE、MRoPE原理，其他位置编码方案
3. 长文本训练各类优化Trick
4. 多模态图像Token冗余过多解决方案；图像Token长度限制实现方式
5. BF16与FP32精度差异、训练选型；训练推理精度一致性问题
手撕：反转链表
3️⃣三面
1. 多模态Embedding设计经验、图文对齐方案与主流对齐方式
2. Embedding模型与Reranker差异，二者训练Loss区别
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

门头沟学院算法工程师

MHA手撕能在20分钟内写完吗

点赞回复分享

发布于 05-13 17:19 湖南

05-21 12:45

常州大学算法工程师

马蹄钻石题

题目描述:给你一个大的二维数组a[n][n],小的b[m][m],让b在a中滑动，求出b的每一位与a的对应位置的异或，再求和。思路:不可能暴力枚举n^2*m^2,tle考虑到每一个b[i][j]在a中的移动轨迹都是一个大小相同的矩形，分析得到左上角a[i][j],和右下角a[n-m+i][n-m+j],求出来这个矩阵的元素个数s=（n-m+1）*(n-m+1),构建一个01数组，用前缀和o(1)的取出a数组每一位有多少个1 #include<bits/stdc++.h> using namespace std; // 题目要求的取模常数 const int MOD = 1e9 + ...

点赞评论收藏

分享

05-02 01:31

商汤科技_研究院_多模态大模型算法实习生(实习员工)

开发转算法，虽然不美，但总算有着落

从 Java 和 cpp 开发转算法，零零散散学了几个月，并在独角兽和互联网大厂业务部门做算法实习。27 届暑期实习四月才开始面试，开始状态不佳，加上在学校摆烂得太爽，面试频率低，后面调整状态后暑期面试也进入了后期。大厂可能并没有什么机会了，不过拿了一个商汤研究院多模态大模型算法的 offer，暂时这样吧，后面五月如果还能约到大厂的核心岗面试，能通过再换大厂，如果去不了，商汤研究院也还可以，至少是核心部门核心岗。面试记录：快 star 大模型算法一面挂，微信大模型算法二面挂，阿里淘宝闪购大模型应用算法一面挂，阿里高德算法一面挂，字节一直不知道被什么部门锁简历，没有面试，联想算法实习 offer（拒绝），深圳光明实验室研究实习 offer（拒绝），商汤研究院三面 offer（目前接受了），一个初创公司目前一面通过，但是面试官放假没约二面，一共四轮技术面，不知道何年何月结束，所以先接了商汤 offer。菜鸡完全躲懒摆烂，希望大佬轻喷。

点赞评论收藏

分享

05-11 19:06

广西大学算法工程师

虾皮 AI应用开发实习一面

1. 自我介绍2. 最快到岗时间和实习时长3. 讲讲你在字节的实习4. 服务运行在 K8s 上，你了解哪些核心概念，线上排查会看什么答案：K8s 里最核心的是 Pod、Deployment、Service、ConfigMap、Secret、Ingress、HPA。Pod 是最小调度单元，Deployment 管理副本和滚动更新，Service 提供稳定访问入口，ConfigMap 管配置，Secret 管敏感信息，Ingress 做七层入口，HPA 根据指标自动扩缩容。线上排查一般先看 Pod 状态、重启次数、事件、日志和资源使用。如果服务一直重启，看 kubectl describe pod...

AI-Agent面试实战...

点赞评论收藏

分享

05-13 23:00

中山大学算法工程师

阿里国际AI算法面经

一、自我介绍二、实习相关八股1. 实习业务场景负责大模型对话对齐、指令微调、强化学习优化，提升模型生成准确性、合规性与指令遵循度，落地垂类对话/问答业务。2. SFT数据筛选、采样及处理3. 选择GRPO的原因、优化目标及数学原理- 选型原因：相比PPO显存占用低、无需价值网络、训练更稳定，对齐效率高- 优化目标：最大化模型生成优势，约束KL散度防止策略突变- 原理：分组优势归一化、截断策略比率、近端约束，降低训练方差4. 奖励函数设计（重点）围绕有用性、准确性、合规性、流畅性设计，分维度打分；加入KL惩罚，避免单一奖励过拟合，区分正负奖励权重。5. 判断RL训练质量达标方法- 奖励值收敛、KL散度稳定；- 离线评测：指令遵循率、幻觉率达标；- 人工抽检生成内容，无退化、无套路化输出6. 是否遇到Reward Hacking遇到过，模型生成空洞话术、固定模板刻意刷高奖励值。7. 其他奖励作弊类型刻意迎合奖励规则、答非所问、重复安全话术、回避核心问题、策略坍缩同质化输出。8. PPO和DPO了解- PPO：在线强化学习，近端策略优化，带价值网络，训练复杂度高- DPO：离线偏好优化，基于成对偏好数据，无需交互采样，训练简单稳定三、基础八股1. Attention计算时间复杂度标准自注意力：O(n²d)（n为序列长度，d为特征维度）2. KV Cache原理推理时缓存历史token的KV矩阵，避免重复计算，降低算力开销，提升推理速度。3. GQA、MLA原理- GQA：分组查询注意力，Q分组共享KV，平衡推理速度与效果- MLA：融合局部+全局注意力，适配长上下文，降低显存占用4. vLLM原理基于PagedAttention分页管理KV Cache，提升显存利用率，支持高并发推理。5. Flash Attention原理分块计算注意力，优化显存IO，减少HBM访问，提速同时降低显存开销。6. 稀疏注意力原理仅计算局部/关联token注意力，舍弃全局无关token，将复杂度降至O(n)，适配长文本。7. 模型推理慢排查思路检查序列长度、batch大小；确认KV Cache、量化、FlashAttention开启；排查GPU显存、算子优化问题。四、编程题1. rand7()实现rand10()拒绝采样：rand7()*rand7()生成1-49数，保留1-40，映射为1-10，超出则重新生成。2. 浮点数组取整最小变化和贪心思路：每个数选上/下取整中差值更小的，累加最小总误差。3. 最长无重复子串

查看19道真题和解析

点赞评论收藏

分享

05-22 21:35

广西大学算法工程师

阿里云 AI 应用开发暑期一二面

5.16 三面结束 我看粉丝投稿的4.21 一面的 二面过完5.11. 自我介绍2. 怎么理解深度学习损失函数中的最大似然估计 MLE？答案：最大似然估计的目标是找到一组模型参数，让观测到的数据在当前模型下出现的概率最大。深度学习里的分类任务通常把模型输出看成条件概率分布 p(y|x; θ)，训练时希望真实类别的概率越大越好。实际优化时通常不会直接最大化似然，而是最大化对数似然，或者等价地最小化负对数似然。交叉熵损失本质上就是负对数似然。比如多分类中，真实标签是第 y 类，模型对这一类预测概率是 p_y，loss 就是 -log(p_y)。预测越自信且正确，loss 越小；预测越错，loss ...

AI-Agent面试实战...

点赞评论收藏

分享

评论

1

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

993203次浏览 4996人参与

# AI了，我在打一种很新的工 #

205274次浏览 2045人参与

# 发面经攒人品 #

8848793次浏览 98148人参与

# 万物皆可发面经 #

3567次浏览 49人参与

# 27届实习投递记录 #

160858次浏览 1636人参与

# 国企是春招机械人最好的去处吗 #

153447次浏览 578人参与

# 实习生至暗时刻 #

93311次浏览 942人参与

# 秋招投递攻略 #

295493次浏览 2640人参与

# 实习，不懂就问 #

227502次浏览 1749人参与

# 从mentor身上学到了__ #

67476次浏览 938人参与

# 父母对你找工作是助力还是阻力？ #

51928次浏览 458人参与

# 你的mentor是什么样的人？ #

66696次浏览 841人参与

# 你觉得mentor喜欢什么样的实习生 #

63862次浏览 1079人参与

# 我和mentor的爱恨情仇 #

121310次浏览 1036人参与

# 牛友的志愿填报指南 #

73202次浏览 506人参与

# 找实习记录 #

281943次浏览 1663人参与

# 找工作时的取与舍 #

139989次浏览 932人参与

# 第一次找实习，我建议__ #

89725次浏览 910人参与

# 你上一次给父母打电话是什么时候 #

46667次浏览 288人参与

# 实习如何「偷」产出？ #

767925次浏览 8396人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务