08-30 10:20 门头沟学院机器学习

关注

阿里算法面经

八股文：

SFT 训练时，数据规模和模型大小之间有什么 scaling law？

除了 GRPO，还有哪些改进技术？比如 DPO、GSPO？

怎么解决 DPO 和 GRPO 的 reward hacking 问题？

DPO、GRPO 和 PPO 有啥区别？

聊聊全参数微调和 PEFT？

PEFT 的四种模式（addition, replace, LoRA, prompt tuning）分别讲讲？

手撕算法：

链表题：判断链表有没有环，找出两个链表的相交节点。

O(n) 时间复杂度内，找出数组中第 k 大的数。

全部评论

推荐最新楼层

落糖糖

上海交通大学算法工程师

同学，瞅瞅我司，医疗独角兽，校招刚开，名额有限，先到先得，我的主页最新动态，绿灯直达，免笔试～

1 回复分享

发布于今天 08:39 广东

大模型界的路边一条

中国科学院软件研究所算法工程师

佬什么bg，有实习和论文吗

点赞回复分享

发布于 09-01 18:27 北京

嵌入式的小白

西安理工大学嵌入式软件开发

一直不太明白，这个时间复杂度到底有啥用

点赞回复分享

发布于 08-31 22:23 陕西

09-01 23:58

已编辑

字节跳动_后端开发(实习员工)

字节意向秋招进入半摆烂状态

走的跨部门转正流程，tl：8.15 一面8.18 二面8.22 三面9.1 hr面9.1 意向后续不投递其他公司了，手头流程走完就不面了。相比暑期挂了16次面试秋招顺利很多

世界以痛吻我我直接痛...：收手吧大佬，外面全是没有offer的鼠鼠，留口汤喝

一起聊字节

点赞评论收藏

08-29 18:55

门头沟学院机器学习

滴滴算法岗面经

因果模型：1. 给你两条数据，怎么评判哪条好哪条坏？2. 后门原则是啥？3. DragonNet 是怎么保证输出的单调性和一致性的？4. DragonNet 的损失函数都由哪几部分组成？里面的正则化项是啥意思，有啥用？多模态大模型：5. Transformer 里为啥要除以根号 d？6. Qwen2-VL 的微调，详细讲讲？7. 多模态里，图像处理用了最大池化，那反向传播的时候要怎么处理？8. Dropout 在训练时丢掉的那些神经元，推理的时候会用上吗？9. CLIP 的 batch size 是多少？10. 大模型里的 temperature 参数能控制复读、增强多样性，背后的原理是啥？手...

查看11道真题和解析

点赞评论收藏

08-06 12:29

中山大学算法工程师

淘天多模态大模型面经

✅一面 1．首先是自我介绍和过项目，面试官还一起探讨项目用到的方法，可行性之类的2．介绍一下 CLIP3．了解 LoRA 吗， LoRA 微调的原理是什么4．了解哪些多模态大模型，简要介绍几个5.BLIP的三个损失函数分别是什么，数据是怎样清洗的6.BLIP2相对于 BLIP 有哪些改进，BLIP3又有哪些改进7.Qwen- VL 的三个训练流程分别是什么，有什么作用8．视觉编码器和 LLM 连接时，使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好，说说各自的优缺点9．代码：实现多头自注意力一面比较常规，几乎都是八股问题，我觉得只要了解常见的多模态大模型都问题不大，主要还是要理解各个模型设计的动机是什么，这也是面试最喜欢考察的✅二面1．自我介绍和过项目，简要问了项目中使用某些方法的动机，以及是否会导致其他的问题2．了解 Transformer 吗，编码器和解码器的注意力有什么区别，在计算注意力中时除以 dk \ sqrt { d _ k }\ sqrt [ d _ k ｝的原因是什么3．后来有哪些比较经典的基于 Transformer 的语言模型， Qwen 相比于原始 Transformer 有哪些结构上的改动，Qwen2又有哪些改进4．了解 RLHF 吗， DPO 和 PPO 有什么区别， Loss 是什么样的，各自的优缺点是什么5．介绍一下 CLIP ，还了解什么其他的对比学习方法6．开放题：了解哪些多模态大模型，目前多模态大模型最的问题是什么7．代码：1143．最长公共子序列二面其实也偏常规，几乎也都是八股问题，但是也考察了一些对模型的理解以及知识面的广度，整体来说比一面的难度大一些✅三面：1．自我介绍，然后详细过了一下项目2．了解哪些大模型和多模态大模型，然后就聊了大模型这一路是怎么发展过来的，Transformer 、 BERT 、 GPT 、 LLaMA 、 Qwen ix ,以及当时的o1推理模型3．平常有尝试过训练过大模型吗，规模小一点的也没关系4．聊天，包括职业规划等等三面比较轻松，面试官说知识点前面两面都考察过了，三面就轻松一些，大概40来分钟吧📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

08-27 17:16

已编辑

中国科学院软件研究所算法工程师

小鹏- 大模型算法工程师-一面面经

📍面试公司：小鹏🕐面试时间：2025.8.27💻面试岗位：大模型算法工程师❓面试问题：1.手写🍣一个shuffle函数，要求时间复杂度为O(1)（磕磕绊绊搞了25分钟）2.讲讲旋转位置编码有哪些，旋转位置编码的原理？3.为什么位置编码可以和Embedding直接相加？3.BN和LN的区别4.讲讲PageAttention？5.如何评价一个推理系统的吞吐量，QPS承压？6.由上个问题引出了论文介绍，扒拉扒拉介绍一同，就没再问了。🙌面试感想：面试官人很好，没思路会提醒，很细致耐心地讲解一些他的理解。祝他工作顺利，好运常来。

查看6道真题和解析

点赞评论收藏

09-01 15:54

桂林电子科技大学安卓

美团二面秒过

二面把面试官聊嗨了，秒过。许愿美团意向。

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 简历无回复，你会继续海投还是优化再投？ #

# 正在春招的你，也参与了去年秋招吗？ #