横扫腾讯/字节/PDD:2025大模型算法社招面经

1️⃣自我介绍
2️⃣项目拷打
这一部分决定了面试官对于你经验的评估,项目的理解要深一些,这个只能通过不断打磨完善项目经历。
✅微调项目:
1.业务背景
2.数据的构成,是否使用了合成数据
3.训练的过程中用了什么方法(为什么用这样的方式,用别的方式会有什么问题,是否尝试过)
4.如何评估整体的效果
5.微调之后是否还会出现幻觉的问题,出现了的话应该怎么处理
6.这个能力是否只能用在当前业务场景,是否可以作为一个通用的能力
7.是否尝试过用其他的基座模型
✅应用层项目:
1.业务背景
2.逻辑框架
3.优化前和优化后的能力差距
4.遇到最大的困难是什么?怎么解决的
是否还有别的优化方式
5.某个流程是否可以进行再优化
6.上线之后的效果反馈
3️⃣通识考察
(1)Transformers 和之前的模型的区别,为什么 Transformers 好?
(2)介绍下 Bert,框架,预训练和后续的微调任务?
(3)为什么 Bert 适合做向量模型,底层原理是什么?
(4)RoBERTa 做了什么优化?
(5)想要大模型输出的内容都为 json 格式,怎么实现?
(6)OOM 问题怎么处理
(7)大模型的参数量是怎么计算出来的?(8)DeepSeek R1 的训练方式,GRPO 的原理是什么?
(9)基于过程的强化学习和基于结果的强化学习的差异是什么?
(10)Agent 的概念是什么?整体流程是怎么样的?
(11)DeepSeek R1 对于 Agent 的能力是否有提升,如何进行运用?
(12)RAG 的整体流程和评估方式?
(13)如何解决 RAG 中信息覆盖率低、幻觉、逻辑计算的问题?
(14)大模型的数据合成应该怎么做?有哪些方式?
(15)DeepSpeed 的三个 stage 分别是什么?有什么作用?
(16)模型并行和数据并行的区别是什么?这两种方式的数据流和梯度是怎么更新的
4️⃣手撕代码
✅算法代码:
手写位置编码
手写多头注意力机制
Leetcode:
零钱兑换
最长递增子序列
打家劫舍
最长公共子序列
跳跃游戏
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。

全部评论

相关推荐

09-03 21:48
南开大学 Java
📍面试公司:饿了么🕐面试时间:9月3号💻面试岗位:后端开发❓面试问题:一. 八股:1. Java中HashMap的底层实现原理是什么?2. ConcurrentHashMap如何保证线程安全?3. JVM内存模型和垃圾回收机制常见算法有哪些?4. Spring框架中IOC和AOP的核心概念及实现方式?5. Spring Boot自动配置是如何工作的?6. MySQL索引优化和B+树的结构特点?7. Redis缓存穿透、击穿和雪崩的解决方案?8. 分布式锁的常见实现方式,比如基于Redis或ZooKeeper?9. CAP理论和BASE理论在分布式系统中的应用?10. 微服务架构中服务发现和负载均衡的原理?11. (高难度)JVM调优实战中,常见参数如-Xmx和-XX:UseG1GC的配置经验?12. (高难度)分布式事务解决方案,如两阶段提交或TCC模式的优缺点?二. 项目:- 仿拼多多拼团项目:1. 如何设计数据库表结构来支持拼团功能,并处理并发拼团请求?2. 在拼团超时或失败时,如何实现自动退款和状态更新?- AI agent项目:1. AI agent如何集成第三方API(如OpenAI),并处理速率限制和错误重试?2. 如何优化AI响应延迟,包括缓存和异步处理策略?三. 手撕:- 题目:力扣第146题,LRU缓存机制(中等难度),要求实现一个LRU缓存类,支持get和put操作。
查看17道真题和解析
点赞 评论 收藏
分享
9.10面筋,60min1,自我介绍2,狠狠拷打项目,面试官说对你这个项目很感兴趣,详细讲讲。讲一下模型batch_size多大,长序列多长,模型每一层你是怎么写的,怎么训练的,服务器配置,参数设置,架构设计等等,3,深入讲解mamba架构,背景是什么,相比较其他模型有啥特点4,预测类的任务,详细讲接触的loss函数,方法,优缺点,使用场景,指标评价,如何计算。5,说我们主要用的有些transformer架构,包含几种注意力机制并且详细介绍不同,我说三种,然后打断我说我思维混乱😰6,讲解注意力机制,啥时候会梯度爆炸,怎么解决7,自己开发交通agent,做问答决策等。数据量特别少,预料少,专业知识很少😠,你怎么设计架构,怎么优化,怎么做系统。8,数据质量怎么具体提升,工程的具体操作,举一个详细的例子,讲流程,讲解其中步骤的算法等9,你实习怎么做模型训练的10,讲一下你做过最好的项目,背景,难点,自己担任了什么职务,最终指标咋样。11,讲一下实习做的一些业务范畴等12,自己如何真真正正的评测模型的效果,详细讲讲指标怎么来的13,无反问,无手撕,直接结束钉d会议。总体体验不好,另外自己接触独立研发大模型很少,自己做的业务不太相关,同时技术也不够。反思,应该好好专注于目前的阶段,先沉淀几个月,update简历,之后重新准备,复盘提升 相信会好很多,加油!😤😤😤
查看12道真题和解析
点赞 评论 收藏
分享
评论
1
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务