算法打工人阿旺

05-25 22:17 已编辑中山大学算法工程师发布于山东

关注

腾讯WXG暑期实习面经-大模型算法

一面（1小时30分钟）：
上来先做题

1. 手撕AdamW
2. 手撕无重复字母的字串（hot100）
3. 出了两个题都是对数据库的操作，我以为是让写大模拟，写到一半结果面试官告诉我是用sql写🐱，不会遂罢。
4. 面对海量数据的时候怎么对数据进行处理，比如说去除掉敏感词等等，面对海量数据会出现哪些问题，该如何去处理
5. 介绍发表的顶会论文
6. 介绍Q-learning和DQN

二面（2小时30分钟）
实习乃至秋招面的最久的一轮面试了，从晚上七点多面到十点，最后人都麻了🥵，面试官估计要下班了结束了面试🐱

1. 介绍论文，主包是做强化学习相关的，围绕问了很多强化学习算法（GRPO，PPO，reward model)，介绍马尔可夫决策过程。
2. bf16、fp16和fp32，并进行计算。
3. lora微调的细节，量化相关知识
然后开始漫长的手撕过程🥵
4. 手撕ppo
5. 算马尔可夫决策过程的γ阈值，我感觉是个无穷级数？
6. 算模型sft的参数量大小及显卡利用率
7. 是否重合链表（hot100）
8. 如何使得一个输入向量x在经过一个或多个全连接层后，其输出向量y所在子空间基底尽可能接近标准正交基

三面（面委会面）（30分钟）
1. 介绍第一篇顶会论文（共享屏幕）
2. 介绍第二篇顶会论文
3. 不同强化学习之间的区别
4. 和使用强化学习训练大模型相比，使用强化学习训练小模型需要做出哪些改变

hr面（30分钟）
常规的hr面问题，主要问来wx的意向。

感觉前几面比较侧重技术细节，面委会感觉就比较侧重聊未来技术的发展，个人感觉前几面的压力比较大😼
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

05-23 22:28

大连理工大学 Java

被裁了。 去年有多辉煌 现在就有多狼狈

6的三次方：是因为AI降本裁员吗

点赞评论收藏

分享

05-26 19:51

北京邮电大学 Java

【面经】5月20日，蚂蚁智能体与大模型应用一面

自我介绍如何解决大模型幻觉？问题2中说到了模型的微调，面试官问对模型微调那些算法了解吗？项目的skills是怎么实现的？你是怎么写skills的？Spring AI框架的skills调用更像Claude Code还是其他Harness agent？你说看过Claude源码，Claude Code学习经验总结？Claude Code是给模型用grep检索，没有用RAG检索，这俩有什么区别？为什么没用rag？讲讲RAG的混合召回url解析过程tcp三次握手、四次挥手mysql的数据结构，讲讲B+树Spring的控制反转、AOP你平时用什么做ai coding？

查看13道真题和解析

点赞评论收藏

分享

05-26 12:11

门头沟学院算法工程师

海底捞大模型面经

面试官一上来没问传统的八股，直接问一个场景题怎么做一个海底捞智能点餐Agent的后训练。我说那当然是先SFT再RL。但这个不能只简单的sft，根本就没有训练数据，你这个场景还得是多轮的，用户又不是报菜名贯口选手，张嘴就来一串"番茄加牛油 + 麻一度+七寸盘脆毛肚"。没有对话数据，从哪开始炼？先搞数据吧。现在海底捞门店全是 iPad 和小程序点单，数据形态是用户行为轨迹（trajectory），不是对话：- 选锅底（番茄 + 牛油）- 加菜、撤菜- 翻页停留（隐式反馈）- 临时改备注要把这套 UI 操作流翻译成自然语言多轮对话，再喂模型学。目标语料长这样 👇▎ Agent：先看锅底？▎ 用户：有人吃辣有人不吃。▎ Agent：番茄牛油鸳鸯，行么？▎ 用户：可以，麻度调到 1。▎ Agent：开始点涮菜吧。▎ 用户：来份捞派脆脆毛肚……把过去的点单流水批量合成几十万条这种对话，SFT 阶段仅计算 Agent 那一侧的 loss（User轮次全 mask 掉），不然模型会学着模仿用户瞎点菜。多轮在线 RL 比 SFT 难十倍——没人能现场陪你跑几万局。所以得先训一个 User 模拟器：- 输入种子 profile：黑海 / 金海 / 银海等级、历史偏好、过敏忌口、是否「薅羊毛型选手」……- 第一轮 Agent 出招后，模拟器接力生成第二轮回应，往返多轮- profile 里塞一个 「结束点餐」special token，控制对话什么时候自然停下有了这个模拟器，才能稳定 rollout 出多轮 trajectory 喂 RL。面试官追问多轮RL的reward怎么设计？我的思路是全部做成 verifiable reward，避免 reward hacking：符合历史人均消费客单价+100分，点餐分量合理+80分，荤素分布合理或符合历史分布+60分，命中特殊需求轮次奖励+120分。用pav信用算法分配考虑turn级的分配，，引导模型循序渐进引导式点单——而不是一上来甩一整本菜单让用户挑。面试官说又追问，这么做的大模型应用真比直接点餐体验好吗？我愣住了，你们招这岗位，不就是要做这个事吗。。。为啥还要质疑存在的合理性？我只能硬着头皮答😅面试官说:谢谢你的时间。后续是挂了

查看3道真题和解析

点赞评论收藏

分享

昨天 13:52

上海大学算法工程师

黑马点评-消息队列相关

Q：好的我现在明白不是返回数据格式的问题，但我还是很模糊，你给我再讲一下后端返回给前端数据的一般过程，和用消息队列后的返回过程A：tomcat线程先释放 （本来controller调service service调mapper查询数据库，一整套流程走完返回VO实体类给前端，有了消息队列后，controller接收到请求，查redis，判断下单成功直接给前端返回数据，然后释放tmocat线程，后台启动一个静默线程执行订单insert数据库等操作，，，并在 一段时间后再次给前端返回数据）我给你画最清晰、最朴素、最真实的前后端交互流程你马上彻底不模糊！我只讲最本质的区别：先记住一句超级本质的话后端给...

点赞评论收藏

分享

05-25 17:19

西安电子科技大学 Java

个人感觉腾讯的HR面和阿里的HRG一样，都是懂业务的，30mins1.自我介绍2.介绍一下你的Agent项目3.你认为在广告业务上怎么用Agent实现自动化和提效4.谈谈你的优点和缺点5.在Agent项目里面遇到过技术难点是怎么做的6.如果你的想法和领导或者导师出现了分歧怎么办7.接受哪里的base地8.哪里人9.到岗时间、实习时间10.询问身体状况等

查看10道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

992261次浏览 4993人参与

# 万物皆可发面经 #

3162次浏览 37人参与

# 27届实习投递记录 #

160157次浏览 1632人参与

# 实习，不懂就问 #

227240次浏览 1744人参与

# AI了，我在打一种很新的工 #

203965次浏览 1961人参与

# 从mentor身上学到了__ #

67366次浏览 938人参与

# 父母对你找工作是助力还是阻力？ #

51698次浏览 456人参与

# 你的mentor是什么样的人？ #

66525次浏览 841人参与

# 你觉得mentor喜欢什么样的实习生 #

63746次浏览 1079人参与

# 我和mentor的爱恨情仇 #

121215次浏览 1036人参与

# 牛友的志愿填报指南 #

73147次浏览 506人参与

# 找工作时的取与舍 #

139930次浏览 932人参与

# 第一次找实习，我建议__ #

89640次浏览 910人参与

# 你上一次给父母打电话是什么时候 #

46597次浏览 288人参与

# 求职中的尴尬瞬间 #

43070次浏览 127人参与

# 面试等了一周没回复，还有戏吗 #

255027次浏览 1871人参与

# 为了入行xx岗，我学了__ #

51206次浏览 410人参与

# 找实习记录 #

281822次浏览 1662人参与

# 校招笔试 #

585170次浏览 3156人参与

# 如何快速融入团队？ #

59447次浏览 327人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务