03-25 03:40 门头沟学院推荐算法

关注

Apple大模型算法面经分享攒人品中

继续来分享下之前的面经~欢迎友好讨论，信息共享
1. 怎么评估大模型合成数据的输出质量
2. “把优化过程压缩成 COT ”，训练数据长什么样？
3. 人工标注的数据，标注规范是什么，最终怎么对齐人的主观 bias？
4. 分类模型的数据配比是怎么设计的？和真实分布对齐了吗？理论依据依据是什么？
5. 计算模型训练的 FLOPs
6.前向传播和后向传播哪个计算量更大？大多少倍？为什么？
7. 模型部署时用的什么推理框架？vLLM 还是别的？vLLM 做过什么优化吗？比如PD分离之类的？最终效果如果，对比SGLang
8. GRPO的分布式策略，具体 TP、DP 参数是什么？为什么这么分配？
9. 如果同样数据去训70B，学习率应该更高还是更低？为什么？
10. 详细讲一下 reward model 怎么设计的，遇到过hacking，如何解决
11. 如果把这个 reward 设计迁移到对话任务，你会怎么做？

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-26 16:15 广东

Monash University 算法工程师

一共几几面呀

点赞回复分享

发布于 04-11 18:02 江苏

04-07 00:10

广西大学算法工程师

百度大模型开发一面

1. 你对 Claude Code、Codex、OpenHands 这类 Coding Agent 的理解是什么，它们的核心差别在哪这类产品表面上都在做“让模型帮你写代码”，但真正拉开差距的不是补全能力，而是任务编排、工具使用、上下文管理和反馈闭环。像 Claude Code 更强调命令行工作流、仓库级理解和连续执行，适合把模型放进真实开发环境里；Codex 早期更偏代码生成和 API 能力，强在补全和局部代码理解；OpenHands 这类开源 Agent 往往更强调可扩展性和多工具编排，方便接入自己的环境和流程。如果从工程视角看，这类 Agent 最终拼的是三件事：一是对代码仓库的建模能力，...

AI-Agent面试实战...

点赞评论收藏

分享

03-31 13:15

门头沟学院算法工程师

快手春招大模型算法一面求offer中

祝大家都能拿到满意的Offer！1. 项目拷打2. 实习拷打3. 介绍一下Reward model在训练中扮演了什么角色？4. 100页的pdf文件格式化后有多大？5. Qwen的模型结构了解多少？6. 安全生产的项目怎么评估的？1）传统指标：acc、rouge-L、berscore 2）模型打判 3）规则匹配7. 造好的数据，怎么做数据配比，如何评估数据质量？8. DPO是怎么训练的？9. 算法题：最长回文子串

查看7道真题和解析

点赞评论收藏

分享

04-09 12:20

门头沟学院嵌入式软件开发

阿里 AI Agent 开发一面（附答题思路）

1. Agent 的架构设计？一个完整的 Agent，一般不是单独一个大模型就能跑起来，核心会拆成几层。最上面是任务入口：负责接收用户问题和上下文；中间是决策层：负责意图识别、任务拆解、规划和工具选择；下面是执行层：真正去调工具、查知识库、访问服务；最后是记忆和状态层：维护多轮上下文、历史执行结果和中间变量。如果做得再工程化一点，通常还会加一个校验层。因为模型规划出来的步骤不一定总是对的，工具参数也可能填错，所以在执行前后都要做检查，比如参数合法性校验、工具返回结构校验、结果一致性校验。Agent 真正难的地方不是 “能不能想”，而是 “想完能不能稳定执行”。2. RAG 的检索如何实现？RA...

查看8道真题和解析

点赞评论收藏

分享

04-11 20:15

门头沟学院算法工程师

微信wxg大模型算法实习一面夯中夯

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.为什么强化学习用的是Grpo，没有用DPo测试？如果要改进的话有什么想法？3.有没有遇到上线后过拟合的情况？4.蒸馏部署的合规率怎么算的，离线的吗？5.在推荐场景下，有了sid之后怎么构造样本，然后以及怎么去训练。推荐系统和大模型结合，能基于目前的东西做什么改进？两个力扣：1.数组top k2.数组中出现两次的数

查看7道真题和解析

点赞评论收藏

分享

04-12 20:04

广西大学算法工程师

Shopee 大模型算法开发一面

1. 自我介绍2. 介绍你做的模型loss设计，包含基础损失与辅助损失，说明各部分作用与梯度流动逻辑模型loss采用多任务联合优化框架，主损失负责核心任务拟合，辅助损失用于约束特征对齐、分布对齐与梯度稳定。以多模态分类模型为例，主损失使用交叉熵损失，直接优化分类准确率；辅助损失包含对比损失用于拉近同类特征距离、拉远异类特征，以及KL散度损失用于对齐教师模型与学生模型的分布。训练时通过权重系数平衡各损失，保证主任务不被辅助任务淹没，同时利用梯度裁剪解决多任务梯度冲突问题。 import torch import torch.nn as nn class MultiModalLoss(nn.Mod...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

33567次浏览 430人参与

# 大学生该如何认清当下的就业环境？ #

162130次浏览 884人参与

# 有哪些公司在面试时考察AICoding？ #

18735次浏览 346人参与

# 运营来爆料 #

98756次浏览 508人参与

# HR面都在聊什么？ #

13303次浏览 162人参与

# 美团开奖 #

407663次浏览 1805人参与

# 26届春招投递记录 #

3544次浏览 42人参与

# 百度工作体验 #

325302次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8192次浏览 279人参与

# 实习学到最有价值的工作习惯 #

69559次浏览 551人参与

# OPPO求职进展汇总 #

808859次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143340次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

57121次浏览 371人参与

# 从投递到OC，你用了多久 #

23245次浏览 238人参与

# 什么人最适合大厂？ #

12438次浏览 132人参与

# 父母问你工作找得怎么样，怎么回 #

22650次浏览 281人参与

# 哪些公司面试还在问八股？ #

13644次浏览 123人参与

373747次浏览 2921人参与

# 我与AI的日常 #

3244次浏览 16人参与

# 我的求职进度条 #

1110069次浏览 8022人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务