昨天 14:00 门头沟学院算法工程师

关注

蚂蚁大模型llm算法日常实习面经

继续来分享下最近的面经攒攒人品～
1. 项目模型选型 qwen的技术报告
2. 场景下为什么选用DPO，卡和资源环境
3. 实验设计题：长文本预训练，设计实验找出不同数据源不同语料大小下 loss收敛和不收敛的原因
4. SFT和RL两阶段的意义
5. 看的工作，sota
6. 有什么想讲的 highlight的点，有什么想问的

全部评论

推荐最新楼层

昨天 22:37

广西大学算法工程师

小红书 AI应用开发一面

1. 如果知识库原始数据不是 markdown，而是 PDF、PPT、图片或者网页，你会怎么处理进 RAG 系统？PDF 和 PPT 会提取标题、段落、表格和页码，图片先做 OCR，网页先抽正文和元信息，然后统一清洗噪声、去掉页眉页脚、按语义做切片，补上来源、时间、文档层级这些元数据，最后再做 embedding 和索引。这样后面的召回、溯源和权限控制都更稳定。 public List<Chunk> buildChunks(Document doc) { List<Block> blocks = parser.parse(doc); List<Block> ...

AI-Agent面试实战...

点赞评论收藏

分享

昨天 16:00

门头沟学院算法工程师

大模型算法日常实习-字节- TT搜索

攒攒人品！有面试过同岗的朋友欢迎评论区交流项目：1. 意图识别具体分哪几类？是怎么做的？2. 如果是多意图该怎么处理？（单标签 vs 多标签分类）3. 场景题：动态意图问题：某个关键词词意图随时间/热点变化，模型如何适应？4. RAG在意图识别的作用5. 3B模型大流量场景下，有什么办法既能利用3B模型的效果，又不需要实时推理？6. vllm技术优势 为什么推理性能好1. 为什么选Qwen做裁判？有没有做过不同模型版本、参数的消融实验？交付指标是什么？3. dpo的正反馈样例具体指什么？是人工标的还是线上的？4. SFT后做DPO：DPO和RLHF（PPO）的区别是什么？5. 如果没有 Reference Model（参考模型），去做RL/DPO训练，会产生什么后果？（考察：KL散度约束的作用，防止Reward Hacking和语言崩坏）。八股1. DeepSeek-R1：熟悉吗？它的训练或结构创新点是什么？ （r1-zero 和 r1）2. GRPO：GRPO和PPO的区别？3. 在RL中，如果模型每次Rollout都随机不出正确答案（一直0分），导致训练停滞，该怎么解决？Lc 239 滑动窗口最大值

查看13道真题和解析

点赞评论收藏

分享

昨天 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

昨天 19:37

南开大学算法工程师

26届延迟毕业能走转正实习么

想找大模型但是根本找不到。

点赞评论收藏

分享

03-29 00:12

广西大学算法工程师

阿里 AI Agent 开发一面

1. Agent 的架构设计一个完整的 Agent，一般不是单独一个大模型就能跑起来，核心会拆成几层。最上面是任务入口，负责接收用户问题和上下文；中间是决策层，负责意图识别、任务拆解、规划和工具选择；下面是执行层，真正去调工具、查知识库、访问服务；最后是记忆和状态层，维护多轮上下文、历史执行结果和中间变量。如果做得再工程化一点，通常还会加一个校验层。因为模型规划出来的步骤不一定总是对的，工具参数也可能填错，所以在执行前后都要做检查，比如参数合法性校验、工具返回结构校验、结果一致性校验。Agent 真正难的地方不是“能不能想”，而是“想完之后能不能稳定执行”。2. RAG 的检索如何实现RAG ...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

4370次浏览 48人参与

# 金融银行求职进展汇总 #

329607次浏览 1810人参与

# 招商银行数字金融训练营 #

44565次浏览 671人参与

# 大厂实习和小厂实习最大的区别是什么？ #

12092次浏览 83人参与

# 你都用vibe coding做过什么？ #

1949次浏览 60人参与

# 如果人生可以debug你会改哪一行? #

2360次浏览 54人参与

# 厦门银行科技岗值不值得投 #

11589次浏览 293人参与

# AI Coding实战技巧 #

1531次浏览 41人参与

# Vibe Coding 会干掉初级岗位吗？ #

4132次浏览 80人参与

# 你见过哪些招聘隐形歧视？ #

2555次浏览 33人参与

# 做完笔试后你收到面试了吗？ #

3750次浏览 50人参与

# 面试被问到不会的问题，你怎么应对？ #

4011次浏览 34人参与

# 牛友の3月总结 #

8080次浏览 79人参与

# 你现在一天AI几次？ #

1243次浏览 41人参与

# 七猫笔试 #

5715次浏览 37人参与

# 选完offer后，你后悔学本专业吗 #

66607次浏览 262人参与

# 实习学到最有价值的工作习惯 #

66836次浏览 541人参与

# 哪些公司真双非友好？ #

71391次浏览 305人参与

# 最难的技术面是哪家公司？ #

71722次浏览 1063人参与

# 你认为小厂实习有用吗？ #

133405次浏览 720人参与

# 快手工作体验 #

321684次浏览 2932人参与

# 找AI工作可以去哪些公司？ #

24726次浏览 1062人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务