03-21 23:20 门头沟学院推荐算法

关注

多模态算法实习一面-小红书

面试很难，还是要多多练习，感觉自己说不明白业务逻辑
1.项目拷打
2.实习拷打
3.如何做RLHF阶段的稳定训练？PPO在RLHF中的核心不稳定点？
4.如果训练中出现：GPU利用率低、显存碎片化严重，你会如何排查与优化？
5.RLHF训练中，奖励模型（RM）的训练难点是什么？如何避免奖励模型过拟合，确保其能准确反映人类偏好？
6.数据清洗过程中，如何区分有效数据与噪声数据？针对不同类型的噪声（如文本错误、图像模糊），有哪些针对性的处理方法？
7.在大模型训练过程中，如何优化显存占用和训练速度？
8.你在过往项目中，有没有基于业务需求，提出过创新的技术方案或优化思路？如何推动方案落地并验证效果？
9.代码题：合并两个有序链表和二叉树中的最大路径和

全部评论

推荐最新楼层

来泡池子了的考拉很不想泡池子

字节跳动_CBG_广告算法工程师

同学，想试试我们组的实习吗，流程很快的

点赞回复分享

发布于 03-26 21:00 北京

04-07 00:00

广西大学算法工程师

快手大模型开发一面

1. 全参数微调的显存一般怎么估算全参数微调的显存不能只看模型参数本身，真正上线训练时至少要把参数、梯度、优化器状态和激活值都算进去。最粗略的估算方式是：如果模型参数量是 N，训练精度是 bf16，那么参数大约占 2N 字节，梯度再来一份 2N，如果用 Adam，还要额外保存两组一阶和二阶矩，通常再加 4N + 4N 字节。也就是说，不考虑激活值时，单参数相关内存大致可以按 12N ~ 16N 字节估。真正把 batch size、sequence length、checkpointing、并行策略加进去后，激活值往往才是大头。所以面试里如果只答“参数量乘 2”基本不够。更稳的答法是先给出静态...

AI-Agent面试实战...

点赞评论收藏

分享

03-27 10:30

门头沟学院算法工程师

字节日常实习二面-大模型算法

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.论文拷打2.如何确定改进的方向，动机是什么3.问了一下实习做的工作，没细问4.深度学习基础知识，网络怎么初始化5.过拟合6.dropout，推理时dropout需要什么额外处理7.手撕，算sqrt()，要写两种方法，牛顿迭代和二分查找

查看6道真题和解析

点赞评论收藏

分享

03-27 09:51

广西大学算法工程师

美团 AI Agent 开发二面

1. Agent 工具调用你知道怎么训练吗？训练集应该包含哪些？怎么得到训练数据集？如果只是让模型“知道有工具”，那只需要在 SFT 里教会它工具名和参数格式；但如果想让它真的会用工具，训练集必须覆盖完整决策链路。至少要有三类样本：一类是该调用工具的，一类是不该调用工具的，还有一类是要调用多个工具且有依赖关系的。否则模型很容易学成“逢问题必调用”。训练数据来源一般有几种。最理想的是业务日志里已有高质量人工操作轨迹，把用户问题、检索条件、调用参数、返回结果和最终回复串起来。没有现成轨迹时，就要靠规则模板、专家构造、模型自蒸馏和人工校验混合生成。真正难的地方不在造正样本，而在构造反例，比如参数缺失...

AI-Agent面试实战...

点赞评论收藏

分享

03-23 20:09

已编辑

百度_高级研发工程师

TCL鸿鹄实验室三面（总监面）

刚面完一把大厂的 AI 核心业务线，遇到个懂行的总监，一直在大模型微调这块给我挖坑，估计想看我是不是那种只会调第三方 API 的“外包型开发”。顺手把面试过程复盘一下，供后端转 AI 方向的兄弟们参考。一、 避坑：千万别在简历上乱吹“全量微调”很多后端兄弟为了简历好看，上来就写自己主导了全量微调（Full Parameter Fine-tuning）。这在懂行的人听来挺扯的，全量微调极其烧钱，动辄几百张 A100 显卡，普通业务线哪来这个算力和预算去给你折腾。面试时我直接兜了底：结合咱们真实的业务场景，我只参与了指令微调（SFT）和参数优化。其实大厂现在勒紧裤腰带，最看重的就是“花小钱办大事”，精准踩中降本增效和 ROI 才是正解。二、 被追问的深水区：怎么防“灾难性遗忘”后来聊到把公司的私有业务数据喂给开源大模型时，总监顺理成章地问到了“灾难性遗忘”——模型学了公司的业务黑话，结果连基础的逻辑推理都不会了。应对这个，我切入了用正则化（Regularization）做权重约束的方案。作为 Java 开发，能把这俩概念用大白话解释清楚，面试官基本就认可你的算法底子了：L1 正则化 (Lasso)： 核心在于惩罚项 \lambda \sum |w|。它的特性是会产生稀疏矩阵，能把大模型里很多不重要的特征权重直接清零。我结合了他们公司的端侧场景聊：在智能硬件上部署模型，内存和算力死贵。利用 L1 的稀疏性可以大幅压缩模型体积，在不怎么掉精度的情况下，保住端侧的推理速度。L2 正则化 (Ridge)： 核心是 \lambda \sum w^2。它不会把权重变 0，而是让其变得平滑。大模型的底座参数是跑了万亿 Token 炼出来的完美状态，加新知识时，L2 就像个限流器，防止底座权重发生剧烈漂移。这样既吸收了业务知识，又不会过度拟合。三、 找准后端的生态位：不抢算法的活最后面试官试探性地问：“既然算法原理这么熟，那这微调的训练代码是你用 Python 写的吗？”这绝对是个坑。做后端的一定要守住自己的边界，不能瞎揽活，我当时直接拉回 Java 主场：“炼丹跑 PyTorch 脚本主要是算法团队在搞。作为后端，我在微调链路里的核心价值是做‘数据工程化’。大家都知道 Garbage in, Garbage out，微调的上限全看数据质量。我主要用 Java 跑高并发的 ETL 任务，从 MySQL/ES 里把真实的业务日志抽出来，洗掉敏感词和废话，组装成严格的 {"instruction": "...", "input": "...", "output": "..."} 格式。没有后端的这条数据流水线，算法团队连干净的‘饲料’都拿不到。”总结：后端面 AI 岗位，最吃香的画像其实是：懂点算法底层逻辑（知道显存怎么省、遗忘率怎么控），但核心精力全扎在工程落地（清洗海量数据、保障系统并发）上的务实派。希望对大家有帮助。

查看3道真题和解析

点赞评论收藏

分享

03-30 18:45

门头沟学院 Java

慢脚AI开发二面

1. 你的RAG项目主要什么作用2. RAG项目工作流程是什么3. 你的RAG项目出现问题，怎么进行排错4. 大模型微调过程中数据预处理的步骤有哪些？5. 如何解决大模型Agent的工具调用 幻觉问题？6. LoRA微调技术是什么？7. 大模型Agent的记忆机制分为哪几类？8. 大模型后端部署常用的框架有哪些？9. 全参数微调与轻量化微调的适用场景分别是什么？10. 大模型Agent实现复杂任务规划的核心方法有哪些？11. 大模型推理服务的性能优化手段有哪些？12. 如何设计大模型微调后的效果评估体系？13. 大模型Agent对接第三方API时，后端如何做接口鉴权、限流与异常捕获？14. 大...

查看22道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职进度条 #

1235959次浏览 9144人参与

# 第一份工作应该选择高薪还是大平台 #

220817次浏览 1044人参与

# 华泰星战营，提前锁定校招offer #

4789次浏览 282人参与

# 你简历上最心虚的一句话 #

2243次浏览 22人参与

# 考公VS就业，你怎么选？ #

100041次浏览 524人参与

# 哪些公司对双非友好 #

230140次浏览 1237人参与

# 卷__卷不过你们，只能卷__了 #

60049次浏览 757人参与

# 校招第一份工作你干了多久？ #

150232次浏览 631人参与

# 商战，最累的是我们 #

31693次浏览 99人参与

# 国企/银行/研究所公司爆料 #

209321次浏览 920人参与

# 小红书求职进展汇总 #

238529次浏览 1397人参与

# 找工作的破防时刻 #

289643次浏览 2065人参与

# 面试线索爆料 #

127284次浏览 699人参与

# 春节前，你还在投简历吗？ #

43091次浏览 351人参与

# 大疆求职进展汇总 #

699887次浏览 4351人参与

# 字节7000实习来了，你投了吗？ #

44372次浏览 349人参与

# 总结:offer选择，我是怎么选的 #

287466次浏览 1565人参与

# AI时代还有必要刷leetcode吗？ #

50921次浏览 589人参与

# 工作中，努力重要还是选择重要？ #

286081次浏览 2587人参与

# 26届春招投递记录 #

5158次浏览 54人参与

# 机械求职避坑tips #

100388次浏览 580人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务