02-28 08:30 门头沟学院机器学习

关注

字节AI算法二面好难啊

发点面经攒攒人品
1、你在线上或离线训练时，过拟合怎么处理？直接说你最有效的三个方法和拿到的收益。
2、把 BN 讲透：原理是什么；训练期和推理期用的统计量有何不同；跟 LN、GN 比，分别什么时候用、怎么取舍。
3、分类和回归你最常用哪些损失？你更偏好哪几个，为什么（从鲁棒性、梯度、数值稳定性上谈）。
4、L1 和 L2 正则你怎么选？它们各自的效果与风险是什么，工程里你是怎么权衡的。
5、二元和多分类的交叉熵你怎么写？在工程里你怎么做数值稳定实现。
6、AUC 到底在统计上代表什么？你怎么计算它，在线上业务里你如何解释“这次 AUC 提升”的含义。
7、你做 CTR/CVR/CTCVR 联合建模时，ESMM/ESMM2 是怎么推导与工程落地的？线上到底带来了什么收益。
8、Transformer 里因果注意力的 Q/K/V 各从哪来？Mask 具体怎么实现。
9、Scaled Dot‑Product Attention 为啥要除以 √dk？如果不除会出什么数值或训练问题。
10、把 Transformer / Decoder‑only 的整体结构过一遍，各个组件分别在干什么，有哪些常见变体。
11、位置编码这条线你怎么选：绝对 PE、相对 PE、RoPE 各自的思路、优势和局限，结合你的项目谈取舍。
12、长上下文怎么搞？Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力，你的实战方案是什么。
13、KV Cache 在训练和推理中的差异是什么？它的加速价值有多大，吞吐与延迟你是如何权衡的，vLLM/paged‑attention 需要注意什么。
14、PEFT 方案里（LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter）你怎么选？说说稳定训练的经验。
15、SFT 和对齐（RLHF/DPO/IPO/PPO）原理差在哪？在不同数据与资源条件下，你怎么选路线。
16、RAG 系统你怎么设计？切分、索引、召回/重排、压缩/融合、兜底策略怎么串。
17、提示词工程你是怎么搞的？System/角色/约束/分步指令怎么写，如何防越狱

全部评论

推荐最新楼层

门头沟学院 Java

硕吗

点赞回复分享

发布于 04-06 20:50 广东

03-18 23:17

已编辑

湖南大学反欺诈/风控算法

我开源了一个程序员求职刷题复盘浏览器插件 CodeNote Helper

💡 写在前面春招和暑期实习的节点越来越近了，相信很多同学和我一样，每天都在死磕算法题或者八股文。但在高强度的刷题过程中，我发现自己陷入了一个极其内耗的死循环：刷完就忘，复盘极其耗时。很多时候，前脚刚看懂了灵茶山艾府（灵神）等大佬的精妙题解，遇到同类变种题大脑又是一片空白。如果想认真做复盘笔记，不仅要在代码编辑器、网页和笔记软件之间来回切换，还要手动去调整 Markdown 里的代码高亮和 LaTeX 数学公式，半个多小时过去了还没进入核心逻辑的梳理。作为一个程序员，遇到这种机械的重复劳动，第一反应当然是：写个工具把它干掉。于是，我花了点时间开发了这款浏览器插件 CodeNote Helper...

一人分享一道面试手撕题

点赞评论收藏

分享

03-24 12:40

门头沟学院人工智能

科大讯飞大模型算法一面业务拷打

发点面经攒攒人品～1.实习拷打2. 论文拷打3.有什么涉及的具体的应用吗4.我看里面上写上面写了一些知识图谱的一个构建说一下这个这个任务的一个输入和输出吧，大概你用到了什么数据，然后什么模型去产出什么样的一个东西5.你这个图谱里边都有哪些类型的实体？关系是怎么定义的6.你用了BERT去做实体识别哈，那为啥用BERT呢？能不能直接用个BiLSTM搞定5.我看你提到了LayerNorm，这块为啥要用个条件LayerNorm有什么作用6.说一下transformer的底层结构吧7.Transformer为什么用了LayerNorm呢8.你说你做了一个Multi-Head Self-Attention，那注意力权重那部分你还记得公式是咋算的吗？9.说一下LoRA原理10.刚才提到用LoRA做参数高效微调的必要性，那如果不是用LoRA，而是做全参数微调，那会消耗多少显存，比如说我以一个7B规模的大语言模型为例11.说说现在千问里有哪些主流的大模型结构12.项目拷打13.那你们这个DAG 图是怎么构建的？根因节点怎么推出来的

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

03-19 16:15

门头沟学院推荐算法

美团也爱问AI

搜推+大模型算法一面面试题SFT & RL 方向先 answer 后 cot vs 先 cot 后 answer：两种 SFT 范式在训练效果上有什么差异？你是否做过对比实验？标注质量管控：如何保证人工标注数据的准确率达到预期标准？有哪些校验或质控手段？Checkpoint 选择：如何挑选合适的 SFT checkpoint，用于后续的 RLHF 阶段？多模态输入：图片是如何输入到 VLM 模型中的？一张图片通常会被编码为多少个 token？RL vs SFT：你认为强化学习（RL）和监督微调（SFT）的核心区别是什么？训练范式选择：为什么不直接从零开始做 RL，而是要采用「SFT → RL」的两阶段流程？RL 关键机制：什么是重要性采样？为什么在 RL 训练中要引入 CLIP 机制？策略类型差异：On-policy 和 Off-policy 算法的核心区别是什么？各自的适用场景有哪些？八股文（Transformer 基础）因果掩码作用：Transformer Decoder 中为什么必须使用自回归因果掩码？缩放点积注意力：为什么注意力分数要除以dk？（补充：Layernorm 前置后，除以d可将方差归一到 1，避免 softmax 梯度饱和）推荐系统方向生成式推荐 vs 传统推荐：两者的核心区别是什么？生成式推荐的目标是什么？你如何看待它的未来发展前景？指标计算：AUC、HR、NDCG 的计算公式分别是什么？GAUC 和 AUC 的区别在哪里？编码方式：如何在模型中加入时间编码和位置编码？常用的位置编码方法有哪些？Coding：手撕 Multi-Head Attention（MHA） 实现二面面试题SFT & CoT 细节概率分布特性：在「先 cot 后 answer」的 SFT 范式下，为什么越靠后的 token 概率（prob）会越高？蒸馏噪声处理：用大模型蒸馏得到的 CoT 数据存在大量噪声，该如何缓解？VLM 幻觉问题：对 VLM 做 SFT 时，发现模型更信任文本信息，看图时反而容易产生幻觉，有哪些解决思路？RL 进阶PPO 核心：写出 PPO 中 GAE 的公式，并说明如何递归计算每个 token 的优势函数（advantage）？DPO 损失：写出 DPO 算法的损失函数公式？算法对比：GRPO 和 PPO 的核心区别是什么？GSPO 和 GRPO 又有哪些不同？训练稳定性：你遇到过 RL 中的熵塌缩（entropy collapse）和 reward hacking 问题吗？分别有哪些改进方法？最近有哪些新论文提出了新方案？采样困境：在采样类 RL 算法中，on-policy rollout 无法得到正确答案时该怎么办？自蒸馏：了解 Self-Distillation 吗？为什么要做自蒸馏？最近这方向有哪些代表性论文？震荡优化：RL 训练中 reward 或 loss 震荡严重，该如何调整？（提示：可从学习率 lr、KL 散度约束等方向入手）推荐系统进阶结构对比：HSTU 和 Transformer 结构的差异是什么？它和 OneRec 的整体流程有什么不同？SID 优化：如何降低 SID 碰撞率，同时提高特征利用率？量化算法：RQ-VAE 和 RQ-Kmeans 的算法原理分别是什么？OneRec 工程：OneRec 中是如何将 SID 加入模型词表和 tokenizer 的？多模态融合：如何更好地结合文本特征和多模态特征？模型演进：Rankmixer 是如何发展到 Tokenmixer 的？Coding：给定一个行内严格递增的 m×n 矩阵，找到矩阵中第 k 大的数

面试官最爱问的 AI 问...

点赞评论收藏

分享

03-29 23:55

门头沟学院机器学习

LLM面试题： Transformer

Q:请详细解释一下 Transformer 模型中的自注意力机制是如何工作的?它为什么比 RNN 更适合处理长序列? 难度:⭐⭐ 公司:字节、阿里、腾讯(高频) 算法岗回答要点:   自注意力机制原理  输入序列通过三个线性变换得到 Q(Query)、K(Key)、V(Value) 计算注意力分数:scores = QK^T / √d_k Softmax 归一化得到注意力权重 加权求和:output = softmax(scores) · V    数学推导 Attention(Q,K,V) = softmax(QK^T/√d_k)V   为什么除以√d_k?防止点积过大导致梯度消失 Mult...

查看3道真题和解析

点赞评论收藏

分享

评论

点赞

14

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 从投递到OC，你用了多久 #

3509次浏览 33人参与

# 总结:哪家公司最喜欢泡池子 #

168858次浏览 593人参与

# 厦门银行科技岗值不值得投 #

19221次浏览 426人参与

# 我的求职进度条 #

992512次浏览 6578人参与

# 实习教会我的事 #

73822次浏览 510人参与

# 哪一刻你突然觉得实习“有点值了” #

1746次浏览 39人参与

# 一人一道大厂面试题 #

128515次浏览 1317人参与

# 哪些公司一直卡在简历筛选 #

107671次浏览 373人参与

# 实习生如何通过转正 #

136135次浏览 1488人参与

# 现在还是0offer，延毕还是备考 #

1364438次浏览 7953人参与

# 我想象的实习vs现实的实习 #

333159次浏览 2298人参与

# 有深度的简历长什么样？ #

54116次浏览 732人参与

# 反问环节如何提问 #

138661次浏览 2734人参与

# 入职第一天，你准备什么时候下班 #

118475次浏览 519人参与

# 拿到offer之后，可以做些什么 #

105620次浏览 513人参与

# 大厂无回复，继续等待还是奔赴小厂 #

350255次浏览 2007人参与

# Agent面试会问什么？ #

42227次浏览 1516人参与

# 春招至今，你收到几个面试了？ #

122721次浏览 1481人参与

# 说说你知道的学历厂 #

403337次浏览 1443人参与

# 一人分享一个skill #

11007次浏览 251人参与

# 米哈游笔试 #

656918次浏览 1160人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务