熬夜一时爽一直熬夜一直爽 - 个人主页动态 - 牛客网

03-24 22:30

门头沟学院推荐算法

美团大模型算法实习面经-攒人品中

攒攒人品！有面试过同岗的朋友欢迎评论区交流实习拷打1. 大模型微调中，如何解决蒸馏数据里“伪优质数据”（表面合规但实际存在误导性）的筛选问题？具体落地策略是什么？2. Prompt迭代时，如何平衡“指令遵循率”和“业务适配性”？当两者冲突（比如按指令输出但不符合业务规范），你是怎么优化的？3. 用LoRA做大模型微调时，遇到过过拟合/欠拟合问题吗？具体是怎么排查、解决的？对比全参微调，LoRA在解决这类问题时的优势和局限分别是什么？4. 设计GRPO奖励函数时，当遇到跨场景需求，奖励权重如何动态调整？合规性的自动化评估，怎么适配不同场景的规范要求？5. 如何通过业务反馈闭环（用户反馈），反哺模型微调、Prompt优化和数据筛选？举1个你实际处理过的Bad Case，说明完整优化链路。八股1. Self-Attention中Q/K/V各自作用？为什么要分开？2. 把K换成Q（QQV）可行吗？为什么？

查看7道真题和解析

0 点赞评论收藏

分享

03-19 23:10

门头沟学院推荐算法

推荐算法实习面经 bilibili

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.DIN和HSTU，传统transformer中的注意力计算有什么区别，哪个更好为什么3.损失函数的设计逻辑4.时间特征的处理，为什么对时间分桶5.介绍一下DCN6.精排方面的特征处理，特征交叉7.长序列建模是否了解手撕 计算auc

查看8道真题和解析

0 点赞评论收藏

分享

03-15 20:30

门头沟学院推荐算法

日常实习-字节-大模型算法-二面

继续来分享下之前的面经~欢迎友好讨论，信息共享实习、项目拷打1.图文多模态大模型发展史2.位置编码的演变过程3.图文对齐时一般采用哪种方式4.模型的能力是在预训练阶段确定还是后训练结束之后5.追问:现在后训练为啥比之前更能激发模型的能力，有哪些形式上的创新手撕:写多头注意力机制，加上掩码

查看6道真题和解析

0 点赞评论收藏

分享

03-13 00:30

门头沟学院推荐算法

大模型算法面经分享日常实习

攒攒人品～ 1. Lora应用于哪些模块？为什么是这两个模块？2. Lora两个矩阵怎么初始化？它们的初始化方式能交换吗？为什么？3. Lora r 怎么设置的？为什么这样设置？4. 残差连接的作用？5. 怎么train一个好的lora？具体超参数怎么设置的怎么调优？为什么不只靠学习率，为什么还需要ahlpa/r？6. top-k，top-p，temperature是怎么实现的？7. Qwen2.5VL做了哪些改进？8. 为什么大模型需要强化学习，比起SFT有什么区别？9. 现在的embedding模型有哪些问题？怎么改进？

查看9道真题和解析

0 点赞评论收藏

分享

03-07 22:20

门头沟学院推荐算法

实习面经-字节大模型算法二面

感觉自己好菜、面试很难，还是要多多练习1.大模型相关经历深挖：你项目里最核心的贡献是什么，怎么验证有效2.对比学习 loss：负样本和正样本拉不开/太像了，你会怎么改损失或采样3.FlashAttention 跟普通 attention 的差异？实现里 QK^T、softmax、PV 这几步怎么落4.3D 并行里 DP/DDP你怎么理解；实际落地时通信瓶颈一般卡在哪些环节5.14B：FP16 权重大概多大；训练还要加哪些；INT8 大概能省多少6.torch.contiguous() 干嘛的？推理为什么在意连续性7.代码：读 txt 井字棋（3×3），判断当前玩家是否获胜8.交叉熵损失：解释/怎么写9.线性回归用 SGD：更新公式怎么推/怎么写

0 点赞评论收藏

分享

2025-08-16 18:00

门头沟学院推荐算法

我靠，怎么还考 python2 和 python3 的差异的，我直接从 python3 开始学的啊，已老实

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务