减肥口号喊得比谁都响 - 个人主页动态 - 牛客网

03-30 20:55

门头沟学院推荐算法

快手搜推算法面经分享 80min

攒人品中，祝大家都能拿到满意的Offer！1.针对“正负样本不均衡”的问题，做了哪些具体的动作或策略？2.精排模型的整体结构是怎么做的？能否详细展开？3.为什么选择用 DIN 建模兴趣序列？4.你提到了使用 MMR算法，还能写出/说出它的具体公式吗？5.你考虑过（或了解过）什么打散逻辑或算法吗？（回答了 DPP 算法）。6.上线后 PCTR 提升，但是 IPV下降，你认为可能的原因是什么？7.请解释一下 AUC、GAUC等指标之间的区别，以及它们各自适用的业务场景是什么？8.你的过往经历偏向传统搜推模型，目前对大模型（LLM）在搜推中的应用是否有了解？9.是否有实际动手跑过或做过大模型结合推荐系统的相关实验或项目？10.手撕:数组中最小k个数

查看10道真题和解析

0 点赞评论收藏

分享

03-23 08:45

门头沟学院推荐算法

大模型算法实习二面-美团 40min

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.实习介绍2.介绍第一个项目3.整个系统的延迟大概是多少4.rag数据库存储的具体的内容是什么5.你在这个项目里主要做了什么，能具体讲讲吗6.无算法题

查看5道真题和解析

0 点赞评论收藏

分享

03-18 13:40

门头沟学院推荐算法

快手大模型应用一面实习面经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题项目1. 简单介绍一下这个系统的知识库问答架构，从文档入库到最后回答的完整链路是怎样的？2. 向量检索用的是什么索引类型？3. 在召回之后有没有做重排（Rerank）之类的操作？4. 你知识库的准确率和召回率是怎么评估的？5. Spring AI Alibaba 的 Function Calling 是怎么实现的？模型如何决定调用哪个工具？6. 如果工具调用失败了，你们设计了什么处理机制？7. Execute Plan 模式具体是怎么实现的？8. 平时哪种模型用的比较多？9. 平时编码时会用哪些模型？10. 在选择向量数据库时，有没有看过其他的（如 ES、Milvus 以外的选择）？它们之间的区别你大概有概念吗？11. 在写 Prompt的时候，你有哪些实践经验或设计原则？12. Graph Rag / Agentic Rag了解过吗13. 在秒杀下单中，Lua 脚本具体做了什么？为什么要用 Lua，而不是分开执行多条指令？14. 这个项目你自己做过压测吗？15. 对系统能扛住的流量（QPS）有没有具体的概念？16. 对于什么时候该上缓存、什么时候该上本地缓存，你大概的概念是什么Java 基础1. 线程池的核心参数有哪些？2. 线程池内部的具体工作流程是怎样的？3. 核心线程数和最大线程数一般怎么确定/计算？场景题1. 你觉得目前 RAG（检索增强生成）最大的瓶颈是什么？2. 假设要给电商平台搭建一个百万/千万级的商品知识库问答系统，你会怎么设计？3. 针对商品信息（如价格、描述）可能被商家动态更新的情况，你的知识库设计需要考虑什么？手撕：二叉树的层序遍历

查看23道真题和解析

0 点赞评论收藏

分享

03-14 22:30

门头沟学院推荐算法

小红书nlp算法实习一面 45min

攒人品中，祝大家都能拿到满意的Offer！1. 实习介绍2. 项目拷打3. 八股：LoRA原理深拷贝和浅拷贝Linux命令4. 手撕：softmaxself attention

查看7道真题和解析

0 点赞评论收藏

分享

03-10 20:45

门头沟学院推荐算法

米哈游llm算法实习面经狠狠被拷打

被横向挂了，希望发出来对大家有帮助！1* 简单概述你简历中的两个项目，包括项目背景以及你的具体分工，是独立完成还是团队协作2* 项目的数据来源是什么？你是如何确定优化目标的？3* 比如数据从 100 条扩充到 1.2 万条，是否全通过自动化生成？生成的样本具体是什么样的？举个例子说明一下生成前后的对比4* 怎么保证自动化生成数据的正确性呢5* 在通过调整参数直到模型回答正确为止的过程中，是否意味着生成的CoT中存在错误逻辑？6* 经过数据清洗后，最终用于SFT的有效数据量是多少？7* 在做微调时，除了 LoRA 是否对比过其他的微调算法8* 你是如何评价微调效果的？测试集的比例是多少？微调前后的准确率分别是多少？原有的模型性能保留了多少？9* LLM常用的结构是什么？10* 说一下Transformer 的整体结构11* 目前主流大模型最常用的位置编码是什么？。12* 写一下多头注意力机制的数学公式。13* 公式中为什么要除以 \sqrt{d_k}？其对梯度消失或梯度爆炸有什么影响？14* 在 Transformer 的 Encoder 和 Decoder 中，哪些部分是可以并行计算的，哪些不可以？15* 除了 LoRA，你还了解哪些微调方法？16* 大模型训练通常使用什么损失函数17* 在机器学习基础中，二分类问题、多分类问题以及回归问题分别使用什么损失函数？18* 你了解哪些优化算法19* 模型训练中出现过拟合的常用解决方案有哪些？20* Dropout 在训练阶段和预测阶段的处理方式是否一致？为什么要这样做？21* 大模型中的“复读机问题重复生成是什么原因导致的？如何从解码策略或训练层面解决？22* 幻觉问题产生的原因是什么？目前常用的工程解决方案有哪些？23* 写出逻辑回归的数学公式。

0 点赞评论收藏

分享

03-07 01:25

门头沟学院推荐算法

腾讯LLM算法实习一面攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享1.实习中做过哪些项目或研究？你个人负责的部分是什么？2.你做的上下文扩展具体是怎么做的，原理是什么？3.相关长文本是怎么做几阶段训练的？4.Deepseek、Llama的长文本扩展方案是什么？为什么选择当前方案而非其他？5.若要将模型训练到1000K的上下文长度，该从哪些方面实现，其中的难点是什么？6.32B模型训练用了多少显卡？7.若将上下文扩展到1000K，该如何估算训练的算力用量？8.上下文扩展到1000K后，训练时显存会在哪些地方暴涨？9.用GRPO做后训练的过程中，遇到的典型或较难的问题是什么？10.针对上述问题，训练Skill的具体方式是什么？11.从算法设计角度，该如何解决模型无效调用工具、工具调用参数失败的问题？12.增量预训练中的增量具体指什么？13.增量预训练使用了多少数据，又该如何评估训练效果？14.系统介绍一下自动化评分的背景、所用手段、解决的问题以及达到的效果。15.在模型迭代优化中，什么样的数据能进入数据闭环，筛选标准是什么？16.模型工具调用的准确率是如何计算的？17.分析PPO算法各部分在流程中的位置以及具体计算方式。18.抛开实际应用场景，PPO算法的损失包含哪几部分？19.在实际流程中，PPO算法的相对优势是怎么计算的？

0 点赞评论收藏

分享

2025-11-19 17:37

门头沟学院推荐算法

招商永隆银行的操作真是令人大开眼界！

金融市场部主管为首席交易员周某大开绿灯：一年批出24天带薪病假，且无需病假证明，方便其在香港与内地之间频繁往来，据传其同时与四名女性保持关系，最小一位刚满成年（周某本人37岁）。更令人心寒的是，周某前妻在生育女儿后不久即遭遇其行为，经多次协商，周某仅同意每月支付3000元抚养费。而在职业层面，该员工在无突出业绩、未通过个人考核的情况下，连续两年被部门主管授予最高绩效评级、全额奖金并晋升加薪。事件曝光后，部门主管仍坚持不予开除、不上报总行，反而多方隐瞒。令人不禁怀疑：是否长期以来存在某些不便亲自经手的操作，需借周某之手完成？此外，周某在2022年加入招商永隆之前，长期于交通银行担任销售岗位，并无交易相关经验。他是如何一跃成为首席交易员的？当时的招决策又是基于何种考量？建议重点关注周某与其直属领导名下所有银行资金往来记录。

0 点赞评论收藏

分享

2025-10-29 06:57

门头沟学院推荐算法

百度大模型数据平台二面面经

手撕：实现一个微信红包，入参是金额和红包数量，出参是一个数组，代表每个红包的数量（刚开始说不让用random，没有思路，后面说可以用） ---->追问，如果有个红包的最小金额分配之后为0怎么办Https加密握手的过程接问题2，为什么这么做？InnoDB和ISA。。。(比较古老的版本)有什么区别用一个固定长度的字符串做索引会有什么问题吗场景题，一个Location数据结构，1亿数据，怎么用1G内存存储（思考半天后答了编码+前缀树）实习和项目相关内容（问到消息队列怎么保证消息发送的事务性；binlog同步延迟会有什么问题，怎么优化；用到什么设计原则和模式；怎么理解DDD）

0 点赞评论收藏

分享

2025-10-17 21:30

门头沟学院推荐算法

字节大模型应用二面

八股： 1，ffn层的作用2，norm层的变体(位置变化pre and post & 算法变化ln and rmsnorm)3，ffn的激活函数，SwiGlu的公式写题*2，约15min：1 计算sqrt(float)2 计算m^n，m为float，n为正整数，不考虑溢出写完题又问八股：1. q,k,v都有啥用，q变得和k一样行不行2. ffn的两层mlp先升维再降维，升到多少(4*hidden_size)？为啥？3. kvcache介绍一下，使用了kvcache之后时间复杂度能降低多少？

查看8道真题和解析

0 点赞评论收藏

分享

2025-10-09 23:00

门头沟学院推荐算法

B站广告算法面经

GPT使用：科研 代码 论文等场景下怎么使用GPT？？八股：假设空间relu激活函数-缺点 改进 导数突变点会导致什么问题训练集验证集作用，训练集测试集划分需要注意哪些点时间序列的训练集怎么划分实习：业务背景ecpm的计算为什么不选择双og或深og为什么引入的参数能缓解模型预估震荡的问题，预估不准的机制问题可以怎么解决，或通过其他环节补偿？双目标单目标效果如何对比，在样本量级较少的情况下如何分析验证手撕：循环链表

查看11道真题和解析

0 点赞评论收藏

分享

2025-08-28 20:10

门头沟学院推荐算法

阿里云笔试

构造题，题目短短的，难度大大的

0 点赞评论收藏

分享

2025-08-25 20:10

门头沟学院推荐算法

京东推荐算法一面

1. 看你简历上有两段搜广推相关的实习，能挑一段重点讲讲吗？2. 我们来聊聊Transformer吧。Self-Attention机制具体是怎么实现的？3. 在Self-Attention的计算公式里，为什么要除以一个根号d_k？4. AUC这个指标，具体是怎么计算的？5. 你之后比较想做什么样的业务方向？搜广推还会继续考虑吗？6. 来做个题吧：反转字符串。

查看6道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务