抖音大模型算法二面-校招面经

1.八股:XGBoost 如何计算特征重要性?Gini 系数在树模型中代表什么?它和信息增益的区别在哪?
2.八股:Decoder-only 模型在推理时,预测第 i+1 个 token 时,输入用的是第 i 个 token 的 one-hot 还是概率分布?为什么?
3.八股:KV Cache 的空间复杂度是多少?如何估算一个 7B 模型在 batch=1、seq_len=2048 下的显存占用?
4.八股:AdamW 和 Adam 的核心区别是什么?Adam 相比 SGD 引入了哪些优化机制?Adam 全称是什么?
5.项目:你们验证集的类别分布是否和线上一致?如何保证标注数据的高质量(比如通过交叉校验 or 专家审核)?
6.项目:在当前 RAG 架构下,如果引入 Few-shot Prompting,为什么能提升输出质量?和微调相比各自适用场景是什么?
7.项目:FAISS 是如何加速向量检索的?你用的是 IVF 还是 HNSW?索引构建时 nlist/nprobe 怎么调?
8.手撕:最长回文子串(LeetCode 5)
全部评论
你这个岗位一共几面
点赞 回复 分享
发布于 2025-12-28 23:32 北京

相关推荐

3.5一面 一、 项目1. 简单介绍一下这个系统的知识库问答架构,从文档入库到最后回答的完整链路是怎样的?2. 向量检索用的是什么索引类型?3. 在召回之后有没有做重排(Rerank)之类的操作?4. 你知识库的准确率和召回率是怎么评估的?5. Spring AI Alibaba 的 Function Calling 是怎么实现的?模型如何决定调用哪个工具?6. 如果工具调用失败了,你们设计了什么处理机制?7. Execute Plan 模式具体是怎么实现的?8. 平时哪种模型用的比较多?9. 平时编码时会用哪些模型?10. 在选择向量数据库时,有没有看过其他的(如 ES、Milvus 以外的选择)?它们之间的区别你大概有概念吗?11. 在写 Prompt的时候,你有哪些实践经验或设计原则?12. Graph Rag / Agentic Rag了解过吗13. 在秒杀下单中,Lua 脚本具体做了什么?为什么要用 Lua,而不是分开执行多条指令?14. 这个项目你自己做过压测吗?15. 对系统能扛住的流量(QPS)有没有具体的概念?16. 对于什么时候该上缓存、什么时候该上本地缓存,你大概的概念是什么二、 Java 基础1. 线程池的核心参数有哪些?2. 线程池内部的具体工作流程是怎样的?3. 核心线程数和最大线程数一般怎么确定/计算?三、 场景题1. 你觉得目前 RAG(检索增强生成)最大的瓶颈是什么?2. 假设要给电商平台搭建一个百万/千万级的商品知识库问答系统,你会怎么设计?3. 针对商品信息(如价格、描述)可能被商家动态更新的情况,你的知识库设计需要考虑什么?四、手撕:二叉树的层序遍历反问面试表现,面试官当场告知通过
查看23道真题和解析
点赞 评论 收藏
分享
评论
7
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务