大模型再爱我一次

2025-08-25 20:14 门头沟学院算法工程师发布于甘肃

关注

字节大模型一面

📍面试公司：抖音
💻面试岗位：大模型算法
❓面试问题：
1. 拷打实习，问了很多很详细的数据和做强化学习的motivation
2. 八股拷打（好久没看基础机器学习了都忘了）
介绍一下优化器的发展
现在大模型的优化器是什么
ln和bn的区别
encoder-only和decoder-only区别以及应用场景
qkv具体是什么
为什么是多头注意力
上下文长度是什么，有什么作用
lora和全参区别
欠拟合和过拟合具体要怎么办
3. 手撕一个复杂度o(1)的插入删除和随机等概率返回（最近怎么遇不到hot100了）
🙌面试感想：
面试官人很好业务也很好玩，可惜了我手撕写了好久好久还磕磕巴巴
#面试问题记录##秋招笔面试记录##字节##算法##算法岗面试#

全部评论

推荐最新楼层

大模型再爱我一次

楼主

门头沟学院算法工程师

还有一点很奇怪的，问了两个开放性问题，1.人生中目前遭遇的最大的挫折，2.为面试刻意做了哪些准备（暴露了我lc菜狗的事实）

1 回复分享

发布于 2025-08-26 09:43 甘肃

火龙果不要槐花

门头沟学院 Python

楼主有啥推荐的大模型八股可以看吗，最近感觉东西很乱很散

点赞回复分享

发布于 2025-09-13 22:07 陕西

同济大学算法工程师

学到，感谢楼主分享

点赞回复分享

发布于 2025-08-27 11:05 北京

03-17 23:31

快手_后端开发

互联网大厂投递汇总（广州篇）

前言我的速成找实习/春招的经验帖子：链接我的学习后端和agent2手抓的专栏：链接第一梯队（互联网大厂）腾讯（微信总部）（天河）：微信/腾讯云广州研发中心网易（总部）（天河）：游戏 + 音乐 + 严选阿里巴巴（华南总部）（天河/海珠）：阿里云、电商字节跳动（分部）（天河/海珠）：抖音电商、研发中心百度Apollo（研发中心）（黄埔）：自动驾驶 + 智能交通京东（华南总部）（黄埔）：电商科技 + 供应链物流华为（研发中心）（白云）：5G通信 + ICT + 云计算第二梯队（细分领域）小鹏汽车（总部）（天河/番禺）：智能汽车研发 + 制造唯品会（总部）（天河/海珠/荔湾）：电商特卖 + 供应链欢聚...

暑期实习什么时候投？

点赞评论收藏

分享

03-10 17:45

门头沟学院推荐算法

字节实习大模型应用开发一面 90min

继续来分享下之前的面经~欢迎友好讨论，信息共享1.了解DeepSeek-R1吗?介绍一下?2.R1的MLA是如何实现KV-Cache的节约?3.R1在SFT时冷启动的目的?4.位置编码是什么?解释ROPE?5.一个14B的模型，推理和训练要多少显存?6.显存的占用和哪些因素相关?7.大模型灾难性遗忘是什么?如何解决?8.BF16、 FP16、FP32对比。9.Adam, AdamW原理。10.deepspeed的三个阶段。

点赞评论收藏

分享

03-21 05:50

上海交通大学算法工程师

字节大模型应用开发实习一面 1h

给我面没招了，发点面经攒攒人品～1.实习拷打2.拷打第一个项目3.拷打第二个项目4.在RAG中，递归字符切片相比固定长度切片优势在哪？5.如果要实现只在特定分类的文档中进行检索，在Milvus中是使用多个Collection效率高，还是使用分区效率高？6.什么是Agent的反思机制，对于你的心理咨询Agent，有没有让模型在回答前先检查一遍自己的语气是否专业？7.工业图纸识别如果大模型出现了幻觉，你在Prompt层面或后处理层面有什么方法？8.介绍一下Function Call原理，模型生成的JSON如何通过逻辑触发表层代码执行并返回给模型？9.vLLM的PagedAttention原理？10.在使用FastAPI开发大模型接口时，中间件和依赖注入分别适合处理什么样的业务逻辑？11.Python的multiprocessing和threading你会如何结合使用来提高整体吞吐量？12.asyncio.gather和asyncio.as_completed在并发请求多个模型接口时有什么区别？如果其中一个接口超时，如何做降级？13.如果用户的Prompt特别长，导致上下文窗口溢出，除了截断，你有哪些简化上下文的策略？14.了解目前主流的MultiAgent框架吗？如果将你的心理咨询Agent拆分，你认为状态同步的难点在哪？15.谈谈对A2A通信的理解。在A2A场景下，如何防止两个Agent陷入递归对话？16.手撕：实现LRU缓存机制，有时间复杂度要求

查看15道真题和解析

点赞评论收藏

分享

03-21 04:30

门头沟学院 Java

字节大模型应用开发二面日常实习

发点面经攒攒人品～1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？16.针对大规模PDF解析这种任务，你选择多线程还是多进程？17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？19.手撕：第k大元素

查看19道真题和解析

点赞评论收藏

分享

03-19 20:20

门头沟学院推荐算法

字节大模型应用开发日常实习一面

继续来分享下之前的面经~欢迎友好讨论，信息共享1.项目拷打2.R1的MLA是如何实现KV-Cache的节约?3.R1在SFT时冷启动的目的?4.位置编码是什么?解释ROPE?5.一个14B的模型，推理和训练要多少显存?6.显存的占用和哪些因素相关?7.大模型灾难性遗忘是什么?如何解决?8.BF16、 FP16、FP32对比。9.Adam, AdamW原理。

查看9道真题和解析

点赞评论收藏

分享

评论

5

21

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

74352次浏览 594人参与

# 你是怎么和mt相处的？ #

102122次浏览 499人参与

# 华泰星战营，提前锁定校招offer #

13865次浏览 390人参与

# 打工人的工作餐日常 #

96180次浏览 553人参与

# 拼多多集团-PDD笔试 #

87095次浏览 594人参与

# 网易游戏雷火笔试 #

11615次浏览 108人参与

# 26届秋招投递记录 #

123540次浏览 683人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

5181次浏览 21人参与

# 毕业论文怎么查AI率 #

85456次浏览 1963人参与

# 网易笔试 #

171740次浏览 812人参与

# 简历上如何体现你的“AI”能力？ #

17767次浏览 383人参与

# 找不到大厂实习可以去小厂吗？ #

23566次浏览 279人参与

# 你总挂在第__面？ #

12746次浏览 151人参与

# 哪些AI项目值得做？ #

27730次浏览 664人参与

# 如何准备秋招 #

81909次浏览 871人参与

# 0offer互助地 #

770469次浏览 4728人参与

# 实习时最怕听到的一句话 #

24607次浏览 226人参与

# 多益网络工作体验 #

70150次浏览 312人参与

# 没有面试的日子里，你在做什么 #

15256次浏览 389人参与

# 秋招被挂春招仍然能投的公司 #

31811次浏览 241人参与

# 秋招开始捡漏了吗 #

244608次浏览 1058人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务