网络冲浪十级选手兼潜水冠军

03-07 06:15 门头沟学院机器学习

关注

大模型实习面经-腾讯

发一下问题给大家参考，攒攒人品！
1.实习介绍
2.在微调大模型时使用过哪些框架
3.CLIP模型的zero-shot能力是如何实现的？
4.Transformer中Pre-Norm和Post-Norm的设计差异是什么？对模型训练稳定性和性能有何影响？
5.在生成式大模型（如LLaMA、GPT）中，为何通常采用Decoder-only架构而非Encoder-Decoder结构？
6.请描述大模型中自然语言理解模块的具体实现方案，包括语义解析和意图识别的关键技术。
7.针对Transformer模型推理过程，会采用哪些优化手段
8.请阐述检索增强生成（RAG）的核心原理，并说明如何通过RAG缓解大模型的幻觉问题。
9.vLLM框架的核心优化原理是什么？其在动态批处理和显存管理上有哪些创新设计？
10请对比RLHF、PPO、DPO算法的技术差异、优缺点及适用场景

全部评论

推荐最新楼层

想中彩票的你求求offer

电子科技大学 Java

是有多模态的项目吗

点赞回复分享

发布于 03-11 12:10 四川

华东师范大学算法工程师

没考算法题嘛老哥

点赞回复分享

发布于 03-09 20:55 上海

03-13 12:53

西北工业大学 Java

滴滴一面面经

2026年03月13日 滴滴-网约车平台全程40分钟一、项目与实习经历索引与效率平衡：在将数据存入 ES（Elasticsearch）时，是如何平衡索引力度和查询效率的？有没有做冷热分离等策略？Agent交互模式：堆栈分析到代码定位的链路中，与大模型的调用是单轮还是多轮（Auto-agent）？为什么这么选择？Prompt设计：你的 Prompt 是怎么设计的？准确率评估：诊断 Agent 的准确率是如何评估的？有没有办法将这个验证流程也自动化？幻觉与长文本问题：有没有遇到过大模型产生幻觉（定位错误代码）的情况？如果遇到文件过长超过上下文窗口限制，你会怎么解决？二、场景设计题（司机智能接单助手...

查看18道真题和解析

点赞评论收藏

分享

03-10 08:30

门头沟学院人工智能

腾讯实习大模型算法一面面经

给我面没招了，发点面经攒攒人品～1.介绍一下你的实习经历和主要工作内容。2.在微调大模型时，你使用过哪些框架？它们的优缺点分别是什么？3.CLIP 模型的 zero-shot 能力是如何实现的？它在多模态任务中的应用有哪些优势？4.Transformer 中 Pre-Norm 和 Post-Norm 的设计差异是什么？对模型训练稳定性和性能有何影响？5.在生成式大模型中，为何通常采用 Decoder-only 架构而非 Encoder-Decoder 结构？6.请描述大模型中自然语言理解模块的具体实现方案，包括语义解析和意图识别的关键技术。7.针对 Transformer 模型推理过程，你会采用哪些优化手段？8.请阐述RAG的核心原理，并说明如何通过 RAG 缓解大模型的幻觉问题。9.vLLM 框架的核心优化原理是什么？其在动态批处理和显存管理上有哪些创新设计？10.请对比 RLHF、PPO、DPO 算法的技术差异、优缺点及适用场景。

查看10道真题和解析

点赞评论收藏

分享

03-24 16:10

中国科学技术大学算法工程师

腾讯 IEG 大模型日常实习一面

### 自我介绍### 选一个项目重点做介绍，介绍一下你在项目中的工作，遇到的问题以及解决的思路### 讲一下有哪些不同类别的微调### 怎么计算模型训练和推理的时候的显存占用比如14B的模型需要多少显存推理和训练### 怎么判断奖励函数设置的合理不合理？### 过拟合和欠拟合讲一下 怎么排查，有哪些缓解的方法### 怎么让模型输入长度能够做到很长### 模型部署之后，服务的过程中，如果显存爆了要怎么优化### 图像的特征提取讲3个方法### 主流的多模态大模型接触过吗，有哪些### 怎么训练一个多模态大模型### 你用过的多模态大模型 比如视频生成，一般来说有哪些任务？ 你觉得他们在这些任务上的表现存在什么问题？### 如果让你从0设计一个agent，应该有哪些模块### C++ static const的区别### Java 字节码知道吗? 有什么用 有什么优势劣势### 堆是怎么实现的### 单链表怎么找中间节点### TCP IP的握手协议讲一下### linux系统如果现在很卡，怎么排查，用哪些命令### 算法题：给定一个数组，可以在每个数前面添加正负号，目标是target，问有多少种方案。写完后问怎么优化。

点赞评论收藏

分享

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

03-23 16:29

门头沟学院算法工程师

字节大模型算法二面寄

Timeline3.12  投↓3.17  一面↓3.18 约二面↓3.20 二面（寄）一面代码题：合并两个有序数组二面代码题：反转链表被拒原因：岗位匹配度不够

查看2道真题和解析

点赞评论收藏

分享

评论

1

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 烂工作和没工作哪个更痛苦？ #

9288次浏览 171人参与

# 携程工作体验 #

26937次浏览 95人参与

# 厦门银行科技岗值不值得投 #

17486次浏览 413人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

3722次浏览 57人参与

# 春招至今，你收到几个面试了？ #

22409次浏览 341人参与

# AI替代不了什么？ #

7625次浏览 105人参与

# 面试体验最好和最差的公司 #

10295次浏览 68人参与

# Tplink求职进展汇总 #

213928次浏览 962人参与

# 一人分享一个skill #

1692次浏览 46人参与

# 学历VS实习，哪个更重要？ #

20995次浏览 274人参与

# 现在入门AI首先要做什么？ #

2048次浏览 54人参与

# 我是XXX，请攻击我最薄弱的地方 #

69891次浏览 446人参与

# Agent面试会问什么？ #

6976次浏览 167人参与

# 实习心态崩了 #

111869次浏览 576人参与

# 技术转行的心路历程 #

92051次浏览 782人参与

# 一人分享一道面试手撕题 #

117917次浏览 3069人参与

# 今年秋招哪家公司给的薪资最良心？ #

463795次浏览 2547人参与

# 运营商笔面经互助 #

210716次浏览 1823人参与

# 2023届毁约公司名单 #

253440次浏览 1074人参与

# 牛油的搬砖plog #

191035次浏览 1286人参与

# 实习生如何通过转正 #

135126次浏览 1483人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务