阿里大模型算法二面-实习面经

1. 目前多模态大语言模型是如何融合文本与图像信息的？
2. 大语言模型的RLHF训练流程是什么？它存在哪些潜在风险？
3. 什么是Embedding？词嵌入和句嵌入有何不同？
4. 大语言模型中的Tokenization是如何工作的？不同模型的分词算法有何差异？
5. 对比大语言模型的增量推理和传统推理方式，增量推理的优势和实现难点是什么？
6. 介绍一下大语言模型中的知识蒸馏，它如何用于压缩模型体积？
7. 过往项目（细节追问）
8. 大语言模型的长文本处理能力有限，目前有哪些技术可以缓解这一问题？
9. 什么是大语言模型的“上下文窗口”？扩展上下文窗口对模型性能有何影响？

全部评论

推荐最新楼层

01-30 20:56

The University of Manchester 算法工程师

字节运维工程师二面面经

📍面试公司：字节跳动🕐面试时间：2026.1.30💻面试岗位：运维工程师❓面试问题：看着简历问的，问了很多和大模型相关的问题（因为自己可能偏向大模型），比如介绍一下transformer，QKV层为什么要做根号和加一层softmax,什么是RAG，具体流程上什么？说说如何应用到具体业务上面？如何克服幻觉？面了半个小时之后手撕代码，打印螺旋矩阵，不能开辟O（mn)的空间，直接输出🙌面试感想：整体难度不是很大，但后续还是看具体双方的匹配程度，很多时候面试过或者不过，不是因为技术问题，而是双飞的匹配问题

查看7道真题和解析

点赞评论收藏

01-29 18:15

中南大学算法工程师

字节LLM大模型算法实习面经

1.项目介绍2.训练样本大概多少条3.为什么会想在重排做生成式4.如果是做生成式召回应该对模型结构怎么修改5.有考虑用别的强化学习的方法吗6.dpo 的公式是什么7. grpo 了解吗8.beamsearch 怎么做的9.大模型了解多少，强化学习了解什么10.手撕 transformer 并计算 flops 和内存开销

查看10道真题和解析

点赞评论收藏

02-11 19:54

西安交通大学 Java

360 AI应用一面面经

TCP的三次握手与四次挥手？HTTP与HTTPS的区别？HTTP状态码？介绍一下Transformer架构的基本原理？Tranformer的Decoder与Encoder的区别？为什么现在大模型的发展更注重于Decoder？注意力机制的几个参数Q，K，V的含义以及公式？什么是检索增强生成技术（RAG）？开发Agent时工具流是怎么构建的？Java的集合介绍一下？ArrayList和LinkedList的区别？算法题：如何判断单向链表有环？

查看12道真题和解析

点赞评论收藏

02-04 22:25

上海交通大学算法工程师

同花顺金融大模型算法一面面经

1. 项目和八股1.RAG如何做rerank的2.LoRA参数计算 比如给你一个7B的模型  在优化器这块如何分配3.了解强化学习的什么算法   强化学习最新的po算法4.grpo如果对于这个数据 训练出来的一组score都是0或者1  这时候应该怎么办5.agent的几大部分6.agentic rl7.gui agent   code agent8.了解软件工程相关的吗  AI for se2.无手撕3.反问业务，做的 金融领域 agent 方向，偏开发

查看8道真题和解析

点赞评论收藏

02-06 15:53

已编辑

快手_MLOps(实习员工)

写给工程同学的大模型初体验

背景概述：为什么要写这个呢？虽然现在大模型很火，但对于我们工程同学来说，把大模型当一个黑盒用就好了。一开始我也是这么认为的。直到我在小红书做到了一个需求在小红书的时候有一个需求是优化组内一个 agent 项目的响应和结果优化，这个 agent 是一个复杂的商业助手，并不是说技术很难，但要分析的广告业务很复杂，有上千个指标，好几种场景，prompt非常长，如果输出的效果不好，是没有人愿意用的。用了很多优化手段，比如并发查数据等等。有一天这个项目的正职同学和我说，他和算法那边的同学交流，说可以把我们动态拼到 System prompt 的指标数据拼到用户的 query 里面，这样就可以利用模型的 ...

八股战士0offer：虽然但是，你想表达的应该是学习如何agent工程里的提示词工程，而不是训练或者微调模型，这基本上是两个不同的方向。我认为学习agent主要就两个东西：提示词工程和上下文工程。像你说的prompt caching这种优化怎么能想到，建议多读大模型供应商尤其是anthropic的博客，anthropic大概一年前就有很详细的博客讲最佳实践和实现了