正实现的小目标 - 个人主页动态

发布(68)

01-30 02:20

上海交通大学算法工程师

美团大模型算法二面-校招面经

1.如何理解 dspo 这几个算法的创新？2.agentic 长文本训练时候容易 oom，你有什么好的优化吗？3.长上下文压缩有哪些方法？4.其他的全是简历和论文了5.手撕： k 个链表反转、岛屿面积6.反问环节

查看4道真题和解析

0 点赞评论收藏

01-29 10:20

上海交通大学算法工程师

腾讯混元TEG大模型三面-实习面经

1.自我介绍，挑一个觉得做的比较好的论文和实习讲一下，面试官问的比较详细，为什么选现在这种方案，为什么 work，其他方案有考虑吗2.在微调 Qwen 的时候，数据是怎么构造的，有用到什么数据清洗方法吗，数据配比是怎么做的3.讲一下 RLHF 的流程，之前有用 RLHF 做过模型对齐吗4.在做对齐的时候，为什么 SFT之后还要做 RLHF，只用 SFT 可以吗5.知道哪些强化学习算法，除了PPO和 DPO这些呢，DeepSeek用的GRPO 相比于 GPT的 PPO 做了哪些改进6.开放题:对目前大模型的发展有什么看法7.代码:零钱的两个题 322.零钱兑换518.零钱兑换 II

查看7道真题和解析

0 点赞评论收藏

01-29 03:50

上海交通大学算法工程师

字节大模型多模态算法一面

1.多模态学习中常见的融合方式有哪些？早期融合 vs 晚期融合 vs 中间融合的区别和适用场景？2.CLIP 模型的原理是什么？它是如何实现图文对齐的？损失函数怎么设计的？3.Vision Transformer (ViT) 和 CNN 在图像特征提取上的优劣对比？4.什么是对比学习（Contrastive Learning）？InfoNCE loss 的公式和作用？5.大模型训练中常用的优化器有哪些？AdamW 和 Adam 的区别是什么？6. 请详细介绍你简历中提到的多模态项目：输入是什么？模型结构？如何对齐不同模态？7. 项目中遇到的最大挑战是什么？你是如何解决模态异构性问题的？ 8. 有没有做过消融实验？哪些模块对最终性能提升最关键？9. 如果让你将该项目部署上线，你会考虑哪些工程优化点？你的模型在训练集上表现很好，但在新场景（如不同光照/语言风格）下性能下降明显，你会如何提升泛化能力？10. 【LeetCode 300】最长递增子序列（Longest Increasing Subsequence）——要求写出 O(n log n) 解法。

查看11道真题和解析

0 点赞评论收藏

01-10 09:30

上海交通大学算法工程师

小红书大模型算法实习二面

1.八股：大模型框架了解哪些，介绍下vllm原理2.八股：常用的LLM，讲解DeepSeek R1的训练流程和基本原理。3.八股：讲讲MOE架构和Dense架构差异，在训练和推理方面4.项目：介绍实习项目，项目中有没有做微调？5.项目：DPO，PPO和GRPO的区别6.项目：为什么PPO要用value baseline和GAE？它们如何让训练更稳定？7.项目：为什么GRPO在训练MOE时会出问题？原因是啥，怎么改进策略8.项目：GRPO的KL散度是什么？KL散度中超参数如何设计？9.项目：阐述大模型的幻觉现象及抑制方法。10.代码题：lc300 最长递增子序列

查看10道真题和解析

0 点赞评论收藏

01-09 01:20

上海交通大学算法工程师

字节大模型算法校招二面凉经

1、实习介绍2、讲述论文内容和细节。3、是否了解过多模态大模型，简单讲一下了解的多模态大模型。4、dpo 和sft的区别，可以先dpo后sft吗？5、如何处理reward hacking？6、dpo如果应用在第一轮对话中应该怎样做，你会如何构造这个数据集合？你认为多轮对话中，数据分布应该是什么样的？手撕hot100：二叉树的右视图

查看7道真题和解析

0 点赞评论收藏

01-08 00:25

上海交通大学算法工程师

阿里夸克算法实习面经攒人品

查看12道真题和解析

0 点赞评论收藏

01-06 20:15

上海交通大学算法工程师

查看13道真题和解析

0 点赞评论收藏

2025-12-31 17:20

上海交通大学算法工程师

小鹏校招NLP算法二面 40min

1. SFT数据的构造2. 为什么RL可以提高模型的能力3. 问答系统中如何做意图理解4. 开放题：LLM可以解决过去问答系统的哪些问题，你觉得还可以用LLM做什么新的创新5. 有其他offer吗？选offer会考虑什么？手撕算法：无反问：LLM在车机系统中的应用场景

查看6道真题和解析

0 点赞评论收藏

2025-12-30 22:15

上海交通大学算法工程师

26校招快手大模型算法二面 1h

1.八股：RoPE（旋转位置编码）是如何用绝对位置编码实现相对位置感知的？能否从数学直觉上解释？2.八股：vLLM 的核心原理是什么？它如何通过 PagedAttention 提升推理吞吐？3.八股：FlashAttention v1 和 v2 的主要改进点分别是什么？它们如何减少显存访问并加速 Attention 计算？4.八股：Qwen 在训练时采用的 “packing” 形式和“多轮对话”形式有何区别？各自对训练效率和模型能力有何影响？5.项目：你们如何增强模型的多轮对话能力？除了增加多轮 SFT 数据，还有哪些架构或训练策略上的尝试？6.项目：如果 RAG 生成需要融合多个文档（如 doc A 和 doc B）进行逻辑推理，你会怎么设计？若引入知识图谱，如何与生成模型结合？7.项目：你们的 CoT（Chain-of-Thought）训练数据是如何构造的？使用 CoT 微调后的模型，对非 CoT 类任务是否有泛化增益？8.项目：模型训练数据上线前，你们从哪些角度做质量检验？用了哪些自动化手段或人工规则？

查看8道真题和解析

0 点赞评论收藏

2025-12-28 05:10

上海交通大学算法工程师

日常实习懂车帝推荐算法一面 40min

1.先做自我介绍，挑重点项目着重说明。2.项目有具体的应用场景吗？3.视频大模型是不是提取视频中的核心信息？它一般能用在哪里？4.你想做推荐相关、大模型相关，还是推荐和大模型相结合的工作？5.你了解推荐系统吗？6.你了解机器学习和深度学习吗？7.大模型在推荐系统中一般有哪些应用或应用方向？8.大模型怎么缓解或解决推荐系统的冷启动问题？9.你了解大模型推荐的微调这个概念吗？10.微调怎么定义？它一般是针对什么模型进行的？11.推荐场景或垂域场景中，需要微调的核心原因是什么？12.Transformer 的原理能大概说一下吗？13.基于 Transformer 大模型，怎么处理用户的长行为序列？14.Transformer 注意力机制的复杂度是多少？怎么计算？15.长行为序列直接计算会有什么问题？16.稀疏注意力的具体原理是什么？17.推荐系统中怎么设计负样本？你了解随机负样本、语义负样本这些概念吗？18.大模型怎么解决用户兴趣漂移的问题？19.除了折扣因子，解决用户兴趣漂移还有其他方案吗？通过微调的方式可行吗？20.传统神经网络中，梯度消失是什么现象？怎么产生的？21.梯度消失怎么解决？22.你了解哪些激活函数？23.BN（Batch Normalization）是什么意思？24.手撕：无重复字符的最长子串

0 点赞评论收藏

2025-12-24 12:20

上海交通大学算法工程师

26校招商汤大模型算法一面

1、实习介绍，随后围绕项目问八股2、对qwen-coder大模型的了解3、Lora训练的原理，调过哪些参数，其含义，怎么设置的4、训练过程中调过哪些参数，怎么设置的，loss曲线在训练过程中如果突然上升，一定是坏的吗？如何区分是训练参数不对和学到新东西导致的loss上升？5、大模型训练的流程有哪些？文本是如何tokens化的？tokenizer的原理是什么？6、RAG的流程？在打比赛时，有哪些提高的点？RAG中召回算法的原理？为什么还需要重排？如何提高RAG召回的效果，如何对向量化模型进行微调？7、代码题1：a = [1],b=[a,a],b[0]=[0],随后b[1]=？如果不想改a的值怎么做？8、代码题2：给一个数组，求划分方式，使得左半部分的最大值-右半部分的最大值 最大。

查看8道真题和解析

0 点赞评论收藏

2025-12-24 02:20

上海交通大学算法工程师

美团用户增长算法实习一面

1.自我介绍和部门介绍+实习时长询问2.代码题3.梯度提升和梯度下降有什么区别和联系4.为什么会出现梯度消失和梯度爆炸这两个现象5.召回和排序的作用与区别6.为什么用并联的双塔模型，介绍一下DIN的注意力池化，他和Transformer的selfattention有什么区别7.在成本不超过b的条件下，发N张优惠券，预估收益是R，如何建模最大化R8.反问环节

查看7道真题和解析

0 点赞评论收藏

2025-12-23 16:15

上海交通大学算法工程师

26校招-美团大模型应用算法一面

1.八股：NLP和LLM最大的区别是什么？两者有何共同和不同之处？2.八股：激活函数有了解吗，你知道哪些LLM常用的激活函数？为什么选用它？3.八股：开源框架了解过哪些？Qwen，Deepseek的论文是否有研读过，说一下其中的创新点主要体现在哪？4.项目：介绍微调负责的工作，大模型微调最重要的是什么？5.项目：SFT+DPO训练怎么组织这部分数据的？是自己构造还是用公开数据？6.项目：看你做过LoRA微调，那你是怎么选rank值？合并adapter权重的时候有没有遇到梯度爆炸？7.项目：说下LoRA的原理，LoRA是不是只能在Linear层插？为什么不能插在LayerNorm之后？这会对训练稳定性造成什么影响8.项目：刚才提到用过QLoRA，能具体说说QLoRA是怎么降低资源成本吗？9.项目：llm推理效率，如果真的部署到在线系统里，这个效率的问题怎么解决呢10.项目：有没有尝试过模型裁剪？比如 low-rank adaptor、LoRA 融合，或者用Mamba替换部分token path？11.代码题：实现Casual mask的MHA，说下计算复杂度

查看11道真题和解析

0 点赞评论收藏

2025-12-20 07:10

上海交通大学算法工程师

阿里大模型算法二面-实习

1. Encoder与Decoder中注意力机制存在哪些差异？2. 注意力机制的计算流程是怎样的，为何在计算时要除以根号下Dk，掩码注意力机制又是怎样达成的？3. 阐述GQA、MQA、MLA的原理分别是什么。4. 位置编码的必要性体现在哪里，为何选用sin_cos函数进行位置编码？5. 询问之前实习中Agent的设计思路，以及所提创新方法的实现方式。6. 提及使用DeepSpeed开展SFT训练，请说明DeepSpeed ZeRO Stage 1 - 3的不同之处，以及何种情况下使用FSDP更为合适。7. 询问Agent工具的设计情况，是否采用workflow形式。8. 了解哪些Agent开发框架，像langchain和LlamaIndex，它们的核心应用场景有何区别？9. 针对数据输入输出格式，为保证大模型输出稳定json格式，采取了哪些措施？10. 若Agent推理API需要低延迟响应，会从哪些方面开展系统级优化工作？11. 代码考察：给出LeetCode第34题，在排序数组中查找元素的第一个和最后一个位置

0 点赞评论收藏

2025-12-18 20:50

上海交通大学算法工程师

拼多多开的比字节还高，怎么办？

本来已经打算签字节了，结果多多来了个大sp，作为双非本，真的感到太不容易了总包比字节高了将近20W，现在开始纠结了，多多给钱多，但作息也真的很紧jrm，怎么选啊？

只会一面挂：多多有竞业，要注意，而且7%公积金

校招薪资来揭秘

0 点赞评论收藏

创作者周榜

关注他的用户也关注了：