03-27 16:30 门头沟学院算法工程师

关注

阶跃星辰大模型算法实习一面

整体面试还是不错的，但是没后续了，不知道是哪里出了问题
1. 如何进行混合加训
2. 混合加训和 continue sft 你觉得哪个效果好，为什么？
3. Sft loss的起点数值和收敛情况。
4. 讲解一下 rlvr 使用的策略。
5. 训练 1t 模型遇到哪些困难，跟小尺寸模型有什么不同
6. Benchmark 测评情况，如何根据 benchmark 进行模型效果优化。

手撕：top-p sampling、grpo

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于昨天 07:33 广东

03-24 18:59

东南大学 C++

拼夕夕居然约二面了

3.23pdd一面，今天居然约二面了，感觉自己答的真比较💩，搞笑的是最后面试官问了一个奇葩的问题我还没考虑周全。说是现在生育率下降，上海新出生人口大约16万，估计一下现在上海的小学数？跟他扯了半天（怀疑题目），然后给了一个不周全的回答😅

查看1道真题和解析

点赞评论收藏

分享

昨天 21:50

门头沟学院 Java

美团3.28笔试

研发卷，10道选择题 + 3道编程题，选择题基本上都是AI/大模型相关：RAG、大模型等等，最近做笔试基本上都是AI相关的了， 大家还是提前多刷刷AI的知识吧 编程题： T1. 风不吹雨 操作 1 是把  变成 ，最多用  次；操作 2 是减 ，最多用  次。每个位置每种操作最多做一次，两种可以同时做，求最小元素和。 一个比较显然的结论：如果同时做两种操作，先除后减一定不差于先减后除（因为除法会把减掉的量也砍半）。所以同时做两种操作的减少量就是 ，其中 。 然后注意到操作 2 对每个元素的减少量都是 ，跟选哪个元素无关。所以操作 2 直接贡献  的减少量。操作 1 的减少量取决于选哪些元素，贪...

点赞评论收藏

分享

03-27 11:40

门头沟学院算法工程师

蚂蚁实习大模型算法一面 1h

发点面经攒攒人品～1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集大模型相关八股提问4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少coding最小生成树

查看15道真题和解析

点赞评论收藏

分享

03-23 23:42

山东大学嵌入式软件工程师

面试官问“为什么Attention要做成多头，而不是单头就够了”怎么回答

面试里如果被问到“为什么Attention要做成多头，而不是单头就够了”，很多人会先回答一句：“因为多个头可以关注不同子空间的信息。”这个方向并没有错，因为我最一开始学算法的时候，也思考过这个问题，但那会儿搜到的也就是这些原理罢了，但问题在于，这个说法太抽象了。面试官如果继续追问一句“什么叫不同子空间？到底不同在哪”，很多人就接不下去了，反正我到毕业写完论文了都没想过这个点。要把这道题答好，其实需要先回答一个更本质的问题：如果只有一个头，究竟会出什么问题？把这个问题讲透，多头注意力的问题也就解答了。（我的回答建议在文末）一、先别急着讲多头，先看单头的瓶颈到底是什么先从单头注意力开始。假设输入序...

AI面试题目精讲

点赞评论收藏

分享

03-27 10:30

门头沟学院算法工程师

字节日常实习二面-大模型算法

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.论文拷打2.如何确定改进的方向，动机是什么3.问了一下实习做的工作，没细问4.深度学习基础知识，网络怎么初始化5.过拟合6.dropout，推理时dropout需要什么额外处理7.手撕，算sqrt()，要写两种方法，牛顿迭代和二分查找

查看6道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

19639次浏览 342人参与

# 中国电信笔试 #

31500次浏览 284人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

14737次浏览 217人参与

# 春招至今，你的战绩如何？ #

63030次浏览 572人参与

# 如果秋招能重来，我会____ #

96846次浏览 500人参与

# 一张图晒出你司的标语 #

4120次浏览 74人参与

# 厦门银行科技岗值不值得投 #

7756次浏览 186人参与

# i人适合做什么工作 #

37066次浏览 124人参与

# 我是面试官，请用一句话让我破防 #

79658次浏览 219人参与

# 金三银四，你的春招进行到哪个阶段了？ #

21906次浏览 280人参与

# 哪些公司真双非友好？ #

69467次浏览 287人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

340455次浏览 2170人参与

# AI面会问哪些问题？ #

26786次浏览 536人参与

# 找AI工作可以去哪些公司？ #

8552次浏览 217人参与

# 从事AI岗需要掌握哪些技术栈？ #

8451次浏览 283人参与

# 面试尴尬现场 #

220916次浏览 861人参与

# 五一之后，实习真的很难找吗？ #

102863次浏览 584人参与

# 你做过最难的笔试是哪家公司 #

32118次浏览 215人参与

# 应届生第一份工资要多少合适 #

20615次浏览 86人参与

# 聊聊你的职场新体验 #

336292次浏览 1894人参与

# 你小时候最想从事什么职业 #

159946次浏览 2072人参与

# 阿里笔试 #

177831次浏览 1307人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务