首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不想一直0offer
2024-12-18 09:28
中国科学院大学 算法工程师
发布于俄罗斯
关注
已关注
取消关注
虾皮 NLP 一面
体验非常非常差,面试官迟到一小时,面的时候刚睡醒,kpi连演都不演了
八股
1. 大模型微调用到了什么框架
2. Lora的训练原理和使用是怎么样的?
3. llama的模型结构
4. Pre-norm和Post-norm的差别是什么
全部评论
推荐
最新
楼层
牛客993965069号
北京航空航天大学 算法工程师
面试官迟到一小时?
点赞
回复
分享
发布于 2024-12-18 10:39
河北
暂无评论,快来抢首评~
相关推荐
2025-12-06 20:15
陕西理工大学 算法工程师
26校招淘天大模型算法二面
1.介绍自己的项目2.BLEU和ROUGE3.self-attention求内积时为啥除以根号d4.LLM的评估5.介绍下simCSE6.解决tokens不够的问题应该怎么办7.详细介绍下deepspeed(三个stage结合参数回答)8.gpt和llama的区别(模型结构上的)9.PEFT的方式,LORA论文讲一下,对比p-tuning10.LLM训练的时候为什么warmup11.对比学习中的batch size是大一些好还是小一些好(大一些,甚至可以到10k+,为12.了构造好的negative样本)13.了解最新技术一般怎么通过什么渠道14.代码题:lc347 前 K 个高频元素
查看13道真题和解析
点赞
评论
收藏
分享
2025-12-01 00:10
北京大学 算法工程师
美团大模型应用秋招一面
1. 实习项目问的很细,数据构造,微调参数等2. 如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数3. LORA和全参数微调的区别4. DPO,PPO,GRPO5. 逻辑回归、XGB和神经网络的区别6. XGB怎么做特征重要性的?gini系数是什么?7. Deepseek MLA?为什么压缩?8. Transformer encoder?为什么需要FFN?9. AUC物理意义,公式,公式含义code:重排链表
查看10道真题和解析
点赞
评论
收藏
分享
2025-12-18 09:20
北京大学 算法工程师
字节大模型校招二面面经
实习介绍——5min项目相关细节提问——5min1. 了解 DeepSpeed 吗?训练时用 ZeRO 优化主要是解决啥问题?ZeRO 的三个阶段分别都是啥?2. TP 或 PP 了解吗?3. 并行训练时,如果模型参数量不大,怎么决定用 PP 还是 TP 策略?它们各自有啥好坏?4. 如果用 TP=2 的策略,self-attention 层里的 QKV 矩阵具体是怎么切分的?5. 用 TP 的时候,主要会发生哪些通信?不同的切分方式会改变通信行为吗?举个例子呗。6. 讲讲 Flash Attention 的原理,矩阵 tiling 的过程说细一点,最好把 shape 也讲清楚。手撕算法:经典接雨水+最长上升子序列
点赞
评论
收藏
分享
2025-12-18 06:25
上海交通大学 算法工程师
腾讯混元大模型二面-秋招面经
1.自我介绍,过实习和论文2.知道哪些强化学习算法,除了 PPO和 DPO 这些呢3. 知道 LoRA 的原理吗, A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗4.除了 DeepSpeed ,还用过其他的什么优化方法吗5.ZeRO -1, ZeRO -2,ZeRO -3三个模式的区别6.讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗7.当时你用 DeepSpeed ZeRO -3来微调Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存8. 在微调 Qwen 的时候,数据是怎么构造的9.代码:无重复字符的最长子串
点赞
评论
收藏
分享
2025-12-18 17:25
山东大学 算法工程师
阿里实习大模型算法一面
1. Encoder与Decoder中注意力机制存在哪些差异?2. 注意力机制的计算流程是怎样的,为何在计算时要除以根号下Dk,掩码注意力机制又是怎样达成的?3. 阐述GQA、MQA、MLA的原理分别是什么。4. 位置编码的必要性体现在哪里,为何选用sin_cos函数进行位置编码?5. 询问之前实习中Agent的设计思路,以及所提创新方法的实现方式。6. 提及使用DeepSpeed开展SFT训练,请说明DeepSpeed ZeRO Stage 1 - 3的不同之处,以及何种情况下使用FSDP更为合适。7. 询问Agent工具的设计情况,是否采用workflow形式。8. 了解哪些Agent开发框架,像langchain和LlamaIndex,它们的核心应用场景有何区别?9. 针对数据输入输出格式,为保证大模型输出稳定json格式,采取了哪些措施?10. 若Agent推理API需要低延迟响应,会从哪些方面开展系统级优化工作?11. 代码考察:给出LeetCode第34题,在排序数组中查找元素的第一个和最后一个位置
点赞
评论
收藏
分享
一键发评
面试官迟到一小时?
接好运
kpi都不演了,太离谱
大模型微调框架是什么?
Lora训练原理讲得对
评论
点赞成功,聊一聊 >
1
8
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
你会和mentor进行deeptalk吗?
3303
2
...
金丹后期牛友!我们新年再见
2249
3
...
双非本2025秋招总结:65w+SSP三选一,最终还是“有鹅选鹅”|附面试心路历程
2032
4
...
牛客运营们,我保证这是我最后一次消费烤肠了!
1791
5
...
希望新的一年,我依然是走向幸福的那个人
1761
6
...
学院本 末 211 硕勇闯 java 后端实习美团 oc 逆袭指南
1505
7
...
27届学院本一段中厂一段中大厂实习,简历求锐评
1222
8
...
分享一则小红书 说得真的很好(òωó)👍
1165
9
...
脑抽给面试官唱了一首英文歌
1159
10
...
沐潼科技实习二面面经
1006
创作者周榜
更多
正在热议
更多
#
对2025年忏悔
#
5803次浏览
113人参与
#
互联网行业现在还值得去吗
#
47949次浏览
356人参与
#
实习没人带,苟住还是跑路?
#
14287次浏览
285人参与
#
春招前还要继续实习吗?
#
6472次浏览
82人参与
#
元旦假期你打算怎么过
#
9194次浏览
182人参与
#
移动求职进展汇总
#
18742次浏览
149人参与
#
你找工作的时候用AI吗?
#
166004次浏览
865人参与
#
国企秋招,你投了吗?
#
55292次浏览
364人参与
#
面试官问过你最刁钻的问题是什么?
#
11371次浏览
110人参与
#
职场新人生存指南
#
491681次浏览
9517人参与
#
一人说一家双休的公司
#
8424次浏览
105人参与
#
大家实习都在做什么?
#
9279次浏览
101人参与
#
我们是不是被“优绩主义”绑架了?
#
9843次浏览
306人参与
#
我的AI电子员工
#
24447次浏览
155人参与
#
你觉得专业和学校哪个对薪资影响最大
#
87763次浏览
587人参与
#
非技术岗薪资爆料
#
469022次浏览
3013人参与
#
你认为哪些项目算烂大街?
#
79577次浏览
629人参与
#
新年的第一句祝福
#
51166次浏览
377人参与
#
巨人网络求职进展汇总
#
183990次浏览
1223人参与
#
领导秒批的请假话术
#
30751次浏览
121人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务