找不到实习的大摆子

2024-08-07 16:21 北京大学自然语言处理发布于江西

关注

快 STAR 大模型应用面经

一开始会以为问的很难，然后还是集中在项目，八股也比较常见，虽然问的还挺深，我没答出来很多。
1. 先写题，dp，两个字符串最长子序列
2.自我介绍
3. 挖项目挖了很久
4.peft 微调介绍一下
5. 常见的位置编码介绍一下
6.transformer 的 decoder 和 llama 有啥区别
7. 他们的位置编码有啥区别？三角函数位置编码和 ROPE 公式很像啊，他们是怎么实现不同的功能？（一个加 embedding 一个加 KQV，但是公式很像但是推理完全不一样吧，不太会答）
8. ADAM 比 SGD 优化在哪里（不会，没背这块）介绍一下梯度下降
9. 回归任务常用的 LOSS（我还搞成了自回归，然后说现在大模型都是用交叉熵。。。后面反应过来说离散分类任务交叉熵，连续值用 MSE）然后问我二分类用什么，我说 BCE。
10. 用 ADAM 的话，怎么预估 SFT 的显存占用？（这个问题好高频啊，感觉现在很喜欢问这种预估显存占用的问题。。。，我也没怎么回答，不太会）
时间太久了，就随便反问了一下。

全部评论

推荐最新楼层

Gold知难而进

深圳大学算法工程师

当作面试一样回答一下这些问题： 1. 子序列两层for循环，if s[i] == s[j]: dp[i][j] = dp[i - 1][j - 1] + 1 else : dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]) 2. xx 3.xx 4. lora, p tuning v1 v2, adapter tuning, prefix tuning. 5. 绝对，相对位置编码， Rope旋转位置编码 6. 从输入开始，一个是绝对位置编码一个是Rope编码。经过embedding层后，transformer decoder直接输入注意力层，而llama则是先经过norm，一个是Post norm一个是Pre norm,同时norm这里的区别前者为layer norm后者为Root mean square norm，对于注意力层，llama是GQA而transformer decoder是MHA，再经过FFN层，FFN层的激活函数transformer deocder是Relu,而llama没记错的话是SwiGelu，（就想到这些，不知道还有没有不同） 7. 不知怎么答 8. SGD ， w = w - lr * gradient， Adam引入了一阶动量与二阶动量（方差） 9. 交叉熵损失 10. 假设dB参数的大模型，模型与梯度半精度fp16保存，一个参数两个字节，则占用2d G + 2d G = 4d G显存，优化器如果用adam，fp32保存模型权重备份，动量与方差，则占用3 * 4 * d G = 12d G显存，对一个dB参数的大模型做full training显存占用估计在16dG。(deepspedd, 模型并行，张量并行之类的可能会继续问了）欢迎补充点评

4 回复分享

发布于 2024-08-14 14:32 广东

康冠科技金牌内推官

西安交通大学人力资源主管

这个确实强

2 回复分享

发布于 2024-08-10 10:32 江苏

游卡校园招聘部HR_主页内推

上海交通大学算法工程师

大佬真厉害

2 回复分享

发布于 2024-08-10 09:00 江苏

找不到实习的大摆子

楼主

北京大学自然语言处理

还问了 attention 公式，为什么要除以根号 dk，为什么会发生梯度消失或者梯度爆炸？（就是经常被问但是答不好）

2 回复分享

发布于 2024-08-08 01:56 江西

北京航空航天大学算法工程师

Adam结合了动量和RMSProp，可以对参数进行自适应的学习率调整，训练初期收敛更快。SGD需要手动调整学习率，在最小值平坦区域收敛变慢（摘抄自CSDN）

1 回复分享

发布于 2024-08-19 16:24 北京

中国科技大学前端工程师

参加的都是大神云集

1 回复分享

发布于 2024-08-10 16:13 江苏

西安交通大学算法工程师

周五也要面快star了

1 回复分享

发布于 2024-08-07 21:43 北京

门头沟学院算法工程师

佬很厉害了，能求个快star进面的bg么

点赞回复分享

发布于 2024-08-09 09:25 浙江

找不到实习的大摆子

楼主

北京大学自然语言处理

八股还是要好好准备，一知半解不太行，被挂了。

点赞回复分享

发布于 2024-08-08 15:27 河南

马鞍山学院算法工程师

是线上IDE还是本地呢，题目的话是会给图片还是念呢

点赞回复分享

发布于 2024-08-08 10:30 北京

2025-12-27 11:09

中南大学 Java

我的2025年终总结

早岁哪知世事艰，轻辞公考入尘龛。朝敲代码愁 bug，暮对需求叹夜阑。一念差池空怅惘，半生取舍自悲欢。此年冷暖皆沉淀，来日择路再扬帆。奔波朝夕薪薄事繁，案头常伴孤灯寒。也曾念，朱墙安稳，清茶淡饭无波澜。怎奈当时意气满，错把锋芒作暖欢。如今悟，人间百态非一端，安稳漂泊各为难。bug 缠，需求换，加班不觉星月残；心未乱，志未阑，得失皆是成长笺。不必悔，不必叹，此程风雨皆历练。来年路，缓行慢看，公考职场皆可攀。但守初心方寸地，岁岁安然岁岁安。

找工作，行业重要还是岗位...

点赞评论收藏

分享

2025-12-29 16:53

新易盛_数据系统部_数据中心系统工程师(准入职员工)

小天才内推，小天才内推码

小天才26秋招分享（三面凉经）tl：9.13投递-10.10自主约面-10.10一面-10.11上传作品集-10.14二面-10.16三面（交叉面） 一面：线上邮件通知选择具体面试时间段（大约20mins）面试官问题1. 请先做一个自我介绍（1分钟左右）。2. 简历项目追问3. 在校期间有获得哪些奖学金吗？4. 有挂过科吗？5. 学得最好的课程是哪些？6. 分享一个人力资源领域中你觉得很重要的知识点。7. 根据以上追问若干问题8. 结合实习经历，招聘的具体成果是你直接负责的社招岗位吗？9. 你的导师对你的工作评价是什么样的？10.追问11.综合实习经历，你目前更适合做人力哪个方向的工作？12....

点赞评论收藏

分享

2025-11-24 18:53

郑州轻工业大学 Java

我的简历真的很烂吗😭😭😭投了一个多月了找我的全是中科软、外企德科、科锐国际，孩子只是想找一个自研，25 双非真的这么难吗😭😭😭

J1nga：没有实习经历简历尽量缩到一页，不然太水了

投递科锐国际等公司10个岗位

点赞评论收藏

分享

2025-11-18 17:58

南昌大学辅导教师

家人们，这种简历是不是注定找不到工作😭，银行四大行全挂了，城市商业银行过了两个，但是一面全挂了，现在想找实习也找不到，真不知道能做啥工作了，能给给意见嘛

金融银行求职进展汇总

点赞评论收藏

分享

2025-12-28 15:23

清华大学机械设计/制造

机械毕业设计出现的经典场面

大家好，今天给大家分享机械毕业设计出现的经典场面。1、答辩的时候老师提问舍友为什么你的毕业设计最后修改时间是2021年，舍友答因为从大一就开始布局毕设了。2、破本科机械毕设真别找枪手。根据自己题目去网站搞个建模和图纸。再找个人花点小米让他画下机构简图和说明整体工作原理，各零件用途。然后把工作原理这些喂给ai，ai出大纲后用成大先机械设计手册、濮良贵机械设计、孙恒机械原理计算，上面都有例题给你仿写。别花冤枉钱找枪手，大部分枪手其实自己都没那本本科毕业证。3、同学3000块买的毕业设计，经过六位硕士的修改，都入不了他们导师的法眼。4、已经毕业了，当时找了抢手3000，最后牛头不对马嘴，我最后自己根...

你有哪些缓解焦虑的方法？

点赞评论收藏

分享

评论

25

73

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 对2025年忏悔 #

7632次浏览 151人参与

# AI时代，哪些岗位最容易被淘汰 #

25457次浏览 217人参与

# 实习没人带，苟住还是跑路？ #

16329次浏览 309人参与

# 秋招被确诊为…… #

279979次浏览 1587人参与

# 一人说一家双休的公司 #

11156次浏览 126人参与

# 每个月的工资都是怎么分配的？ #

81507次浏览 662人参与

# 字节出了豆包coding模型 #

8212次浏览 70人参与

# 春招前还要继续实习吗？ #

9420次浏览 109人参与

# 为了秋招你都做了哪些准备？ #

29995次浏览 527人参与

# 离家近房租贵VS离家远但房租低，怎么选 #

14217次浏览 132人参与

# 2025秋招体验点评 #

86227次浏览 715人参与

# 非技术2024笔面经 #

452313次浏览 4920人参与

# 牛友的国庆旅行碎片 #

26513次浏览 128人参与

# 我的第一个1024节 #

17128次浏览 251人参与

# 职场新人生存指南 #

492139次浏览 9518人参与

# 面试官问过你最刁钻的问题是什么？ #

13304次浏览 120人参与

# 工作后会跟朋友渐行渐远吗 #

54426次浏览 395人参与

# 毕业租房也有小确幸 #

152815次浏览 4533人参与

# 实习生如何通过转正 #

118414次浏览 1440人参与

# 求职遇到的搞笑事件 #

154593次浏览 890人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务