03-16 19:25 门头沟学院推荐算法

关注

网易大模型算法实习二面 1h

发点面经攒攒人品～
八股
1.写一下 attention 公式
2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗
3.transformer和传统seq2seq模型有什么区别？
4.计算attention时为什么要除以d_k，这个d_k的含义是？
5.attention计算时还有哪些scale处理？
6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？
7.解释数值上溢、下溢问题
8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt
9.讲一下SFT，会对哪部分计算loss？为什么？
10.讲一下deepspeed
11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？
12.训练模型时用了几张卡，有遇到什么异常中断问题吗？

全部评论

推荐最新楼层

03-12 15:02

广东工业大学 Java

现在投日常会不会比投暑假多点面试机会

如标题所示，已经投了好几个大厂的暑假实习，但是都没有什么回应。如果去投日常，进去了再申请转暑假实习什么的，听说日常hc和暑假hc是相互独立的主要是现在投的暑假实习都没有什么回应，有没有懂哥试过的，或者了解的腾讯，字节，阿里引流

今天你投了哪些公司？

点赞评论收藏

分享

03-16 09:48

吉林农业大学算法工程师

顺丰大模型开发一面

1、LoRA 微调的原理LoRA 的核心思想是不直接更新预训练模型里的原始大权重，而是在某些线性层旁边增加一个低秩更新分支，用低秩矩阵去近似权重增量。假设原始权重是 W∈Rd×k，全量微调时直接学习ΔW，LoRA 则把它写成：ΔW=BA其中A∈Rr×k，B∈Rd×r ,，(r) 是远小于 (d) 和 (k) 的秩。这样前向计算就变成：h=Wx+ΔWx=Wx+BAx实际里通常还会加缩放项：这样做的本质是认为很多下游任务对大模型权重的更新其实存在低秩结构，不需要真的去学习一个完整的大矩阵。LoRA 的优点是可训练参数少、显存占用低、训练快，而且原模型参数冻结，方便多任务切换和权重管理。2、LoRA...

查看11道真题和解析

点赞评论收藏

分享

03-16 17:20

门头沟学院推荐算法

米哈游大模型算法实习面经

发点面经攒攒人品～1.项目拷打2.你如何评估大模型的性能？有哪些常用的评估指标？3.请描述一下你如何对大模型进行优化，以提高其性能和效率。4.你是否有过使用或开发大模型的经验？请分享一个具体的案例。5.大模型中的注意力机制是如何工作的？它在大模型中起到了什么作用？6.大模型中的优化算法有哪些常见的选择？它们各有什么优缺点？7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题？8.在大模型设计中，如何权衡模型的复杂度和性能？9.面对大模型训练和推理所需的庞大计算资源，你有什么解决建议？10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的，训练目标是什么?13.dp0训练的损失函数和训练目标，dpo如何改进怎么理解大模型安全，包含哪些方面的内容？14.指令跟随能力的评估集有什么，如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?

查看16道真题和解析

点赞评论收藏

分享

03-15 23:51

长春吉大附中实验学校产品经理

深圳入户体检全攻略，收藏不吃亏！深圳落户体检严格吗？

作为中国的经济特区和创新之都，深圳吸引着大量的人才涌入。根据目前的规定，入户申请人需要进行体检以证明其身体健康状况符合相关标准。因此，了解最新的入户体检要求和具体流程，将有助于你更好地规划自己的落户计划，并顺利适应这座城市的生活。小编将全面解析2026年深圳入户体检的最新政策和具体流程，旨在帮助您了解深圳入户的体检要求，以及如何准备和完成相应的程序。落户深圳，目前积分入户和在职人才核准入户都要体检，医院有专属的体检套餐；留学生、应届生以及投资纳税入户不需要入户体检。根据深圳市人才引进等相关政策规定，并经市卫生和人口计划生育委员会审定，对拟引进入户人员体检项目、标准和办理程序做出指引。体检项目设...

点赞评论收藏

分享

03-16 17:04

快手_后端开发实习生(实习员工)

总时长35分钟，无手撕，感觉遇到KPI面了，唉35分钟一直在问实习，八股就问了下面的1.redis与数据库的缓存一致性2.redis的zset数据结构3.redis的两个持久化机制4.分布式cap理论5.什么时候ap，什么时候cp6.进程线程协程问怎么没手撕，说一面撕过了，业务是应用宝游戏商城，后面过了还有一面技术面，问面试表现，说挺顺的，可以再关注一下运维数据，然后问转go有难度嘛，就结束了

iiooz：别想太多了，面试官如果看不上，就不会约面了，腾讯很少所谓的kpi，有面就说明能力肯定不错，只是每个面试官筛选方式不同，二面甚至只跟你聊生活的都有，鹅还是很开放的在筛选人这一块

今天你投了哪些公司？

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

9983次浏览 91人参与

# 你的mentor是什么样的人？ #

56381次浏览 769人参与

# 春招/暑实第一面是哪家？ #

10517次浏览 140人参与

# 重来一次，你会对开始求职的自己说 #

37880次浏览 401人参与

# 跟HR说什么能被秒回？ #

4329次浏览 84人参与

# 你认为工作的意义是什么 #

264730次浏览 1522人参与

# 面试官最爱问的 AI 问题是...... #

7463次浏览 276人参与

# 你今年的保底offer是哪家 #

175988次浏览 730人参与

# 哪些瞬间让你真切感受到了工作的乐趣 #

26873次浏览 111人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

1016次浏览 52人参与

# 你收到了哪些公司的笔试？ #

9718次浏览 51人参与

# 你的嫡系AI是哪个？ #

1792次浏览 52人参与

# 现在入门AI应该走哪些方向？ #

1707次浏览 43人参与

# 你现在的工作，是“成长”还是“消耗”？ #

5684次浏览 98人参与

# 为什么国企只招应届生 #

244106次浏览 1306人参与

# 烟草笔面经互助 #

27777次浏览 202人参与

# 快手求职进展汇总 #

741750次浏览 7119人参与

# 27届实习投递记录 #

2694次浏览 62人参与

# 你怎么评价今年的春招？ #

155711次浏览 1415人参与

# 华为海思工作体验 #

44444次浏览 157人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务