现在卷度27无论文还能allin大模型/大模型应用吗

投票
rt 末9本cs技术栈java 港三新二水硕在读 27毕业
本科毕设擦边大模型 实习算法相关目前只有1段高校算法ra 
明年2~5月跟暑期应该能再分别实习一段

现在这个ra有论文在做 但完全不知道时间够不够发出来 
担心论文挂0秋招也会挂0 想问问鼠鼠还能大胆allin吗😭

java太卷了八股项目准备得也不好,基本也算从零开始
虽然大家都说大模型应用好进点,但感觉实际上岗位也不多 大多都是面向科班纯正顶会算法爷红薯牛客各种软件看得特别怕挂零,路过有无劝进劝退
#我的秋招日记##邪修秋招思路##你觉得今年秋招难吗#
全部评论
投票的佬有没有愿意给讲讲理由的 感恩感谢
点赞 回复 分享
发布于 昨天 13:41 北京
dd
点赞 回复 分享
发布于 昨天 12:43 北京

相关推荐

一面(1.5h)1.自我介绍,过实习,讲论文,根据表述实时跟进询问交流2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处4.有没有全量微调过5.推导一下神经网络反向传播的过程6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式7.一道排列组合的概率题8.平常有用过 RLHF 吗,简单介绍一下9. 开放题:对目前大模型的发展有什么看法10.代码:多头自注意力二面(1h)1.自我介绍,过实习和论文2.知道哪些强化学习算法,除了 PPO和 DPO 这些呢3. 知道 LoRA 的原理吗, A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗4.除了 DeepSpeed ,还用过其他的什么优化方法吗5.ZeRO -1, ZeRO -2,ZeRO -3三个模式的区别6.讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗7.当时你用 DeepSpeed ZeRO -3来微调Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存8. 在微调 Qwen 的时候,数据是怎么构造的9.代码:无重复字符的最长子串📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看19道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务