阿里通义千问大模型算法凉经

1️⃣ 简单介绍一下你的实习经历吧?
2️⃣ LoRA的原理是什么,你是怎么理解的?
3️⃣ 你了解DeepSpeed吗?能说说ZeRO-1、ZeRO-2和ZeRO-3分别做了哪些优化吗?
4️⃣ Qwen的模型结构是怎么样的?和LLaMA、DeepSeek的主要区别在哪里?
5️⃣ 在实际应用中,你会怎么缓解大模型的幻觉问题?
6️⃣ 大模型的MoE结构相比于Dense结构,训练难点主要是什么?你觉得DeepSeek MoE效果好的原因有哪些?
7️⃣ FP16、BF16、FP32、INT8这些格式有什么区别?在训练和推理大模型时,一般会如何选择?
8️⃣ 可以讲一下RLHF的基本流程吗?并写一下PPO和DPO的Loss表达式。
9️⃣ 对于超长上下文,业界一般是怎么处理的?你了解Qwen是怎么做的吗?
🔟 (开放题)在你看来,目前大模型发展的上限可能在哪里?有哪些突破方向?
1️⃣1️⃣ (代码题)Leetcode 152:乘积最大子数组。
全部评论

相关推荐

04-20 14:03
已编辑
门头沟学院 Java
楼主福建人,26届秋招主攻厦门。目前投了厦门银行、两大国企(建发、象屿)和工行厦门,都在等后续消息。趁等结果的间隙,聊聊我对这几家的理解,欢迎补充。先说两大国企:建发、象屿。 都是世界500强,平台大、业务广,供应链和贸易领域很强。优势很明显:简历含金量高,跳槽认可度强,总包数字好看。但问题是,这两家都是强绩效导向,尤其贸易岗和供应链岗,压力大、加班多,内部竞争激烈,进去容易被边缘化。另外有个现实问题,国企那边背景和关系挺重要的,没资源的话晋升会比较慢。再说中国工商银行厦门分行。 国有大行,平台最稳。科技岗可以接触到核心系统,培训体系完善,跳槽认可度高。缺点是起薪不如建发,晋升看资历、熬年限,涨薪慢,技术氛围偏传统,容易把路走窄。最后说厦门银行。 很多人以为城商行工资比国企低,其实还真不一定。我打听了一下,厦门银行管培岗的薪资跟建发、象屿差不多,甚至可能更高。本质区别在于,建发、象屿那边感觉更像老牌国企讲究背景和资历,厦门银行更看重能力,靠本事吃饭。优势在于:第一,薪资不低,管培岗甚至比国企高,加上提供两年宿舍(地铁4站到公司),厦门房租你们懂的,实际到手很香;第二,总行在搞AI大模型,技术岗能学到东西。第三,总行管培轮岗机制清晰,新人成长路径更透明。劣势在于:厦门银行毕竟还是属于城商行,不知道长期发展天花板怎么样目前进度: 两大国企有的刚面完,工行在等后续通知,厦门银行AI面结束了,后续据说节奏比较快。有知道节奏的uu吗?个人倾向: 想攒大厂履历,两大国企更合适;想要最稳的平台和跳槽认可度,工行是选择;但看重实际到手+生活成本+工作成就感+能力导向的话,厦门银行性价比更高。投个票看看大家想法:A. 冲建发/象屿B. 冲工行厦门C. 选厦门银行D. 还在观望等消息
点赞 评论 收藏
分享
04-20 19:01
已编辑
武汉理工大学 Java
查看28道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务