首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
小森学AI
03-03 20:19
南京大学 算法工程师
发布于江苏
关注
已关注
取消关注
大模型面经 - 通义实验室
#算法#
#面经#
#春招#
#互联网大厂#
#大模型#
面试经验分享
文章被收录于专栏
大厂大模型面试经验分享
提示
全部评论
推荐
最新
楼层
Dr_Agon
中国科学技术大学 Python
佬能推一下通义认识的hr么
,有事情想问
点赞
回复
分享
发布于 03-28 09:55
江苏
投降输一半😋
南京大学 算法工程师
佬最后去哪里了哇
点赞
回复
分享
发布于 03-05 13:25
广东
牛客893265314号
同济大学 Java
佬 transformer encoder代码题是什么呀,要怎么写呀
点赞
回复
分享
发布于 03-04 21:12
香港
能赶紧毕业找个班上吗
门头沟学院 深度学习
佬太强了,想问下通义进度推进吗
点赞
回复
分享
发布于 03-04 16:31
北京
slulu
门头沟学院 移动通讯工程师
佬,什么时候面的啊,我投了之后一直还没消息
点赞
回复
分享
发布于 03-04 12:31
天津
skiwind
同济大学 算法工程师
顶,nju✌🏻
点赞
回复
分享
发布于 03-04 00:57
上海
暂无评论,快来抢首评~
相关推荐
05-15 12:49
已编辑
上海华东师范大学 算法工程师
蚂蚁 网银 NLP算法面经
4.21 投简历4.23 约后天一面4.25 一面无手撕,上来先拷打论文,其中有个地方用了rag,面试官问我这里是怎么把文本转换成向量储存的。(我以为是问我工程上的实现,这是去年做的一个小模块,回忆了半天细节,答得支支吾吾,面完了之后结合下一个问我才意识到其实是问我embedding过程)看我支支吾吾就直接问transformer是怎么把token处理成向量的。transformer的self-attention和cross self-attention区别在哪里。pre-norm和post-norm的区别?进一步,为什么现在主流大模型都用post-norm。lora的实现过程。大模型用的Lo...
查看10道真题和解析
实习进度记录
点赞
评论
收藏
分享
05-28 16:51
西京学院 Java
杭州某agent初创面经
1.讲一下项目结构,怎么分层的2.交互流程的核心数据结构讲一下3.用的哪家大模型api?如何考虑的?4.为什么自己写消息队列组件?5.你说轻量化,跟谁对比呢?为什么他们比较重?你做了什么让他轻量化的?6.怎么考虑数据库表的设计的?7.项目为什么使用ddd?8.为什么用mongodb持久化不用mysql?9.讲一讲mongodb存储机制?10.看见你git记录里核心模块有重构,原方案和新方案分别是什么?为什么要重构?11.算法怎么样?(回答算法能力不好,面试官直接说不好就不给你出算法了)12.看一下你云服务器呢?怎么部署的服务的?有考虑被攻击的问题吗?
查看11道真题和解析
点赞
评论
收藏
分享
05-06 14:15
中南林业科技大学 机器学习
面试官: 为什么大模型的损失函数采用交叉熵而不是 MSE? 这个回答神了!
点赞
评论
收藏
分享
05-30 16:03
门头沟学院 算法工程师
B站大模型一面
📍面试公司:B站💻面试岗位:大模型❓面试问题:手撕多头注意力机制,然后问了为什么除以dk,除了注意力,transformer还有什么,batch norm和layer norm的区别,非线性是谁提供的对比学习的loss聊了很久的论文,具体都有什么场景dpo和ppo的区别,包括理论上,还有项目实际落地闲聊+反问🙌面试感想:体验良好,整体氛围很轻松
哔哩哔哩一面137人在聊
查看8道真题和解析
面试问题记录
点赞
评论
收藏
分享
05-28 20:13
中山大学 算法工程师
强度拉满:网易大模型算法岗
1️⃣一面时间:9.12 时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14 时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。
查看17道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
3
41
分享
评论
提到的真题
返回内容
招聘动态
查看更多
华泰证券Fintech星战营
奇安信—菁英计划(26届)
网安一哥可转正实习专场招聘
全站热榜
更多
1
...
同学们,后端开发其实没你想的那么难
3.6W
2
...
分享一下年底被广州某游戏公司裁员的经历
2.7W
腾讯暑期补捞中
热聊中
3
...
挚文集团-陌陌笔试20250606
2.2W
4
...
研一快手后端开发,一周速通,附一二面面经
1.4W
TP-LINK开奖
热聊中
5
...
被BOSS直聘某公司老板骂!惊现素质天花板!
1.2W
6
...
金山办公测试春招一面_珠海
9218
7
...
牛友们是选爱情还是选前途?
9163
8
...
我是今年的高考生
9064
9
...
26学院本游戏客户端鼠鼠求职碎碎念+总结
9037
10
...
在携程实习后,我的想法更加坚定了
8686
创作者周榜
更多
正在热议
更多
#
我的实习收获
#
30479次浏览
500人参与
#
如果有时光机,你最想去到哪个年纪?
#
47123次浏览
800人参与
#
实习吐槽大会
#
32354次浏览
156人参与
#
非技术岗简历怎么写
#
209771次浏览
2861人参与
#
晒一晒你的工位
#
85795次浏览
304人参与
#
26届秋招投递记录
#
3815次浏览
106人参与
#
2025牛客秋招季
#
4240次浏览
131人参与
#
双非能在秋招上岸吗?
#
215190次浏览
1142人参与
#
被AI治愈的瞬间
#
52323次浏览
597人参与
#
怎么防止在试用期被辞退
#
122333次浏览
911人参与
#
我的租房踩坑经历
#
27865次浏览
284人参与
#
穿越回高考你还会选现在的专业吗
#
21765次浏览
266人参与
#
我和mentor的爱恨情仇
#
43644次浏览
278人参与
#
打工人的工作餐日常
#
40440次浏览
343人参与
#
软开人,说说你的烦心事
#
48097次浏览
359人参与
#
毕业旅行去哪玩儿
#
1247次浏览
33人参与
#
硬件/芯片公司工作体验
#
75212次浏览
664人参与
#
商战,最累的是我们
#
13062次浏览
52人参与
#
打工人锐评公司红黑榜
#
145989次浏览
920人参与
#
25届秋招公司红黑榜
#
262168次浏览
1094人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务