最后提醒下AI大模型面试肚子里没墨水的人!

常见的业务题
架构理解篇
Q1 Transformer模型主要由哪两部分组成?
Q2 自注意力机制中的Q、K、V矩阵是什么缩写?
Q3 多头注意力中"头"(head)指的是什么?
Q4 位置编码的作用是什么?
Q5 Encoder和Decoder结构的主要区别?
Q6 为什么要使用残差连接(Residual Connection)?
基础组件篇
Q7 前馈神经网络(FFN)有多少层?
Q8 Layer Normalization放在哪个位置?
Q9 激活函数ReLU和GeLU的主要区别?
Q10 词嵌入(Word Embedding)的维度代表什么?
Q11 注意力掩码(Attention Mask)的作用是什么?
Q12 为什么要使用dropout技术?
训练基础篇
Q13 预训练(Pre-training)的目标是什么?
Q14 什么是语言模型中的"自回归生成"?
Q15 数据并行的基本实现方式?
Q16 什么是训练中的批量大小(Batch Size)?
Q17 学习率(Learning Rate)过大会导致什么问题?
Q18 训练损失(Training Loss)下降说明什么?
模型应用篇
Q19 什么是文本生成中的贪心解码(Greedy Decoding)?
Q20 温度参数(Temperature)如何影响生成结果?
Q21 模型推理时为什么要限制生成长度?
基础概念篇
Q25 参数量(Parameters)和计算量(FLOPs)的区别?
Q26 什么是生成式AI(Generative AI)?
Q27 预训练模型和传统NLP模型的核心区别?
Q28 为什么大模型需要海量训练数据?
Q29 什么是过拟合(Overfitting)现象?
Q30 模型推理(Inference)是指什么过程?
工程实践篇
Q31 GPU显存不足时常见的解决方法?
Q32 模型权重文件(Checkpoint)包含哪些内容?
评估基础篇
Q37 如何评估语言模型的生成质量?
Q38 困惑度(Perplexity)指标的计算原理?#面试##找工作##实习##大模型##求职#
全部评论
蹲蹲答案
1 回复 分享
发布于 08-26 07:50 北京
求分享
1 回复 分享
发布于 07-29 09:35 湖南
所有面试题可以开源给大家 后台T一下
1 回复 分享
发布于 07-28 13:23 湖南

相关推荐

09-29 16:59
已编辑
门头沟学院 Java
牛客96609213...:疯狂背刺,之前还明确设置截止日期,还有笔试,现在一帮人卡在复筛,他反而一边开启扩招,还给扩招的免笔试,真服了,你好歹先把复筛中的给处理了再说
投递大疆等公司10个岗位
点赞 评论 收藏
分享
10-19 10:28
已编辑
成都理工大学 后端工程师
团孝子已上线feeling:面了很多家公司,能感受到目前只有小公司+外包喜欢问八股。大厂虽然也问八股,但是是从实习、项目中进行提问,并且大厂会问很深,面试官也会对你的回答进行思考➕追问,所以准备大厂面试前一定要备好相关资料。对于算法,我做的是codetop前100+力扣hot100+力扣高频150,面试中实感hot100就足够,基本上只要是hot100就秒答。对于项目和八股,我做的也是烂大街的星球项目,八股则是看小林和问ai,自己也写了很多技术博客和画了很多思维导图,并且自己也尝试用嘴巴说出来,不只停留于纸面。运气也很重要,必须要让面试官/HR看到简历才行,所以建议投递时间是下午两点。tl:第一岗位9.9 投递9.10 一面(一面评价:最近见过最强的大三,结束五分钟后约二面,都晚上九点了不下班吗)9.11 二面(三道算法a出两道,反问评价:经验不够等横向,我实习生要啥经验)9.21挂(实习时间过短+其他原因,想要一年实习的,为什么不招个正职)第二岗位10.10投递10.11约面(主管打电话,说看到我之前投递记录了想要我挂qa职进去干后端,同意)10.14 一面(无八股,主动说确实很强,意愿很强)10.16 oc其余,友邦,东软,东华,惠择,用友oc已拒京东测开一面挂(投后端被测开捞)腾讯测试已拒(投后端被测开捞)ps:表扬惠择的主管面,没怎么问技术(可能是一面面试官沟通过了),全程一起讲大道理,解答了心中很多疑惑,也告诉我以面试官角度来看怎么选候选人,如果可以下次一定选惠择
HeaoDng:美团好像可以触发一面通
点赞 评论 收藏
分享
评论
3
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务