百度大模型推理研发暑期实习面经

已挂,开个帖子攒点人品。

bg:双2,本科非科班,硕士计科,无实习。两个非大模型项目,模型压缩和模型微调相关。

百度一面:
1、自我介绍
2、项目介绍
3、解释项目方法原理(项目用到了个小众的方法)
4、怎么保证模型在更高压缩率下的性能
5、项目方法能和GPU并行结合使用吗
6、项目有使用TB并行吗
7、如果在多卡上实现项目方法,需要如何考虑卡间通信
8、如何降低KV cache
9、讲讲DeepSeek中的MLA
10、对模型的量化压缩方法有哪些了解
11、Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
12、手撕:查看一颗二叉树的右视图

百度二面:
1、自我介绍
2、讲讲最开始的自注意力机制发展到当今的一个优化路线
3、对Flash Attention的了解
4、讲讲优化访存时会遇到的数据局部性问题
5、手撕:二维矩阵乘积
6、手撕:有向无环图存储神经网络,并根据网络执行的拓扑排序进行遍历

#聊聊我眼中的AI# #我的失利项目复盘# #百度求职进展汇总# #面试问题记录# #我的实习日记# #牛客AI配图神器#
全部评论
一面之后几个小时,HR打电话说过了,开始约二面时间。后面二面结束后一两个工作日都没消息,今天看官网发现无了。
2 回复 分享
发布于 05-12 23:21 江苏

相关推荐

面的是字节的国际电商部门感觉是卷中卷了被狠狠拷打了😭面试问题:- 解释一下ROC曲线与PR曲线的关系、ROC曲线与PR曲线的适用场景- 介绍一下贝叶斯定理(贝叶斯公式和全概率公式)- 考了一个概率题:已知一个随机发生器,生成 0 的概率为  p ,生成 1 的概率为  1 - p 。请构造一个新的随机发生器,使其生成 0 和 1 的概率均为 1/2。- (针对简历提问)了解矩阵分解吗 MF、LFM吗- 训练模型的时候,怎么才能知道模型是不是过拟合了?除了看训练集和测试集的准确率,还有哪些方法可以防止过拟合?比如正则化、交叉验证这些,能不能展开讲讲怎么用?- 推荐系统里老听到CTR预估和序列推荐模型,讲讲这些模型是干啥的?比如DIN、DIEN这些CTR模型是怎么捕捉用户兴趣的?还有GRU4Rec、Caser这些序列模型是怎么处理用户行为序列的?它们各自解决了什么问题?代码题:- 给定整数数组 nums,求最大和的连续子数组,并返回该最大和。(最大子数组和LeetCode53)- 手写一个二分类交叉熵bce,使用np(只把bce的公式写出来了,然后拷打怎么计算梯度,最好熟悉一下二分类梯度怎么回传的,被拷打到了这里)一面一般是组内员工,平时比较忙,这场面试约在的中午11点,所以如果能够把你的项目介绍得详细一点,就容易不让面试官问太多问题,一般我大概是2-3min自我介绍,然后再10min介绍一个项目(2-3个项目说完差不多就去一大半面试时间了),然后最后面试官不是主动型+忙着去吃饭,就会问些常见的面经,然后碰巧见过的爆率很高,然后直接吟唱。这里拷打了概率类型的问题,印象里至少有4/32次面试提到了类似的概率场景题目,建议也是稍微复习一下,至少看看基础的内容。国际电商(tiktok)据说晋升不错(同时也卷),毕竟是出海业务,但是是真的难进(听说很多清北大佬都挂了),不太懂想要招什么人(岗位名额实在太少)  
查看8道真题和解析 面试问题记录
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客企业服务