社招-百度昆仑芯一面

C++基础的知识,内存的创建等(记不太清了)
介绍RmsNorm这个算子的公式和实现流程,怎么做优化的
FP16和BF16的区别,为什么BF16的表示的精度没有FP16高
MLP在TP切分下数据的流程
Attention在并行策略下的切切分
大模型结构整个计算流程
给4台服务器,从零开始怎么做训练、推理、部署、微调
上下文并行了解吗
了解哪些位置编码,有什么区别
使用TP,PP,DP模型内部怎么计算的
FlashAttention使用AscendC怎么实现的
读过vllm源码嘛
PageAttention的原理,怎么分块的,上层分了一块,下层分了几块
指令微调数据集怎么构建的
了解Lora微调嘛,当有多个Lora微调权重的时候,怎么选择,调度策略是什么
Lora和Loss是怎么考虑的和预训练的loss有什么区别

算法题:
1、快速排序,要求空间复杂度O(1)
2、二分查找找到最左边的,要求时间复杂度O(logN)

有些可能写的不清楚,有点忘记了
#社招##校招##百度#
全部评论
老哥投的啥岗位啊?是推理框架?
点赞 回复 分享
发布于 昨天 23:34 浙江
大佬面的什么岗位
点赞 回复 分享
发布于 09-02 15:51 浙江
宝贵的社招面经,三连了
点赞 回复 分享
发布于 09-01 12:12 北京

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务