美团- 北斗计划-基座大模型推理引擎工程师

📍面试公司:美团
🕐面试时间:2025-08-14,菜只因秋招处女面
💻面试岗位:北斗计划-基座大模型推理引擎工程师
BG:末9本,中科院硕,和组内课题不相关
❓面试问题:
    自我介绍:一分钟完事
    1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势
    2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?
    3.了解GPU的cuda core、Tensor core吗,你常用的GPU有哪些,他们的显存和显存带宽有多大
    4.讲讲大模型的量化
    5.为什么需要PD分离技术
    6.讲讲PageAttention和Continous Batching技术
    7.讲讲cuda编程
    8.了解DeepSeek 的MLA机制吗?详细介绍一下和MHA、GQA、MQA的区别
    9.介绍一下DeepSeek MoE架构
    10.详细介绍一下各种并行方法,TP、PP、DP是什么
    11.为什么说Prefill阶段是计算密集型的,为什么Decode阶段是内存密集型的?
    #牛客AI配图神器#无寿司🍣,感觉是回答的太烂了,30分钟结束。
    反问:从刚才的面试来看,感觉是不是做底层系统优化比较多,是不是CUDA编程很多?
    答:也不全是。主要综合来看,不是一定要掌握CUDA编程,但是作为大模型开发而言,CUDA编程肯定要学的,
🙌面试感想:和蔼,有几道问题给我解释了;开始开了摄像头,后期关闭了摄像头;大模型八股偏多,依据简历问的,没问项目,我的项目是RAG,可能跟岗位关系不大,所以没问。
#面试问题记录##牛客创作赏金赛##美团##美团秋招笔试##大模型##给26届的秋招建议#
全部评论
这波八股拷打够狠,30 分钟结束像提前交卷了
点赞 回复 分享
发布于 08-19 14:30 江苏
项目尽量往推理引擎靠,不然容易被问懵
点赞 回复 分享
发布于 08-19 14:30 重庆
面试问题像并发请求,没答上来的都超时了
点赞 回复 分享
发布于 08-19 14:30 四川

相关推荐

08-20 17:23
已编辑
中南大学 C++
8.18面试 8.19已共享😿1.前后端通讯用什么协议 HTTP与HTTPS区别 对称加密还是非对称加密2.tcp和udp区别 tcp如何保证数据有序、如何处理数据包丢失,tcp滑动窗口、tcp四次挥手,TIME_WAIT了解过吗,如何处理相关问题3.线程池主要解决什么问题4.epoll poll select5.redis缓存:数据不一致问题6.项目数据量有多大7.mysql的性能瓶颈,如何优化8.索引的存储实现,b+树的特点9.innodb的聚簇索引和非聚簇索引10.回表了解过吗11.联合索引 最左匹配元素12.如何定位sql需要优化的地方(如何定位慢dql)13.mysql正常连接但是莫名其妙写不进去数据一般是发生了什么情况14.死锁了解吗15.innoob支持的锁最小粒度,innoob支持事务吗事务的特性16.mysql默认的事务隔离界别17.可重复读会出现幻读吗18.事务如何实现的(回滚)19.你这个项目里的kafka/grpc主要用来做什么的20.linux命令:查看当前进程 查看进程内的环境变量 设置环境变量是临时的还是永久的 查看哪个进程占用端口 文件好几个G怎么去查,用grep可能会卡死,面试官说用less或者more21.同步和异步的区别22.io多路复用属于同步还是异步手撕:实现堆排序,我说换一个,变成解码字符串,3[ab]2[a]解码成abababaa,写完以后要求嵌套也可以解码,用栈写,有个地方一直报段错误找不出来反问:基础这块还行,简历上写的东西比较少,可以多去实习多做项目,做了什么东西简历上没体现出来,所以不知道该问什么,不能说写得太简单吧,就是说不知道擅长哪方面,不管是工程还是算法,只能就着你简历上的东西问,有没有友友知道这是什么意思?部门是千帆,像字节的火山,做ai大模型的在线训练、推理、部署
查看44道真题和解析
点赞 评论 收藏
分享
评论
7
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务