AI infra推理方向日常实习面经总结

攒人品攒人品~~
1.实习拷打
2.推理相关知识点:
1.transformer架构(encoder-only、decoder-only、encoder-decoder各自优缺点,模型举例)
2.prefill/decode 结合roofline讲
3.nv基础(grid、block、thread、warp、l0cache/l1cache(shared memory)/l2cache/global memory、sram/hbm、tensor core、tma等)
4.vllm相关(pagedattention、连续批处理、v0/v1架构、chunked prefill、prifix caching等)
5.sglang相关 (radixattention,sglang代码没怎么看,问的不多)
flashattention v1-v3、flashdecoding
6.量化(LLM.int8()、SmoothQuant、AWQ、GPTQ等、量化的好处)
7.投机解码(什么是投机解码、lookahead、n-gram、medusa、eagle)
8.并行(dp/tp/pp/ep各自是什么,在vllm中如何实现)
9.通信(reduce、gather、开销考虑)
10.主流模型架构(llama1-3的演变、qwen3的moe怎么做的、deepseek的mtp)
11.kvcache压缩手段(MHA、MQA、GQA、MLA)
12.pd分离
3.其他知识点
计网、操作系统、python八股 都很基础
4.手撕
leetcode:反转链表、链表重排(lc143)、中序遍历二叉树的递归和非递归实现、最长连续序列(lc128)
triton/cuda:layer norm、大矩阵规约求和、online-softmax
全部评论

相关推荐

04-23 20:45
门头沟学院 Java
1.先简单自我介绍一下2.介绍一下你的专业,以及主要学的的课程。3.你觉得你是更偏向在数学还是在计算机?4.你在你们专业里GPA排第几?5.说说你对java这门语言的理解6.java有哪些特性7.谈谈你对接口、继承、多态的理解8.方法重载和方法重写的区别9.你平常用的JDK版本是啥10.JDK11有哪些新特性11.你这个项目当中用到RabbitMQ,那你说说对它的理解12.那你能说说它跟其他消息队列有什么区别吗13.XXL-JOB是定时任务的框架吗14.你用过哪些数据库,哪些类型的数据库15.项目当中用了分表策略,你是按什么分的16.项目中提到降低系统耦合度和提升系统扩展性,你说下17.为啥项目当中用ES18.你这里用到三级缓存架构,为啥这么设计,我一级或二级不行吗19.解释一下RAG在你的项目当中怎么实现的20.Feed流说下是什么概念21.你提到反射和类加载,可以说说它的原理吗22.你JUC包知道把,你说下23.ThreadLocal的源码你看过吗24.你知道哪些常见的垃圾回收器25.G1有什么优势26.大模型你用过哪些,在日常生活当中有哪些体现27.你用过AI从页面设计、接口设计、再到代码,去开发一个项目吗28.你有没有学过算法导论29.你知道模型当中维度的概念吗30.你上一家公司的组织架构是咋样的31.上家是用SVN管理代码的,有用git吗,gitlab知道吗32.你这里提到的编写文档,那文档的格式,形式是怎样的33.还问了你之前习惯用cursor,然后现在说claude更好,你有具体用过吗34.openclaw你是自己部署的,还是拿厂商已经包好的去用35.我看你也有在写技术博客,你知道markdown格式吗,这里我说成了富文本(😂)36.现在多少粉丝(1个😂)后面就是反问环节,然后如果你项目当中有提到具体的数据,比如提高百分之多少,数据量有多少,面试官会特别在意,不过我都说是预估的(😂)
点赞 评论 收藏
分享
评论
3
22
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务