2023-10-27 15:55 蚌埠坦克学院大堂经理

关注

阿里云基础设施秋招

hr面后一直是面试中是不是凉了

全部评论

推荐最新楼层

中国科学技术大学算法工程师

放轻松，减少内耗。去年我也是9月份hr面完等排序，一直等到大概11月份开的offer（淘天&阿里云）。

点赞回复分享

发布于 2024-09-23 10:37 浙江

柠檬槟榔糖

门头沟学院 C++

请问今天楼主有推进吗？我是基础软件部，等待面试结果

点赞回复分享

发布于 2023-11-02 11:24 北京

牛客436573088号

The University of Melbourne C++

请问楼主后续有推进么？我也和你一样

点赞回复分享

发布于 2023-11-01 07:42 广东

哈尔滨工业大学（深圳） C++

m

点赞回复分享

发布于 2023-10-27 23:40 香港

牛客388443645号

北京邮电大学 Java

m

点赞回复分享

发布于 2023-10-27 21:00 香港

门头沟学院 Java

+1

点赞回复分享

发布于 2023-10-27 20:47 广东

02-23 21:22

门头沟学院 C++

字节跳动 C++ 一面

自我介绍根据自身具体情况回答项目介绍看个人项目了进程和线程的区别进程是资源分配的基本单位，线程是CPU调度的基本单位进程拥有独立地址空间，线程共享进程的地址空间进程切换开销大，线程切换开销小进程间通信复杂（需IPC），线程间可直接读写共享数据进程通信方式管道：匿名管道（父子进程）、命名管道消息队列：内核中的消息链表共享内存：最快方式，需配合信号量同步信号量：计数器，用于同步互斥信号：通知事件发生Socket：跨网络通信 线程是否有共享内存有共享内存：同一进程的线程共享堆、全局变量、代码段私有部分：每个线程有自己的栈、寄存器、线程局部存储（TLS） 用户态和内核态区别用户态权限低，不能直接访问硬...

查看22道真题和解析

点赞评论收藏

分享

02-07 00:50

算法工程师

ai infra实习帮忙选选offer

投票

上海ai lab是高性能编译，会有一部分国产芯片适配的活，其他时间自由探索小红书这边的业务主要做rl infra和推理优化，但有点卷，活很多，自学时间有点少

点赞评论收藏

分享

02-11 12:25

门头沟学院人工智能

阿里控股AI infra一面

感觉面的还可以发些面经攒攒人品1.ep的dispatch和combine2.vm最近有什么新的比较好的特性3.dpsk的结构4.tp的allreduce的次数5.kv cache的大小计算6.MQA和GQA手撕

查看6道真题和解析

点赞评论收藏

分享

03-03 20:35

门头沟学院 Java

字节 AI Infra实习面经好难

给我面没招了，感觉自己好菜、面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.实习拷打2.有没有觉得工作中卡住的点，聊一聊3.是否了解操作系统等 讲讲操作系统内存管理 虚拟内存解决了什么问题4.介绍一下mcp5.mcp工具较多时如何避免幻觉6.有没有看论文的习惯 最近有哪些较新的内容7.代码题：求数组连续出现相同数字的最大次数

查看6道真题和解析

点赞评论收藏

分享

03-03 10:35

门头沟学院机器学习

AI infra 人才库面经总结

ai infra八股：1- 给定训练所需的Tokens，怎么估计模型训练所需的完整时间？2- Prefill和Decode阶段各有什么优化技术？3- 什么是Two-batch overlap，什么场景Two-batch overlap是负优化？4- megatron-lm中通信优化怎么做？5- 多机PD分离会有KV cache transfer开销，为什么还要做PD分离？6- muon和AdamW的pretrain和posttrain为什么不能混用？7- 如何看待跨SM的PD分离和AF分离？8- cuda的global memory和shared memory访存分别需要注意什么？9- deepseek-V3的优化点10- deepseek-DSA和NSA，MoBA的区别11- nccl中的通信源语有哪些？all-reduce参数更新一次参数需要几次通信？12- 在小数据量场景使用NVSHMEM，每个GPU直接读取其他GPU的数据，在本地reduce，相比ring all-reduce的好处13- 训练时如何设计超长序列下的并行14- 将Ampere架构的算子适配到Hopper架构的卡上，你会对哪些地方进行升级改造？

在改简历的大卫很认真：1. 训练时间估算时间 ∝ 总FLOPs / (算力FP8/FP16 × 利用率) 总FLOPs ≈ 6 × 参数 × Token数再除以单卡算力、并行数、利用率，就是时长。 2. Prefill / Decode 优化 - Prefill：长序列并行、FlashAttention、分块、算子融合、向量化 - Decode：KV cache、连续Batch、PagedAttention、Speculative Decoding 3. Two-batch overlap - 同时跑两个微批次，计算/通信重叠 - 负优化：计算太快、通信太小、显存不够、调度 overhead 盖过收益 4. Megatron-LM 通信优化 TP+PP+DP三维并行；重叠通信计算；分桶AllReduce；激活重计算；减少跨节点通信量。 5. PD分离（PP+DP）为什么要KV transfer 为了流水线+数据并行一起用，提高吞吐；虽然有KV拷贝成本，但整体能堆更大Batch、更高利用率。 6. MuON / AdamW 不能混用优化器状态、动量、更新逻辑完全不兼容；预训练用一个，微调换另一个，状态不匹配，直接训崩/不收敛。 7. 跨SM PD / AF 分离核心：拆任务、提高 occupancy、隐藏延迟； PD：并行度拆分更干净； AF：聚焦注意力/前馈访存与计算重叠；看模型结构、Kernel瓶颈选。 8. CUDA Global / Shared 注意 - Global：对齐、连续访问、合并访存、少随机读、用L2缓存 - Shared：防bank conflict、分块复用、同步_sync、容量控制 9. DeepSeek-V3 优化点高效架构+长序列支持；优化Attention/FFN计算；更好的并行策略；推理侧低延迟高吞吐。 10. DeepSeek-DSA/NSA/MoBA - DSA：领域稀疏注意力 - NSA：神经稀疏注意力 - MoBA：混合专家注意力核心都是稀疏化、省计算、扩容量。 11. NCCL 原语 & AllReduce 次数原语：Send/Recv、Broadcast、Reduce、AllGather、ReduceScatter、AllReduce Ring AllReduce：2次（ReduceScatter + AllGather）。 12. 小数据量 NVSHMEM vs Ring AllReduce 少了Ring多跳延迟；直接GPU-GPU读+本地Reduce；小数据下延迟更低、更简单。 13. 超长序列训练并行 TP+PP+CP（上下文并行）+ ZeRO；分块Attention、分块FFN；激活重算+KV复用；控制通信量。 14. Ampere → Hopper 算子升级 - 用TF32、FP8、新指令 - 适配TMA、异步拷贝 - 优化Warp调度、 occupancy - 重写Attention/MatMul，用Hopper专属优化

查看14道真题和解析

点赞评论收藏

分享

评论

3

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 大厂实习和小厂实习最大的区别是什么？ #

4030次浏览 24人参与

# 参加完秋招的机械人，还参加春招吗？ #

120138次浏览 764人参与

# 招商银行数字金融训练营 #

41027次浏览 401人参与

# 牛友の3月总结 #

3647次浏览 33人参与

# 拼多多工作体验 #

52863次浏览 344人参与

# 面试被问到不会的问题，你怎么应对？ #

1049次浏览 12人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

19528次浏览 312人参与

# 这些公司卡简历很严格 #

95405次浏览 418人参与

# 研究所VS国企，该如何选 #

259251次浏览 2013人参与

# 通信硬件知识分享 #

48196次浏览 538人参与

# 实习最想跑路的瞬间 #

131072次浏览 740人参与

# 找AI工作可以去哪些公司？ #

19071次浏览 877人参与

# 从事AI岗需要掌握哪些技术栈？ #

16330次浏览 984人参与

# 你做过最难的笔试是哪家公司 #

49967次浏览 884人参与

# 机械人怎么评价今年的华为 #

231861次浏览 1538人参与

# 材料人的华为红黑体验 #

41622次浏览 200人参与

# 金三银四，你的春招进行到哪个阶段了？ #

25172次浏览 300人参与

# 说说你知道的学历厂 #

391127次浏览 1379人参与

# AI面会问哪些问题？ #

38421次浏览 1205人参与

# 想给25届机械人的秋招建议 #

47890次浏览 251人参与

# 如何排解工作中的焦虑 #

292962次浏览 2606人参与

# 机械人避雷的岗位/公司 #

62958次浏览 395人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务