练秋湖劣质牛马想当春招糕手

2025-10-14 09:52 门头沟学院 C++ 发布于贵州

关注

Offer求指点

投票

👋个人背景：双9，川渝人，专业IC/EDA，Cpp混子；
目前有EDA公司和网易的offer，均未开奖，薪资按照网上爆料取平均；
两家EDA公司都是965，华大稳定+地理位置好，合见给的多；网易是做游戏开发，算是兴趣导向投递的，求各位大佬指点！
#offer比较#

全部评论

推荐最新楼层

四川大学嵌入式软件工程师

恭喜！网易高手！

1 回复分享

发布于 2025-10-27 21:20 广东

门头沟学院 FAE

1和2里面选吧

点赞回复分享

发布于 2025-11-17 10:51 广东

嵌入式的小白

西安理工大学嵌入式软件开发

游戏的公司，应该都卷吧

点赞回复分享

发布于 2025-10-18 17:44 陕西

小流氓一年又一年

门头沟学院安卓

带他有点卷啊，965太美了

点赞回复分享

发布于 2025-10-15 18:42 北京

03-06 09:16

浙江大学算法工程师

格蓝若 C++软件开发二面面经

1. 先简单介绍一下你自己，重点说说你最擅长的技术领域和最有成就感的项目。面试官您好，我是XXX。我最擅长的是C++后端开发和系统编程，对高性能服务器、分布式系统比较有研究。最有成就感的项目是我做的分布式缓存系统，从零开始设计实现，经历了性能优化、架构演进的完整过程。最初QPS只有几万，通过内存池、无锁队列、零拷贝等优化，最终达到了20万QPS。这个项目让我深入理解了高性能系统的设计原理，也锻炼了解决复杂问题的能力。除此之外，我对Linux系统编程、网络编程、多线程编程都有比较深入的实践。2. 详细说说你的缓存系统项目，从系统设计的角度介绍架构、技术选型、关键设计决策。这个缓存系统的设计目标是...

C++八股文全集

点赞评论收藏

分享

03-04 01:45

门头沟学院 Java

字节校招ai infra一面（攒人品

发一下问题给大家参考，攒攒人品！1.llama.cpp了解吗?详细说说它的特点2.对DeepSekk 671B模型进行推理时，是如何做算力分配和负载均衡的?3.大模型推理中的量化技术了解吗?常见的量化方法有哪些?4.对称量化和非对称量化的区别?5.KV cache的原理是什么?在推理中起什么作用?6.用过vLLM吗?它相比传统推理框架有什么优势?7.vLLM中的PagedAttention机制是怎么工作的?解决了什么问题?语言基础C++协程(Coroutine)的特点?C++协程有栈和无栈的区别?cpp20协程是有栈还是无栈?Vector emplace_back和push_back的区别?常量指针和指针常量的区别?算法题（easy）LeetCode经典题:走迷宫问题(DFS/BFS)

查看12道真题和解析

点赞评论收藏

分享

03-15 06:25

门头沟学院机器学习

鹅厂实习一面 Ai infra

攒攒人品！有面试过同岗的朋友欢迎评论区交流1. 聊项目2. 聊一下chunk prefill，他是为了解决什么问题而提出的3. 说一下reduce-scatter和all-to-all通信4. 怎么减少launch kernel overhead5. cuda编程中bank conflict是什么，怎么解决？6. 场景题：一个大集群中有节点内有nvlink，节点间部分机器有rdma，怎么去设计你的分布式推理方案代码题：k个一组翻转链表

点赞评论收藏

分享

03-01 03:15

门头沟学院机器学习

网易Ai infra 校招面经

1.请详细描述你在简历中提到的AI相关项目中，负责的主要模块和核心技术贡献。2.在设计一个高吞吐、低延迟的模型推理服务时，你会重点考虑哪些架构层面和工程层面的问题?3.请解释C++程序内存中栈(stack)、堆(heap)和静态/全局存储区的特点与主要区别。4.在C++中，new/delete`与'malloc/free`的主要区别是什么?为什么在C++中通常推荐使用前者?5.请解释深拷贝和浅拷贝的概念，并说明在什么情况下必须使用深拷贝。6.请阐述C++中'std:unique_ptr、'std..shared_ptr和'std:weak_ptr的设计意图、使用场景及相互区别。7.虚函数表(vtable)是如何实现运行时多态的?虚函数与纯虚函数(抽象类)在语义和用法上有何不同?8.什么是内存对齐?编译器对结构体进行内存对齐的主要规则是什么?请计算一个给定结构体(包含不同类型成员)在特定平台下的sizeof大小。9.请解释C++11中右值引用(&&)和移动语义(move semantics)的概念，并说明它们如何用于实现高效的数据转移(如std.:.vector的push_back)。110.简述CUDA的SlIMT(单指令多线程)编程模型，描述thread、block、grid的层次关系。11.在CUDA内核中，一个线程的局部变量通常存储在何处?这与寄存器的分配有何关系?12.在CUDA优化中，如何使用共享内存(Shared Memory)来减少对全局内存的重复访问?请举一个简单的例子(如矩阵乘法中的分块)。13.什么是warp shuffle指令?它在warp内部的数据交换和规约操作中有什么优势?14.解释在CUDA中使用float4或int4等向量化加载/存储指令进行合并访存的原理和性能收益。15.什么是共享内存的bankconflict?它是如何产生的?请举例说明。16.如何通过数据填充(padding)或其他内存布局调整技术来避免或减轻共享内存访问中的bankconflict?17.解释CPU缓存的工作原理，包括时间局部性、空间局部性的概念，以及常见的缓存替换策略18.编程题:实现一个算法，在一个包含大量整数的数据流中，实时找出出现频率最高的前K个元素。请描述你的思路(哈希表+最小堆)并分析时间复杂度。

查看18道真题和解析

点赞评论收藏

分享

03-03 10:35

门头沟学院机器学习

AI infra 人才库面经总结

ai infra八股：1- 给定训练所需的Tokens，怎么估计模型训练所需的完整时间？2- Prefill和Decode阶段各有什么优化技术？3- 什么是Two-batch overlap，什么场景Two-batch overlap是负优化？4- megatron-lm中通信优化怎么做？5- 多机PD分离会有KV cache transfer开销，为什么还要做PD分离？6- muon和AdamW的pretrain和posttrain为什么不能混用？7- 如何看待跨SM的PD分离和AF分离？8- cuda的global memory和shared memory访存分别需要注意什么？9- deepseek-V3的优化点10- deepseek-DSA和NSA，MoBA的区别11- nccl中的通信源语有哪些？all-reduce参数更新一次参数需要几次通信？12- 在小数据量场景使用NVSHMEM，每个GPU直接读取其他GPU的数据，在本地reduce，相比ring all-reduce的好处13- 训练时如何设计超长序列下的并行14- 将Ampere架构的算子适配到Hopper架构的卡上，你会对哪些地方进行升级改造？

在改简历的大卫很认真：1. 训练时间估算时间 ∝ 总FLOPs / (算力FP8/FP16 × 利用率) 总FLOPs ≈ 6 × 参数 × Token数再除以单卡算力、并行数、利用率，就是时长。 2. Prefill / Decode 优化 - Prefill：长序列并行、FlashAttention、分块、算子融合、向量化 - Decode：KV cache、连续Batch、PagedAttention、Speculative Decoding 3. Two-batch overlap - 同时跑两个微批次，计算/通信重叠 - 负优化：计算太快、通信太小、显存不够、调度 overhead 盖过收益 4. Megatron-LM 通信优化 TP+PP+DP三维并行；重叠通信计算；分桶AllReduce；激活重计算；减少跨节点通信量。 5. PD分离（PP+DP）为什么要KV transfer 为了流水线+数据并行一起用，提高吞吐；虽然有KV拷贝成本，但整体能堆更大Batch、更高利用率。 6. MuON / AdamW 不能混用优化器状态、动量、更新逻辑完全不兼容；预训练用一个，微调换另一个，状态不匹配，直接训崩/不收敛。 7. 跨SM PD / AF 分离核心：拆任务、提高 occupancy、隐藏延迟； PD：并行度拆分更干净； AF：聚焦注意力/前馈访存与计算重叠；看模型结构、Kernel瓶颈选。 8. CUDA Global / Shared 注意 - Global：对齐、连续访问、合并访存、少随机读、用L2缓存 - Shared：防bank conflict、分块复用、同步_sync、容量控制 9. DeepSeek-V3 优化点高效架构+长序列支持；优化Attention/FFN计算；更好的并行策略；推理侧低延迟高吞吐。 10. DeepSeek-DSA/NSA/MoBA - DSA：领域稀疏注意力 - NSA：神经稀疏注意力 - MoBA：混合专家注意力核心都是稀疏化、省计算、扩容量。 11. NCCL 原语 & AllReduce 次数原语：Send/Recv、Broadcast、Reduce、AllGather、ReduceScatter、AllReduce Ring AllReduce：2次（ReduceScatter + AllGather）。 12. 小数据量 NVSHMEM vs Ring AllReduce 少了Ring多跳延迟；直接GPU-GPU读+本地Reduce；小数据下延迟更低、更简单。 13. 超长序列训练并行 TP+PP+CP（上下文并行）+ ZeRO；分块Attention、分块FFN；激活重算+KV复用；控制通信量。 14. Ampere → Hopper 算子升级 - 用TF32、FP8、新指令 - 适配TMA、异步拷贝 - 优化Warp调度、 occupancy - 重写Attention/MatMul，用Hopper专属优化

查看14道真题和解析

点赞评论收藏

分享

评论

1

4

招聘动态

客路2026产研校招

AI网申助手

网申字段一键填写

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

27届校招宝典

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

15439次浏览 173人参与

# uu们，春招你还来吗？ #

52772次浏览 306人参与

# 招商银行数字金融训练营 #

104464次浏览 881人参与

# 面试被问到不会的问题，你怎么应对？ #

12889次浏览 164人参与

# 面试中，你被问过哪些奇葩问题？ #

92313次浏览 892人参与

# Claude Code泄露源码 #

7401次浏览 111人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

35589次浏览 616人参与

# 恒生电子笔试 #

17581次浏览 135人参与

# 2023年不发年终奖的公司盘点 #

30320次浏览 174人参与

# 你都用vibe coding做过什么？ #

9425次浏览 392人参与

# AI Coding实战技巧 #

7937次浏览 174人参与

# 26届春招投递记录 #

1505次浏览 24人参与

# 你现在一天AI几次？ #

6642次浏览 87人参与

# 七猫笔试 #

6366次浏览 46人参与

# 做完笔试后你收到面试了吗？ #

14413次浏览 165人参与

# 四大天坑是哪四家？ #

111201次浏览 241人参与

# 你见过哪些招聘隐形歧视？ #

11175次浏览 98人参与

# 机械人你知道哪些单休企业 #

101836次浏览 476人参与

# Vibe Coding 会干掉初级岗位吗？ #

12440次浏览 168人参与

# 大厂实习和小厂实习最大的区别是什么？ #

25339次浏览 194人参与

# 如果人生可以debug你会改哪一行? #

5717次浏览 102人参与

# 网易游戏雷火笔试 #

4029次浏览 66人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务