得物测试开发一面-26校招

1.  测试驱动开发的核心思想及实践案例
2.  单元测试的价值体现
3.  单元测试框架使用经验
4.  自动化测试项目实践分享
5.  持续集成流程理解与质量保障
6.  流水线环节组成
7.  测试用例设计方法论
8.  测试开发与传统测试的差异分析
9.  测试开发工程师能力要求
10. 技术学习路径规划
11. 问题排查能力提升方法
12. 电商搜索功能测试设计
13. 高并发场景测试方案
14. 数据库性能优化策略
15. 接口安全测试要点
16. 移动端兼容性测试方法
17. 用户体验测试关注点
18. 测试团队协作经验
19. 新技术应用案例
20. 手撕代码：商品库存管理逻辑实现
反问环节
1.  团队技术架构
2.  业务发展方向

全部评论

推荐最新楼层

03-18 10:43

西安交通大学交互设计师

26届春招投递进度（3月更新）

双非一本，Java后端，记录一下现在的情况，给差不多背景的同学参考。目前投了：字节（后端）→ 一面过，等二面腾讯 IEG → 笔试过，约面中美团到店 → 投了，无反馈百度 → 笔试下周京东、快手、货拉拉 → 均已投，等消息小红书、滴滴 → 填了一半，还没提交体感字节推进最快，腾讯比较慢。多说一句，投的多了之后网申填表是真的烦，每家都要重填一遍。后来发现牛客有个网申助手插件，信息录一次之后自动同步，省了不少时间，那几家填一半的就是装了之后补完交的。有同背景还在投的吗，来聊聊

点赞评论收藏

03-14 10:58

西北工业大学 Java

京东创新零售周三一面，现在流程还是面试中，是不是凉了

#牛友提问，有问必答#

点赞评论收藏

03-04 01:45

门头沟学院 Java

字节校招ai infra一面（攒人品

发一下问题给大家参考，攒攒人品！1.llama.cpp了解吗?详细说说它的特点2.对DeepSekk 671B模型进行推理时，是如何做算力分配和负载均衡的?3.大模型推理中的量化技术了解吗?常见的量化方法有哪些?4.对称量化和非对称量化的区别?5.KV cache的原理是什么?在推理中起什么作用?6.用过vLLM吗?它相比传统推理框架有什么优势?7.vLLM中的PagedAttention机制是怎么工作的?解决了什么问题?语言基础C++协程(Coroutine)的特点?C++协程有栈和无栈的区别?cpp20协程是有栈还是无栈?Vector emplace_back和push_back的区别?常量指针和指针常量的区别?算法题（easy）LeetCode经典题:走迷宫问题(DFS/BFS)

查看12道真题和解析

点赞评论收藏

03-16 19:18

中国科学院大学算法工程师

京东校招流程好长

一月份开始面，线下面搞到三月，面完还是泡池子面的时候面试官很积极，也加了微信，这种最后能开出来吗😿

点赞评论收藏

03-03 10:35

门头沟学院机器学习

AI infra 人才库面经总结

ai infra八股：1- 给定训练所需的Tokens，怎么估计模型训练所需的完整时间？2- Prefill和Decode阶段各有什么优化技术？3- 什么是Two-batch overlap，什么场景Two-batch overlap是负优化？4- megatron-lm中通信优化怎么做？5- 多机PD分离会有KV cache transfer开销，为什么还要做PD分离？6- muon和AdamW的pretrain和posttrain为什么不能混用？7- 如何看待跨SM的PD分离和AF分离？8- cuda的global memory和shared memory访存分别需要注意什么？9- deepseek-V3的优化点10- deepseek-DSA和NSA，MoBA的区别11- nccl中的通信源语有哪些？all-reduce参数更新一次参数需要几次通信？12- 在小数据量场景使用NVSHMEM，每个GPU直接读取其他GPU的数据，在本地reduce，相比ring all-reduce的好处13- 训练时如何设计超长序列下的并行14- 将Ampere架构的算子适配到Hopper架构的卡上，你会对哪些地方进行升级改造？

在改简历的大卫很认真：1. 训练时间估算时间 ∝ 总FLOPs / (算力FP8/FP16 × 利用率) 总FLOPs ≈ 6 × 参数 × Token数再除以单卡算力、并行数、利用率，就是时长。 2. Prefill / Decode 优化 - Prefill：长序列并行、FlashAttention、分块、算子融合、向量化 - Decode：KV cache、连续Batch、PagedAttention、Speculative Decoding 3. Two-batch overlap - 同时跑两个微批次，计算/通信重叠 - 负优化：计算太快、通信太小、显存不够、调度 overhead 盖过收益 4. Megatron-LM 通信优化 TP+PP+DP三维并行；重叠通信计算；分桶AllReduce；激活重计算；减少跨节点通信量。 5. PD分离（PP+DP）为什么要KV transfer 为了流水线+数据并行一起用，提高吞吐；虽然有KV拷贝成本，但整体能堆更大Batch、更高利用率。 6. MuON / AdamW 不能混用优化器状态、动量、更新逻辑完全不兼容；预训练用一个，微调换另一个，状态不匹配，直接训崩/不收敛。 7. 跨SM PD / AF 分离核心：拆任务、提高 occupancy、隐藏延迟； PD：并行度拆分更干净； AF：聚焦注意力/前馈访存与计算重叠；看模型结构、Kernel瓶颈选。 8. CUDA Global / Shared 注意 - Global：对齐、连续访问、合并访存、少随机读、用L2缓存 - Shared：防bank conflict、分块复用、同步_sync、容量控制 9. DeepSeek-V3 优化点高效架构+长序列支持；优化Attention/FFN计算；更好的并行策略；推理侧低延迟高吞吐。 10. DeepSeek-DSA/NSA/MoBA - DSA：领域稀疏注意力 - NSA：神经稀疏注意力 - MoBA：混合专家注意力核心都是稀疏化、省计算、扩容量。 11. NCCL 原语 & AllReduce 次数原语：Send/Recv、Broadcast、Reduce、AllGather、ReduceScatter、AllReduce Ring AllReduce：2次（ReduceScatter + AllGather）。 12. 小数据量 NVSHMEM vs Ring AllReduce 少了Ring多跳延迟；直接GPU-GPU读+本地Reduce；小数据下延迟更低、更简单。 13. 超长序列训练并行 TP+PP+CP（上下文并行）+ ZeRO；分块Attention、分块FFN；激活重算+KV复用；控制通信量。 14. Ampere → Hopper 算子升级 - 用TF32、FP8、新指令 - 适配TMA、异步拷贝 - 优化Warp调度、 occupancy - 重写Attention/MatMul，用Hopper专属优化

查看14道真题和解析

点赞评论收藏