得物测试开发一面-26校招
1. 测试驱动开发的核心思想及实践案例
2. 单元测试的价值体现
3. 单元测试框架使用经验
4. 自动化测试项目实践分享
5. 持续集成流程理解与质量保障
6. 流水线环节组成
7. 测试用例设计方法论
8. 测试开发与传统测试的差异分析
9. 测试开发工程师能力要求
10. 技术学习路径规划
11. 问题排查能力提升方法
12. 电商搜索功能测试设计
13. 高并发场景测试方案
14. 数据库性能优化策略
15. 接口安全测试要点
16. 移动端兼容性测试方法
17. 用户体验测试关注点
18. 测试团队协作经验
19. 新技术应用案例
20. 手撕代码:商品库存管理逻辑实现
反问环节
1. 团队技术架构
2. 业务发展方向
2. 单元测试的价值体现
3. 单元测试框架使用经验
4. 自动化测试项目实践分享
5. 持续集成流程理解与质量保障
6. 流水线环节组成
7. 测试用例设计方法论
8. 测试开发与传统测试的差异分析
9. 测试开发工程师能力要求
10. 技术学习路径规划
11. 问题排查能力提升方法
12. 电商搜索功能测试设计
13. 高并发场景测试方案
14. 数据库性能优化策略
15. 接口安全测试要点
16. 移动端兼容性测试方法
17. 用户体验测试关注点
18. 测试团队协作经验
19. 新技术应用案例
20. 手撕代码:商品库存管理逻辑实现
反问环节
1. 团队技术架构
2. 业务发展方向
全部评论
相关推荐
03-03 10:35
门头沟学院 机器学习 在改简历的大卫很认真:1. 训练时间估算
时间 ∝ 总FLOPs / (算力FP8/FP16 × 利用率)
总FLOPs ≈ 6 × 参数 × Token数
再除以单卡算力、并行数、利用率,就是时长。
2. Prefill / Decode 优化
- Prefill:长序列并行、FlashAttention、分块、算子融合、向量化
- Decode:KV cache、连续Batch、PagedAttention、Speculative Decoding
3. Two-batch overlap
- 同时跑两个微批次,计算/通信重叠
- 负优化:计算太快、通信太小、显存不够、调度 overhead 盖过收益
4. Megatron-LM 通信优化
TP+PP+DP三维并行;
重叠通信计算;
分桶AllReduce;
激活重计算;
减少跨节点通信量。
5. PD分离(PP+DP)为什么要KV transfer
为了流水线+数据并行一起用,提高吞吐;
虽然有KV拷贝成本,但整体能堆更大Batch、更高利用率。
6. MuON / AdamW 不能混用
优化器状态、动量、更新逻辑完全不兼容;
预训练用一个,微调换另一个,状态不匹配,直接训崩/不收敛。
7. 跨SM PD / AF 分离
核心:拆任务、提高 occupancy、隐藏延迟;
PD:并行度拆分更干净;
AF:聚焦注意力/前馈访存与计算重叠;
看模型结构、Kernel瓶颈选。
8. CUDA Global / Shared 注意
- Global:对齐、连续访问、合并访存、少随机读、用L2缓存
- Shared:防bank conflict、分块复用、同步_sync、容量控制
9. DeepSeek-V3 优化点
高效架构+长序列支持;
优化Attention/FFN计算;
更好的并行策略;
推理侧低延迟高吞吐。
10. DeepSeek-DSA/NSA/MoBA
- DSA:领域稀疏注意力
- NSA:神经稀疏注意力
- MoBA:混合专家注意力
核心都是稀疏化、省计算、扩容量。
11. NCCL 原语 & AllReduce 次数
原语:Send/Recv、Broadcast、Reduce、AllGather、ReduceScatter、AllReduce
Ring AllReduce:2次(ReduceScatter + AllGather)。
12. 小数据量 NVSHMEM vs Ring AllReduce
少了Ring多跳延迟;
直接GPU-GPU读+本地Reduce;
小数据下延迟更低、更简单。
13. 超长序列训练并行
TP+PP+CP(上下文并行)+ ZeRO;
分块Attention、分块FFN;
激活重算+KV复用;
控制通信量。
14. Ampere → Hopper 算子升级
- 用TF32、FP8、新指令
- 适配TMA、异步拷贝
- 优化Warp调度、 occupancy
- 重写Attention/MatMul,用Hopper专属优化
查看14道真题和解析 点赞 评论 收藏
分享