一、基础算法与数据结构区间最值:设计数据结构,支持 O(1) 查询(Segment Tree / Sparse Table)。线程安全队列:如何在并发场景下实现?锁 vs 无锁。二、机器学习与深度学习Transformer 机制:自注意力计算公式、复杂度,KV Cache 的作用。优化器对比:SGD / Adam / AdamW 区别,为什么大模型常用 AdamW?三、大模型推理与优化量化原理:INT8、FP16、FP8、4bit 的差异,精度掉点怎么处理。CUDA/TensorRT 优化:矩阵乘法如何优化?(对齐、向量化、shared memory 等)。四、系统与工程能力分布式训练/推理:...