8.18一面主要是讲自己做的项目。讲完时间差不多了,也就没问其他的了。8.21 二面先讲项目 大约40分钟。然后是基础问答1.ZeRO的介绍,有什么办法优化ZeRO3的通信。2.HBM. DRAM SRAM有什么关系。3. FlashAttention,就简单讲了一下原理,没推公式。4. attention里最费内存的操作是哪个。5. 旋转编码器和普通位置编码的不同。6. 大模型投机采样的原理。7. 手撕,挺简单的。问HR结果,HR没回复,挺焦灼的。希望有个好结果吧。也从这个面试中发现,光看着自己的一亩三分地了,对大模型的研究没有及时更新,比如投机采样这种应用比较广的方法我都不是特别清楚,只知道个大概。 之后需要每天花点时间追踪一下学术前沿。25.08.22 HR回信,pending了,看看其他岗叭,冲冲冲!