1.自我介绍2.论文拷打(一个是文生图相关的,一个是图像编辑的)3.stable diffusion 中VAE的作用,UNet做了那些修改,时间步t是如何嵌入的4.stable diffusion 3中的CLIP的作用,为什么全局表示中要用CLIP的embedding5.讲讲RoPE6.LayerNorm的作用,Post-LN和Pre-LN的区别7.Qwen2.5-VL的位置编码(这里回答了MRoPE),时间t如何嵌入8.手撕:k个一组翻转链表,还有一个是抛硬币(AB两个人,谁先抛出正面谁先赢,每一轮A先抛,求A获胜的概率)9.反问(感觉面试官很敷衍, 介绍业务一笔带过, 然后问了没回答出来的...