发面经攒人品
视觉算法实习生-组内做图像生成,拷问了很全面的图像生成知识,记录一下,也方便后续回顾。
1.Stable Diffusion的1.x/2.x/XL/3.x 各个版本的区别
2.SDXL的双文本信息处理/采样方式的改进/Refiner结构/训练集的多尺度
3.Stable Diffusion的结构和各个模块的功能
4.VAE的输入输出维度、编解码器施加的约束(KL/patch对抗)
5.CLIP的pipeline/loss
6.Unet的输入:时间步/随机噪声/条件-交叉注意力,输出:噪声期望
7.采样器:DDPM-重参数化/DDIM/EDM
8.微调:Lora/Adapter/Dreambooth/Text inversion
lora和prompt engineering能否达到相同效果
lora的label咋来?BLIP
为什么用BLIP? BLIPv1v2 区别
10.CFG的训练和推理
11.Transformer结构:解码器的交叉注意力QKV是谁?
12:Vision Transformer结构
13.GAN和Diffusion优缺点
1.Stable Diffusion的1.x/2.x/XL/3.x 各个版本的区别
2.SDXL的双文本信息处理/采样方式的改进/Refiner结构/训练集的多尺度
3.Stable Diffusion的结构和各个模块的功能
4.VAE的输入输出维度、编解码器施加的约束(KL/patch对抗)
5.CLIP的pipeline/loss
6.Unet的输入:时间步/随机噪声/条件-交叉注意力,输出:噪声期望
7.采样器:DDPM-重参数化/DDIM/EDM
8.微调:Lora/Adapter/Dreambooth/Text inversion
lora和prompt engineering能否达到相同效果
lora的label咋来?BLIP
为什么用BLIP? BLIPv1v2 区别
10.CFG的训练和推理
11.Transformer结构:解码器的交叉注意力QKV是谁?
12:Vision Transformer结构
13.GAN和Diffusion优缺点
全部评论
好运来来来🍀
相关推荐
2025-11-18 18:24
北京理工大学珠海学院 嵌入式软件工程师
秋招投简历提醒助手:个人经验是,一般面二十场左右就会进入侃侃而谈阶段。我今年七月末的时候开始的第一次面试,都是很多不会,回复很慢。后面慢慢迭代,到九月中的时候基本上面啥说啥,很放松的状态 点赞 评论 收藏
分享
点赞 评论 收藏
分享

