阿里算法大模型二面-校招
二面:
1.项目介绍
2. CogVideoX的模型结构、3D VAE的压缩率、MM-DiT的优势、4f+1为什么要+1
3.FLUX的结构,生成模型的优势
4.SD3的架构,生成原理Flow matching
5.VQ-VAE使用的的损失函数,训练过程
6.VQ-VAE中codebook中的code有的被使用的概率很低,这个是怎么解决的
7. Lora的原理,LORA在推理的时候怎么与原参数融合不带来时间成本
8. Flow matching与DDPM的区别及优势
9.Wan2.1的详细架构和训练细节
10.代码题:0841.钥匙和房间
1.项目介绍
2. CogVideoX的模型结构、3D VAE的压缩率、MM-DiT的优势、4f+1为什么要+1
3.FLUX的结构,生成模型的优势
4.SD3的架构,生成原理Flow matching
5.VQ-VAE使用的的损失函数,训练过程
6.VQ-VAE中codebook中的code有的被使用的概率很低,这个是怎么解决的
7. Lora的原理,LORA在推理的时候怎么与原参数融合不带来时间成本
8. Flow matching与DDPM的区别及优势
9.Wan2.1的详细架构和训练细节
10.代码题:0841.钥匙和房间
全部评论
相关推荐
投票
Java面试先知:我觉得还是去快手吧,第一份工作至少有大厂背书,快手两年后再跳回科大估计能比现在去科大翻一倍,况且科大据说入职即巅峰
点赞 评论 收藏
分享
点赞 评论 收藏
分享