发面经攒人品

组里做特定领域的文生图模型，会涉及到语言模型的微调和出图底模训练，八股拷问不多，重点记录一下值得思考的问题。
1.DALLE和SD技术路线的不同？自回归/diffusion
2.SD的lora微调原理和位置？除了注意力投影还有Unet的卷积层。lora还有loCon/loha/lokr。
3.SDXL的双文本特征怎么处理？SD3不同文本端具有的不同token量怎么处理？CLIP-77/T5-512
4.除了交叉注意力的方式还有哪些文本信息注入？ DiT涉及到的in-context/cross attention/adaLN
5.为什么生成模型选用Unet？一是保留了相同分辨率上的信息，二是跳跃连接允许存在bottleneck的情况下保留信息（VAE生成会因为压缩造成部分消息丢失）
6.长文本输入怎么处理？通过切分成77（CLIP）长度分别抽取特征后拼接再投影。那0号和77号相同的位置编码怎么解决？讲了BERT给不同句子设置了区分的embedding，涉及到对于语言模型的微调。如果是在训练UNet时（冻结语言模型）该怎么处理？以插值的方式去构造新的位置编码，但效果不好。还有一些其他的方法，需要进一步了解。

还有一些不了解的点：
1.解耦（adapter）和非解耦（？）方式对模型微调的影响？
2.有没有了解过controlnet的condition的预处理的pipeline？

工作重点：长文本处理，文本图像的高度一致性，生成图像的精确性和美观度

全部评论

推荐最新楼层

AAA李核心

中国科学技术大学算法工程师

“那0号和77号相同的位置编码怎么解决？” 这里是指什么呢

点赞回复分享

发布于 2024-05-23 16:26 江苏

04-13 16:08

已编辑

门头沟学院 Java

2026春招北京奈亚信息技术有限公司

于3月10号晚7点，收到招聘软件上的邀请投递初级Java研发工程师（薪资1.5w-1.9w）。投递简历收到回复，自我介绍是国企，做教育考试类项目，说以Java进行面试，进入Java全栈开发项目组，另外需要用到.net开发和Python，.net不会可以进组学习，然后问笔试和面试都是线下，是否愿意。因为本人那段期间要写毕业论文，故推辞了一下时间，差不多半个月后（3.27）去线下笔试和面试，笔试内容包括(数据库，逻辑推理，前端，Java后端，算法题一道)，大概写了70多分钟交卷，基本都是问答题，虽然hr说题型基础但是对应届生来说比较有难度，需要好好准备，尤其是算法题是十进制转换成平衡三进制，当时做...

春招至今，你收到几个面试...

点赞评论收藏

04-10 09:49

蚌埠坦克学院嵌入式软件开发

兆易创新嵌入式开发一面，面试官主要问了这些

1. volatile 关键字有什么作用？它能保证线程安全吗？答案：volatile 的作用是告诉编译器，这个变量的值可能会被外部因素修改，因此每次使用都要直接从内存中读取，而不是从寄存器或缓存中取值。它常用于：中断与主循环共享变量多线程共享标志位硬件寄存器映射但 volatile不能保证线程安全，因为它只能保证“可见性”，不能保证“原子性”。如果是复合操作，比如 count++，仍然可能发生竞争问题。2. const 和 #define 的区别是什么？答案：const 是有类型的常量，编译器会做类型检查，调试时也更容易定位。#define 是预处理宏，本质上是文本替换，没有类型信息。主要区别...

查看15道真题和解析

点赞评论收藏

03-19 17:53

武汉大学算法工程师

唉每每看到这张截图总是意难平

为什么面了八次次次都是一面挂，次次都不说原因，问了面试官就是插科打诨，为什么别人一面就过呢，真的没有缘分呀。不考编程就是脑筋急转弯的概率题，考了编程a了也不过没a也不过 总之就是不过，没一次二面，深深的怨念。觉得我不够资格就直接拉黑简历呗，每次都捞起来重新拷打一顿什么意思呢。

暴杀流调参工作者：春招又试了一些岗位，现在投递很有意思，不仅要精心准备简历，投递官网还得把自己写的东西一条一条复制上去，阿里更是各个bu都有自己的官网，重复操作无数次，投完简历卡完学历了，又该写性格测评、能力测评，写完了又要写专业笔试，最近还有些公司搞了AI辅助编程笔试，有些还有AI面试，对着机器人话也听不明白录屏硬说，终于到了人工面试又要一二三四面，小组成员面主管面部门主管面hr面，次次都没出错机会，稍有不慎就是挂。卡学历卡项目卡论文卡实习什么都卡，没有不卡的😂

点赞评论收藏