阿里淘天AI应用算法实习一面
发发面经攒攒人品~
1.有做过VLM吗?可以讲讲是如何训练的?
2. Vision Encoder是怎么训练的,预训练的过程是什么?大概是一个什么样的模型架构,loss什么样子
3.那你了解大概需要多少团队能够训练一个VisionEncoder?
4.负责工作,用了多少数据量,任务表现怎么样
5.请讲一下GAN的结构、损失函数、以及它的训练机制吗?
6.你觉得GAN的损失函数和普通模型的损失函数有什么本质区别?
7.在训练GAN的过程中,有没有遇到不稳定的问题?比如loss震荡什么的,遇到这些问题你怎么处理的?
8.你了解ESRGAN吗?相比SRGAN,他在损失函数⬆️做了哪些改进?
9.有没有做过Agent相关的,是否了解一些新型的Agent架构,比如opencloud这些?
10.那你认为这些新型的Agent架构,相比传统的workflow或者agent系统,有哪些优势?
11.你知道OpenCloud里面的skills是怎么设计和实现的吗?
12.手撕代码-线性回归
用Numpy实现一个线性回归,并用梯度下降训练
13.手撕代码-多头注意力
写multi-head attention的核心实现
14.在计算attention的时候,为什么要➗根号下dk?
15.你训练过最大的模型规模是多少?
16.你在训练时用的什么框架?有没有用过Deepspeed?整体训练环境是怎样的?
1.有做过VLM吗?可以讲讲是如何训练的?
2. Vision Encoder是怎么训练的,预训练的过程是什么?大概是一个什么样的模型架构,loss什么样子
3.那你了解大概需要多少团队能够训练一个VisionEncoder?
4.负责工作,用了多少数据量,任务表现怎么样
5.请讲一下GAN的结构、损失函数、以及它的训练机制吗?
6.你觉得GAN的损失函数和普通模型的损失函数有什么本质区别?
7.在训练GAN的过程中,有没有遇到不稳定的问题?比如loss震荡什么的,遇到这些问题你怎么处理的?
8.你了解ESRGAN吗?相比SRGAN,他在损失函数⬆️做了哪些改进?
9.有没有做过Agent相关的,是否了解一些新型的Agent架构,比如opencloud这些?
10.那你认为这些新型的Agent架构,相比传统的workflow或者agent系统,有哪些优势?
11.你知道OpenCloud里面的skills是怎么设计和实现的吗?
12.手撕代码-线性回归
用Numpy实现一个线性回归,并用梯度下降训练
13.手撕代码-多头注意力
写multi-head attention的核心实现
14.在计算attention的时候,为什么要➗根号下dk?
15.你训练过最大的模型规模是多少?
16.你在训练时用的什么框架?有没有用过Deepspeed?整体训练环境是怎样的?
全部评论
相关推荐
查看16道真题和解析