阿里淘天AI应用算法实习一面

发发面经攒攒人品~
1.有做过VLM吗?可以讲讲是如何训练的?
2. Vision Encoder是怎么训练的,预训练的过程是什么?大概是一个什么样的模型架构,loss什么样子
3.那你了解大概需要多少团队能够训练一个VisionEncoder?
4.负责工作,用了多少数据量,任务表现怎么样
5.请讲一下GAN的结构、损失函数、以及它的训练机制吗?
6.你觉得GAN的损失函数和普通模型的损失函数有什么本质区别?
7.在训练GAN的过程中,有没有遇到不稳定的问题?比如loss震荡什么的,遇到这些问题你怎么处理的?
8.你了解ESRGAN吗?相比SRGAN,他在损失函数⬆️做了哪些改进?
9.有没有做过Agent相关的,是否了解一些新型的Agent架构,比如opencloud这些?
10.那你认为这些新型的Agent架构,相比传统的workflow或者agent系统,有哪些优势?
11.你知道OpenCloud里面的skills是怎么设计和实现的吗?
12.手撕代码-线性回归
用Numpy实现一个线性回归,并用梯度下降训练
13.手撕代码-多头注意力
写multi-head attention的核心实现
14.在计算attention的时候,为什么要➗根号下dk?
15.你训练过最大的模型规模是多少?
16.你在训练时用的什么框架?有没有用过Deepspeed?整体训练环境是怎样的?
全部评论

相关推荐

4.14 一面横向两天后 4.17流程结束面试问题一、项目相关1. 你先简单介绍一下自己。2. 你的第一个项目(开源操作系统社区)能大概介绍一下吗?3. 你们当时为什么会选择做这样一个偏操作系统底层的项目?4. 这个项目目前是一个开源状态吗?大概有多少 star 和代码量?5. 你在这个项目里面主要做了哪一块的升级改造?6. loop 子系统的作用是什么?你具体实现了哪些功能?7. cgroup 子系统的作用是什么?为什么要实现它?8. 你们再去实现 cgroup 资源控制时,租户路径隔离的方案是怎么样的?9. 你提到的 bug hunter skill 是一个什么样的东西?10. bug hunter skill 怎么样去保证在尽量少的 token 下实现?用的是一套模型还是多套模型?11. 从轻量级往重量级去做的时候,对上下文的理解是怎样的?是一上来就确定模型,还是轻量级效果不好会换?12. callback 之后会有反馈机制或者打标吗?13. 介绍一下第二个项目(serverless 容器平台)。14. 这个 serverless 容器在创建和删除的过程中,如果别人再去操作,隔离是怎么做的?二、技术关注与认知15. 平时会关注哪些技术?我答了cc源码但是面试官好像不理睬三、算法/编程题(AI Coding)16. 构建一个智能旅行助手,需要获取天气、机票、酒店信息,要求保持整体低延迟并行调用。---## 反问环节1. 后续的流程和后续流程的时间大概是?- 尽快横向对比,提报上去,两个工作日内沟通。2. 是两轮技术加一轮 HR 吗?- 是的,两轮技术加一轮 HR。3. 面试官觉得还有什么地方可以再学习?- 面试的岗位是 AI 应用研发,介绍项目时尽量体现出 AI 上的使用场景或应用,要根据岗位来 match。4. 实习生如果进入到这个部门,大概会负责哪些业务?- 会安排新业务场景,不会负责很老的或已成熟的系统。技术栈给到足够自由。商品技术细分商品、商家、价格等,具体团队不确定,但保证是创新性新命题。
查看16道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务