快手-暑期实习-多模态算法面经 夯爆了

给我面没招了,发点面经攒攒人品~
项目拷打
CLIP部分
1.CLIP的结构+一个batch里面混入了相同的图片,也就是说一个正样本被当作一个负样本,但它实际是一个正样本,怎么去解决和避免这些问题?在训练或者说Loss层面
2.CLIP可以做分类吗?通过对齐的方式做分类你觉得是可行的吗?
3.图像输入给大模型,解码输出文本,这样的对齐方式和CLIP有什么区别?这两种哪种是未来趋势?
偏八股部分
1.COT有了解过吗?结构化的输入/few-shot 为什么会有帮助?(模型层面)
2.有了解过哪些大模型?BLIP2的三个loss介绍
3.现在大部分的结构不采用Q-former,而用MLP,是为什么?那为什么之前不用MLP,而用Q-former?
4.一个多模态模型,它的视觉和文本编码器的参数量大小有什么配比的逻辑?
5.一个5乘5的卷积,它可以由几个3乘3的卷积串联来替换,从而减少计算量但保持感受野不变?
6.分类任务需要很多标注样本,但是现在想在少量样本的情况下,实现新增任务的效果,如何实现?不希望通过大量数据做微调
手撕:经典力扣 全排列
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 04-01 10:23 广东

相关推荐

以下内容都是当时写的了,其实一面已经过了。1.介绍项目1工作2.怎么结合的内部工具?有没有用到mcp?3.Go接触过吗?4.Go和Java之间的区别了解吗?5.多线程接触过吗?项目中用到了吗?6.自己用过多线程吗?7.进程和线程之间的最大区别8.Linux里怎么创建进程?9.熟悉的Linux命令有哪些?10.查看过程序运行的状态吗?11.如果想看哪些服务占用的CPU比较高怎么办?12.MySQL的索引是怎么存储的?13.在更之前MySQL用的是什么引擎?14.哈希和B+树两种索引的区别是什么?15.有没有对索引做过优化?16.什么时候不该创建索引?17.MySQL的事务了解过吗?18.MySQL事务的隔离级别有哪几种?19.假如一个SQL有慢查询,怎么优化?20.打开浏览器输入域名之后的流程21.TCP怎么保证一定传输到22.TCP发包顺序是怎么界定的23.TCP和UDP使用场景上最大的区别?24.为什么要这么多层不同的协议?25.假如让你设计一个和HTTP类似的应用层协议,你觉得需要具备哪些能力?26.HTTP怎么做数据压缩的了解吗?27.明文传输最大的弊端在哪?28.场景题,假设有个计数的需求,要做一个能返回点赞、收藏、评论等数量,并给抖音、头条等不同的平台使用的通用系统,应该怎么设计系统?29.你觉得这个系统需要有哪些接口?30.LeetCode 215题 数组中的第k个最大元素 想到快排了 但太久不写 边界条件处理得一团糟 15min内没写出来 菜得一反问了面试官自己还有哪些地方需要提升,得到的回复是需要对服务端的一些具体的应用以及设计理念再多学习一下。确实自己基础题基本都答上来了,但场景题答得稀烂,加上手撕寄了,目前还在流程里,但应该工作日就会被挂掉。也算是第一次征战宇宙厂了,面试官人还是挺好的,我答不上来的问题会试着引导,也没有压力我,遇到我实在不熟悉的领域会切换话题,体验还是比较舒服的,还是自己实力不够。顺便记一下3.18 wxg后台的一面:开局三道算法,改版的LRU(淘汰n个最久未使用的数据)、改版字典树(输出包含查询字符串前缀的所有字符串)、以及一个机器学习的抽象题:把矩形的周长写成w1 x长 + w2 x宽的形式(实际上w1=w2=2),自己构建若干长、宽、周长的输入组合,最终求出w1、w2的值。一眼看出是类似反向传播的原理,然而java选手根本不会写啥梯度下降、损失函数的东西,只有一点点研0时补机器学习基础的印象,只能说思路。(好吧,后来发现这题考的是最小二乘法,我会集贸)手撕烂了之后,面试官也懒得多说啥了,没开摄像头,随便问了几个项目的问题结束了,回去秒挂,但8分钟后又被秒捞起来(无限复活这块)。在那一周还参加了小红书、PDD和美团的笔试,无一例外地倒下了。算法这块确实只会做签到题和模板题,只能说回去慢慢提升。
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务