无论文勇闯秋招算法岗——淘天智能搜推部一面(复盘,草稿)

一共1h。

项目简单介绍。10min左右。

然后就是结合实习项目的 35min 的各种八股提问。

最后15min做题。给了三个题,我选的 岛屿的个数,hot100里边的。其它两个好像也是hot100里边的(有个三数之和)。

反问环节,是什么方向,搜索。

有什么面试建议,语速可以快一点(笑),这样可以聊更多的东西。

记录一下八股部分。

VideoMAE怎么训练的?

CLIP和MAE有什么区别?

BLIP和CLIP的区别?在 ITC的基础上引入了 ITM loss 和 LM loss,让模型可以进行文本生成。ITM loss是判断图文是否匹配,可辅助数据清洗。

BLIP的B什么意思?Bootstrapping (自举/自助),利用少量的高质量人工标注的数据,训练Captioner 和 Filter,前者负责给无文本或者带噪声文本的图片进行 caption 操作,Filter负责过滤低质量文本。经过 filt 的 web data 和 合成data 作为增强后的数据。

BLIP2的qformer是怎么训练的?

两阶段训练,stage1: ITC ITG ITM loss,其中 ITG loss 是直接用 QFormer 的text transformer做image caption,没有用到LM。

有几个loss?stage1: ITC ITG ITM loss 。stage2:自回归 交叉熵 loss。

ITC和ITM的区别?

强化学习,GRPO和PPO的区别?

重要性采样是用来干嘛的?

拒绝采样和重要性采样有什么不同或者一样的地方?

flashattention解决的是什么问题?

Deepspeed 用的zero几,为什么用zero2不用zero3?

Eagle MTP的eagle2 和 3分别有什么改进?

整体感觉这边用的东西比较老,因为问的东西都很老,QwenVL完全没问,强化学习也问的很浅。

纯八股:

机器学习,SVM的HinGE loss,合页损失了解吗?

完全不知道。

拒绝采样:

图片来自:https://www.hmoonotes.org/2020/06/rejection-sampling-importance-sampling.html

采样步骤:

1.从q(x)中采样样本xi

2.以概率p(x)/Mq(x) 接受xi,其中M是一个常数,以确保p(x) <=Mq(x)

3.否则拒绝,重新采样

结合图像可直观感受到最后采样得到的样本一定是符合分布p的。

数学证明如下:

1.求X的联合概率密度,当X被接受且X在dx的时候,其概率密度为

2.总体的接受率为:

3.计算被接受的样本的分布,(p(x)/M)/(1/M) = p(x)

参考 https://blog.csdn.net/shizheng_Li/article/details/145826594

重要性采样:

无论文勇闯秋招算法岗 文章被收录于专栏

无论文勇闯秋招算法岗 面试考点记录

全部评论
二面了吗
点赞 回复 分享
发布于 2025-10-24 21:21 北京

相关推荐

机智的豹子有点心碎:UU我还在找工作还没找到,一直在搜简历怎么改,总结了这些: 1.SEO:简历根据每一个岗位定制化:使用这个岗位中所描述的工作的词,它要求什么技能就把自己的技能描述成什么样子,把SEO用在自己身上(把我的简历和个人特质,当成一个热门产品来做 “搜索引擎优化”),让HR能用最低的门槛看到我 2."顺序:把岗位要求的技能跟经历放在简历的最开头、最显眼的位置" 3.包装:简历是一个最终交付说明书,只要最终学习成长做得到就可以,在合适的范围内自我吹捧(我这个人怎么能够在HR的角度被迅速的看懂和看到,减轻HR的工作压力) 4.每点加小标题​:用6~10字概括该段内容,便于面试官快速抓取信息。 5.避免空泛描述​:拒绝“培养了组织能力”等泛泛而谈,替换为具体行动和成果。 6."使用“三段式结构”​​:每段经历按“为什么做-做了什么-结果如何”展开: ​a) 为什么做​:痛点或目标(例如“品牌声量不足”) ​b) 做​了什么:方法论(例如“趋势洞察+竞品对标+人群细分”) ​c) 结果如何​:量化成果或影响(例如“推动客户投放20万预算”)" 7.量化成果​:用数字体现工作成效(如“整理500+份资料”“撰写2万字报告”)。 这些有的是我想去的岗的,如果对你有用的话按需修改就好~加油,早日上岸!
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务