新浪多模态大模型三轮技术面

一切都从昨天下午原以为是KPI的一面开始,没想到直接开出意外惊喜

一面:

自我介绍,然后讲了刚投的一篇1区论文的工作,分析整体的框架、具体的技术细节,常见的反问点(为什么这么设计、为什么有效,相比于之前的工作,主要好在哪里、最核心的贡献是什么)

面试官自称是NLP背景的,然后问了一些常见的视觉和多模态大模型的模型结构、损失函数设计、训练及推理过程等(面试官有可能是故意扮猪吃老虎哈哈)

Coding:最接近的三数之和;共享屏幕本地IDE,秒了一个n^2logn的做法,让进一步优化,最优解是双指针;不过面试官觉得编码能力应该可以,实现很快,提示完直接让过了

原本以为月底发一面是KPI,结果面试官问我后面还有没有时间,现场约二面,等面试官进会议

二面:

自我介绍,二面面试官非常重量级(进会议的title和面试的深度广度全都拉满了)

首先很深入了聊了相当多关于MLLM的内容:介绍一些MLLM的现状,再选一个近期的多模态大模型,介绍相较于CLIP、LlaVA早期版本进行了哪些改进: Qwen技术点比较多,之前没系统整理过,说了自己还有点印象的Intern-VL2,不过上次看Intern-VL2的论文已经是三个月前了,大概只答上两点比较核心的。然后继续深挖目前多模态大模型在数据层面相较于之前的改进,这个没答上来

之后被面试官深挖了LoRA,可以说LoRA的每一个细节的角落全都被挖的干干净净,还有不少开放性思考题,甚至比上次小鹏CV大模型一面面试官挖的还狠得多。不过上次被拷打之后就很系统地整理了LoRA的相关内容,勉强答得还行吧以后再不能当git clone侠了

然后面试官针对我的专业背景(统计),深挖了几个ML、DL相关的数学层面的问题,有让共享屏幕开白板写过程和推导(不是特别难,不过挺新颖的,秋招还是第一次面试被问到这种类型的问题);紧接着针对我的Nature子刊工作中用到的Gaussian Graphical Model,讲了其与传统ML模型、神经网络和大模型的差异、区别和各自的优劣势。

最后是一些相对开放性的问题:你是如何使用现代的LLM产品提高工作、学习和编码效率的?为什么这种方式有效果?LLM、LVM、MLLM未来发展的方向和前景大概是怎样的?

整个二面的问题不止这些,太多了,又深又广,很多具体已经记不太清了,而且回答的过程中几乎都有进一步反问,深挖了很多东西

二面面完,面试官也是直接当场联系三面面试官

三面:

自我介绍,三面面试官更是整个集团的技术大佬,NLP相关经验非常丰富,整场面试问的内容也偏NLP相关,我之前几乎0 NLP相关经验,汗流浃背了可以说,不过好在基础还行,凭自己的做CV和MLLM的积累,基本都答上了

首先介绍了之前lab实习中做的LLM剪枝优化迁移的工作,然后深挖了相关的技术细节,不过刚聊完电脑音频直接罢工了,重新约到11.1下午

11.1下午

完整描述CLIP的原理、架构、工作过程、怎么对齐、怎么做image caption

完整描述transformer输入一个文本序列如何做下一句预测的全过程,深挖了tokenize、位置编码、MHA、FFN、损失函数、输出转换各个部分

接着从我项目经历中有关传统ML的经验出发,问了一些ML相关的八股,难度不大

然后是偏主管面的一些内容:对工作环境的期望、自身性格优缺点等

反问环节逮住大佬问了目前MLLM的相关业务和技术现状;最后是关于面试流程上的一些问题

总体体验非常棒的三轮面试拷打深度广度强度高,但是也学到了非常多的东西,这也算是对自己能力的一种认可吧

现在想想当初9月份面试难度远不及现在的团子、阿里、得物、理想,却被面挂了,可能还是简历不如现在优化的好,没能突出自己的优势,也没有勇气直接投更匹配自己的岗位吧(当初为了求保底,基本都投的机器学习、数据挖掘这种最“泛”的算法岗,或许应该早点鼓起勇气直接投自驾、MLLM和CV的)。今天看到牛u们团子开奖,各种sp、ssp,确实感觉羡慕+遗憾。

最后许愿一个HR面吧

#秋招#  #算法工程师#  #牛客创作赏金赛#  #新浪#
全部评论
大佬膜拜! 26届的,来好好学习!!
2 回复 分享
发布于 2024-11-09 10:03 美国
大佬,祝你后续顺利
1 回复 分享
发布于 2024-11-23 19:18 北京
加油佬,祝你一切顺利,会有好结果哒。太不容易了这个秋招。
1 回复 分享
发布于 2024-11-01 19:13 北京
希望大佬后续顺利
1 回复 分享
发布于 2024-11-01 17:50 上海
佬,请问你这个岗叫什么呀?我看今年秋招没有“多模态大模型工程师”,只有“大模型工程师”
点赞 回复 分享
发布于 2025-09-10 13:56 北京
有没有uu只有2面的啊? 2面完就没消息了
点赞 回复 分享
发布于 2024-11-21 20:31 山西
佬有后续吗
点赞 回复 分享
发布于 2024-11-19 15:55 上海
卧槽,太猛了佬,开奖了记得替一下
点赞 回复 分享
发布于 2024-11-13 03:40 澳大利亚
这么牛逼大佬去新浪吗?
点赞 回复 分享
发布于 2024-11-12 17:35 湖南
老哥有后续了吗
点赞 回复 分享
发布于 2024-11-10 11:59 山东
佬,是风控部门的吗?
点赞 回复 分享
发布于 2024-11-01 18:01 新加坡

相关推荐

03-16 16:19
已编辑
长沙学院 Java
如果你现在想入行AI,别一上来就啃什么反向传播、数学推导,大概率坚持不下来。直接奔着RAG去,这是企业最缺、上手最快、简历最好写的方向。RAG到底是啥?全称检索增强生成,说白了就一句话:让AI学会翻资料再回答问题。以前的大模型全凭“脑子里的知识”答题,问它“咱们公司年假怎么休”,它直接懵——它又没在你公司上过班。RAG不一样:你先把自己公司的员工手册、技术文档、会议纪要、客服聊天记录全喂进去,存在一个叫“向量数据库”的地方。员工来问问题,系统先去库里找相关材料,然后把材料+问题一起给大模型,模型照着材料回答。效果立竿见影:客服不用翻几百页手册了,秒回客户问题新员工入职,自己问AI就能熟悉业务代码报错了,AI自动查历史bug库给解决方案销售要写方案,AI去库里翻过往中标文档做参考为啥企业抢着要?因为每个公司都有自己的知识积累,通用的GPT用不上。而RAG能把公司内部经验和AI能力打通,成本低、见效快、不出错。老板一听就两眼放光。入门学啥?就两样:1. 向量数据库——存知识的地方。学学怎么把文档切碎、转成向量、存进去、搜出来。主流的Chroma、Milvus、Pinecone挑一个玩熟。2. LangChain——搭流程的工具。学学怎么把“查资料+问模型”串成一条流水线,文档怎么切、怎么搜、怎么拼给模型。怎么做项目?就做一个:公司内部知识库问答机器人。拿几百页员工手册或者技术文档,搭一个能回答任何内部问题的机器人。部署到飞书、钉钉或者企业微信上,真能让同事用起来。这个项目往简历上一写,面试官一看:这人来了就能干活。
现在入门AI应该走哪些方...
点赞 评论 收藏
分享
目前主流的 Embedding 模型都是 Bi-Encoder 架构(双塔模型):query 和文档各自独立编码成向量,再算余弦相似度。这种架构的优势是速度快——文档向量可以离线算好存起来,查询时只需要算一次 query 的向量就能跟整个库比对。代价是精度不如 Cross-Encoder,所以才需要两阶段检索。✴️下面是目前开源社区里最常用的几个 Embedding 模型的核心对比:✅BGE-M3(BAAI 智源):目前中文场景的首选。支持中英多语言,最大 8192 token 的上下文窗口,同时支持稠密向量、稀疏向量和 ColBERT 式多向量检索三种模式。在 MTEB 中文榜单上长期稳居前列。如果你不知道选什么,无脑选 BGE-M3 不会错。✅BGE-large-zh(BAAI 智源):专注中文的大尺寸版本,在纯中文场景下精度略高于 M3,但不支持多语言,上下文窗口也只有 512 token。适合纯中文且文档较短的场景。✅GTE-multilingual-base(阿里达摩院):阿里出品的多语言 Embedding 模型,在 MTEB 多语言榜单上表现很强。跟 BGE-M3 是直接竞品关系,两者在多语言场景下各有胜负。如果你面的是阿里,了解 GTE 是基本功。✅E5-small/base/large(微软):微软出品,特点是有从 small 到 large 的完整尺寸梯度,small 版本只有 33M 参数,特别适合资源紧张或需要部署到边缘设备的场景。精度比 BGE 略低,但推理速度快很多。✅Jina Embeddings v2(Jina AI):最大亮点是支持 8K token 的超长上下文。如果你的文档 chunk 特别长(比如整段法律条文或完整的技术文档章节),其他模型可能截断,Jina v2 能全部吃进去。✅MiniLM(微软):极致轻量级,速度最快,适合对延迟要求极高或大批量处理的场景。精度是这几个里最低的,但胜在快。🌟四种经典搭配方案1️⃣经典流水线:BGE-base2️⃣检索 Top 100 → BGE-Reranker-base3️⃣精排多语言场景:GTE-multilingual-base + GTE-multilingual-rerankerGPU4️⃣紧张:E5-small + MiniLM-L6-cross-encoder(batch 推理)5️⃣长文档 / 8K:Jina-embeddings-v2 + Jina-ColBERT-v2,段内匹配更稳📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看8道真题和解析
点赞 评论 收藏
分享
评论
26
52
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务