JIWOO担 level
获赞
32
粉丝
13
关注
8
看过 TA
471
香港科技大学(广州)
2027
算法工程师
IP属地:广东
Anything but you
私信
关注
一、面试问题题单工程基础 / Linux 基础(1)Linux 用过吗?(2)最常用的一些原子命令是什么?说五个。大模型评测 / 指标基础(1)是否知道评测里有一个叫 ROUGE-L 的指标?(2)ROUGE-L 的指标公式能不能写出来?(3)这个指标里是不是对应有两个分量,也就是 precision 和 recall?(4)在最长公共子序列的基础上,如果去实现 ROUGE-L 这个经典指标,该怎么做?(5)precision、recall,以及相当于 F1 的这个算法,该怎么写?算法与代码实现(1)给定两个序列,计算它们最长公共子序列的长度,写代码。(2)如果把最长公共子序列的空间复杂度从 O(mn) 优化到 O(min(m,n)),该怎么写?(这里在写作代码的时候)(3)这里的“公共子序列”理解是否正确?(4)在此基础上,如何继续实现 ROUGE-L 的代码?岗位动机 / 匹配度(1)为什么投递这个岗位?(2)投递这个岗位时主要是怎么考虑的?面试官在交流中对背景的确认(1)是否做过一些和评测相关的工作?(2)是否做过 Anker 那段经历?(3)对 research 是否感兴趣?二、反问环节整理反问问题一问题听完岗位介绍后,提出了一个理解性问题:目前公司的工作是否可以理解为,主要在搭建评测管线,或者做 benchmark、测量指标这类工作,整体更偏业务性一些。面试官回答面试官先追问了“业务”如何定义。随后说明,这边并不是偏业务导向,而是主要做基础模型相关工作。核心是基于 open source 和 in-house 的评测集,用工程上高效的方式搭建稳定高效的评测框架,支持训练工作。同时,在有余力的情况下,也会做一些更有影响力的事情,比如自建多阶推理评测集、做文章、做研究任务。总体上更偏基础模型和研究支撑,而不是围绕某个明确业务场景去做指标与营收闭环。反问过程中获得的岗位信息虽然不是直接以提问-回答形式出现,但面试官在反问前主动介绍了岗位内容,主要包括以下几块:第一块:评测工程框架支持从预训练、后训练到 Agent 全链路的评测任务。Agent 这一块由于很多脚手架没有现成开源代码,需要自己实现;复杂任务如 SWE 等,也需要能够在现有 Infra 上高效跑起来,后续还希望支持轨迹合成等事情。目前已经支持几十个基础 benchmark,日常训练工作基本够用,但稳定性还在持续优化。第二块:模型评测产品化未来会把模型评测能力不断迭代到对外推广的机器学习平台产品上,对标阿里云、百炼等平台的评测功能,并持续学习、对标和优化。第三块:未来方向未来可能会从 SWE 出发,继续做 Coding Agent 的事情。目前这部分挑战较大,还在构思整个数据合成管线。反问环节结束后的延伸提问:为什么投递这个岗位,当时是怎么考虑的?三、体会和复盘一次不错的面试体验(虽然一开始感觉面试官本人好像有点mean)此外代码手撕的时候一开始面试官让我用本地IDE来写作最长公共子串,然后VS CODE的代码补全实在是很强,所以就直接让我用TXT写代码,并且——给我一版已经写好了的代码,让我审阅代码的问题所在(原话是“这里面有三个错误,你给我指出来”)“现在AI生成代码的能力已经很强了,我们很多时候需要做的是审阅AI生成的代码逻辑”之前自己还是站在技术员工或者螺丝钉/执行者的角度太久了,以至于对AI本身听之任之对AI代码(乃至文章或者图片)的态度,我们应该站在一个管理者的角度——把AI看作是一堆自己花钱雇佣的助手,需要管理学去批判、去审阅、去追问缘由和底层逻辑我们的认知和审美,应该站在比大模型更高的高度
0 点赞 评论 收藏
分享
一、面试问题A. 项目经历与业务理解1. 实习1. 先介绍一下你的这段实习经历。2. 听起来你的工作主要集中在数据/样本构建上,是吗?3. 你这里写了 VQG 和 VQA 一致性评估,这里的“一致性评估”是什么意思?4. 所以你的意思是,让大模型先生成问题,再生成答案,然后看问题和答案是否对得上,是吗?5. 所以最后是不是回答不一致的样本,就说明它比较难?6. 这个项目过程中,你有做过哪些模型方面的工作?2. LLM-as-a-Judge 项目7. 研究生阶段你还有一个 LLM-as-a-Judge 的项目,能大概介绍一下吗?8. 你最后这个总分好不好,是通过一个下游任务来验证的吗?9. 如果我理解得对,就是你打分之后选 Top 20% 的数据去微调,再和随机选 20% 做对比,是这个意思吗?10. 这个事情听起来很像样本选择,甚至有点像强化学习,你有从这个方向考虑过吗?B. 强化学习基础11. 你对强化学习了解吗?系统地学习过一些强化学习的方法吗?12. on-policy 和 off-policy 分别是什么意思?13. importance sampling 是什么?14. DPO 和 PPO 是什么关系?它们有什么区别?C. LoRA / 参数高效微调(这里因为我简历写了一个LoRA所以面试官追着来杀)15. 你在项目里用 BLIP-2 做了 LoRA 微调。LoRA 为什么可以省显存?16. 你虽然加的是一个低秩小矩阵,但不管多小,参数总归是增加了。那为什么在参数增加的情况下,LoRA 反而还能省显存?17. 推理的时候呢?推理阶段用 LoRA 和不用 LoRA,有什么区别?效率上有什么影响?D. 多模态模型 / VLM1. BLIP-2 相关(因为LLM-as-a-Judge里面提到了这个细节)18. 你为什么选择 BLIP-2 做微调?选择 BLIP-2 的考虑是什么?19. BLIP-2 相对于 BLIP 有什么改进?2. VLM 路线理解20. 你对 VLM 这条线还有哪些了解?之前有关注过哪些相关工作?21. Qwen VL 了解吗?22. 相比于 LLaVA,Qwen-VL 有哪些不一样的地方?你有没有了解过?E. Transformer / 大模型基础23. Position Encoding 是什么?有哪些分类?24. 旋转位置编码、绝对位置编码,是直接加到 token embedding 上的吗?25. 相对位置编码呢?比如 RPE 这种,它一般是加到哪里?26. decoder 里面 causal attention 是怎么实现的?F. 手撕:最长不重复子串二、反问1. 部门目前主要负责的业务内容是什么?团队主要在做哪些事情?部门整体是做风控的,负责平台上的各类风险问题。大的方向包括内容风险,比如违规图片、违规文本;也包括用户层面的欺诈、作弊等风险。具体到他们团队,主要做几类事情:一类是机器作弊流量和攻击检测,比如爬虫、自动化攻击、人工获取数据等;一类是人机验证相关能力,比如真人检测、验证码等还有一类是识别图片、文本里隐藏得很深的网址,并判断这些网址的风险,这些网址往往会把用户引到站外赌博、色情等高风险网站。2. 这个岗位平时更 focus 哪些算法领域?更希望候选人掌握哪些知识、算法方向和工程经验?首先还是需要有大模型基础,对大模型的一些基础概念和原理要比较了解。其次,像他们做隐藏网址识别这类任务,如果输入是图片、图文、视频,本质上就是一个 VLM 问题,所以也会希望候选人具备多模态/VLM 方面的理解。还有一块是 Agent,因为他们现在也在探索用 Agent 节省人力、提高效果,所以这方面也有需求。至于为什么会追问 RL,是因为 Agent 往底层看,算法基础还是会和 RL 有关系,所以他们对这方面也是有期待的。3. 这个部门属于哪个业务?是抖音还是 TikTok 相关?会和哪些部门合作?这个部门属于 Data,可以理解成字节的中台部门。风控相关的很多需求会收在他们这里,所以也可以把他们理解成风控中台。抖音和 TikTok 两边的风控中台需求都会提到他们这里,也就是说他们同时支持抖音和 TikTok 这两边的业务。4. 这份实习是日常还是暑期?HC 情况大概怎么样?转正 HC 的情况面试官自己也不太确定,目前应该还没有完全定下来,这块后续可以再和 HR 沟通。实习本身要求至少三个月,团队会更希望实习时间长一点,因为前期熟悉业务和环境本身就要花不少时间,太短的话不利于真正做出产出。5. 团队里做的内容主要是业务算法 / pipeline 搭建,还是也会有研究课题、论文产出的可能?整体还是更偏业务,不太支持以论文为导向的事情。但也不是说让实习生直接上来扛复杂业务指标。通常的做法是从复杂业务问题里,抽取出一个相对独立、偏技术、带一些探索性的点,让同学在这个方向上做出产出。所以更偏“从业务中抽技术问题来做”,而不是纯学术研究。6. 为什么字节有些组会支持论文或者研究产出,但你们组看起来不太支持?是岗位性质不一样吗?这个团队是要为业务结果负责的,所以判断标准首先是对业务有没有帮助。面试官比较直接地表达了他的看法:很多论文并不能真正解决业务问题,甚至会被视为“水论文”。他们并不是完全排斥研究,而是强调如果某个具体业务问题确实值得研究、也确实需要前沿技术去解决,那么可以研究;但最终目标仍然应该是服务业务、能落到线上,而不是为了论文本身去做。7. 这轮面试之后,我大概多久能知道结果?正常情况下大概三天之内会有结果,但最终还是要看后续 HR 推流程的节奏陪一张昨天下午在教室拍的一角夕阳
0 点赞 评论 收藏
分享
算法: 一、算法题 & 代码思路滑动窗口最大值的解题思路是什么?为什么选择使用双端队列?双端队列维护了哪些内容、具备什么性质?口述讲解这道题的整体思路(被judge怀疑写力扣不够多了)八股:二、大大模型模型预训练流程一个开源大模型在预训练过程中会经历哪些步骤?你是从哪些方面、哪些渠道学习并理解这些预训练知识的?(可能这里开始质疑我有点背答案的逻辑了)BERT 和 GPT 架构最核心、最本质的区别是什么?四、简历拷打开始从项目去拷问:你所理解的视频理解是粗粒度总结,还是细粒度描述?能否捕捉动作的开始、过程、结束?固定摄像头场景单一有限,用大模型做事件判断性价比是否不高?简单任务(如闯入检测)是否用小模型、路由、MoE 架构更合适?这种情况下,使用视觉大模型(VLM)的意义在哪里?用大模型做数据预标注,为后续小模型服务,这套思路是否合理?大模型在工业落地中,真正的性价比体现在什么地方?五、反问1,公司业务是否会涉及视频细粒度动作理解?不只是判断 “动作是否发生”,还要精确识别动作发生次数,避免重复扣费、误扣费这类问题。回答:确实有这类细粒度视频理解与识别需求,核心是精准、不重复、不误判。目前业界 / 团队常用方案:用多个专用小模型组合,针对特定任务做定制化小模型。采用 MoE(混合专家模型) 架构,但不是简单路由,路由逻辑需要专门设计,用来解决特定任务。现在也在探索:利用大模型 / 大语言模型的能力,提升复用性,希望换任务也能快速适配,减少重复开发,因此在尝试搭建新架构。2. 关于细粒度视频数据 & 数据集构建训练这些细粒度识别小模型时,数据和标注是怎么获取 / 构建的?回答:采集行业真实数据主要流程:采集行业真实数据 → 交给外包公司标注(YOLO、分割等常规标注)。模型上线部署后,把线上回传的困难样本 / 错误样本再人工补充标注。整体思路:先众包 / 外包大规模标注再人工筛选、修正难例,是业界比较经典的做法。3,面试官一般怎么判断面试者有没有背稿、有没有用辅助工具?回答:看表达一致性真实做过的人,叙述风格、逻辑是统一的;背稿 / 套话,容易在切换问题时风格断裂、内容漂浮。看是否聚焦问题本身真懂的人会顺着问题深入聊;套答案的人容易答非所问、逻辑不连贯。紧张很正常面试少、科研多的同学容易紧张,多面几次就会像日常学术聊天一样自然。建议把面试当成和老师 / 教授学术讨论,懂就说懂,不懂就坦诚,重点看人岗匹配。大概率寄了,就当聊聊天
查看16道真题和解析
0 点赞 评论 收藏
分享
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务