字节实习ai后端开发一面-攒人品

继续来分享下最近的面经~欢迎友好讨论,信息共享
1.实习拷打
2.你知道哪些树结构,它们的时间复杂度是多少
3.操作系统中的栈和数据结构中的栈为什么叫同一个名字
4.对于查多改少的场景,用hashmap还是treemap,查少写多呢
5.hashmap时间复杂度是多少
6.挑个项目讲一下
7.碰到最大的困难是什么
8.索引失效情况
9.问了一下学校情况,有什么感兴趣的课可以分享一下吗
10.手撕 搜索单词
全部评论
ai开发没问agent吗
点赞 回复 分享
发布于 04-08 22:59 辽宁
感谢大佬分享
点赞 回复 分享
发布于 04-08 17:37 北京
攒人品!字节 AI 后端一面考点全,祝二面顺利,offer 到手!
点赞 回复 分享
发布于 04-08 15:09 广东
字节 AI 后端一面面经太实用了!基础 + 项目全覆盖,攒人品必过二面!
点赞 回复 分享
发布于 04-08 15:09 上海

相关推荐

4.8二面 4.14收到感谢信一、项目相关1. 你先做一下自我介绍。2. 你在这个开源社区里贡献了多少代码?3. 你在这个社区里做了多长时间?4. 你喜欢开源吗?为什么?5. 你觉得你一面聊得怎么样?6. 你做过互联网系统吗?比如服务端程序、接口设计、和客户端交互这类。7. 你学过数据库吗?用过数据库吗?8. 你在认证模块里用数据库存了什么?9. 你怎么判断一个 Token 是有效的?10. 密码是前端传过来的吗?前后端传输过程中有没有加密?二、数据库与认证11. 相同密码哈希后结果也相同,如果数据库被脱库,攻击者撞出一个密码后,不就能反推出所有相同哈希值的密码了吗?12. 你了解密码加盐吗?加盐是干什么的?为什么要加盐?13. 你这个盐是什么时候加的?是固定盐还是随机盐?14. 如果 Token 和用户信息存在同一行里,一个用户是不是只能有一个 Token?15. 如果用户在电脑和手机同时登录,想只失效其中一个登录态,应该怎么设计?三、系统设计16. 如果每次校验 Token 都查数据库,像微信这种高并发场景数据库扛得住吗?怎么优化?17. CDN 适合存什么?Redis 应该部署在哪里?四、计算机网络18. HTTPS 是怎么防止中间人攻击的?19. 怎么判断服务端发过来的证书是合法有效的?20. CA 是什么?客户端从哪里拿到 CA 的公钥?21. 每建立一个 HTTPS 连接,都要向互联网请求一次证书吗?证书链是怎么工作的?五、操作系统22. 说一下进程和线程的区别,能有多细说多细。23. 操作系统能感知到协程的存在吗?24. 你写过协程相关的程序吗?六、算法题25. 螺旋数组:按螺旋顺序遍历或填充一个 N×N 的二维数组,N 可以是奇数也可以是偶数。26. 二叉搜索树范围查找:给一个二叉搜索树和区间 [low, high],找出所有值在范围内的节点,并按顺序输出。要求先按非递归实现,后面放宽为递归,并考虑剪枝优化。七、个人相关27. 你觉得你有哪些优点?28. 你觉得自己有哪些需要继续提升的地方?---## 反问环节1. 如果实习生进去的话,主要会负责哪个业务?- 目前很多团队都在招,比如钱包、收银台等,后续会根据面试情况和个人兴趣做分配。钱包侧主要涉及余额、余额明细、转账、提现、充值;收银台侧主要涉及支付方式渲染、支付方式绑定等后台功能。2. 进来以后主要会做分布式业务吗?- 主要还是做后台开发,做互联网后台程序。3. 你觉得我还有哪些地方可以提升?- 如果想进互联网公司,互联网后台相关基础需要系统补一下,比如数据库使用、高并发下的常见处理方式、CDN 的使用场景,以及高并发、数据一致性等常见问题的基本原理和成熟方案。
查看28道真题和解析
点赞 评论 收藏
分享
一、面试问题A. 项目经历与业务理解1. 实习1. 先介绍一下你的这段实习经历。2. 听起来你的工作主要集中在数据/样本构建上,是吗?3. 你这里写了 VQG 和 VQA 一致性评估,这里的“一致性评估”是什么意思?4. 所以你的意思是,让大模型先生成问题,再生成答案,然后看问题和答案是否对得上,是吗?5. 所以最后是不是回答不一致的样本,就说明它比较难?6. 这个项目过程中,你有做过哪些模型方面的工作?2. LLM-as-a-Judge 项目7. 研究生阶段你还有一个 LLM-as-a-Judge 的项目,能大概介绍一下吗?8. 你最后这个总分好不好,是通过一个下游任务来验证的吗?9. 如果我理解得对,就是你打分之后选 Top 20% 的数据去微调,再和随机选 20% 做对比,是这个意思吗?10. 这个事情听起来很像样本选择,甚至有点像强化学习,你有从这个方向考虑过吗?B. 强化学习基础11. 你对强化学习了解吗?系统地学习过一些强化学习的方法吗?12. on-policy 和 off-policy 分别是什么意思?13. importance sampling 是什么?14. DPO 和 PPO 是什么关系?它们有什么区别?C. LoRA / 参数高效微调(这里因为我简历写了一个LoRA所以面试官追着来杀)15. 你在项目里用 BLIP-2 做了 LoRA 微调。LoRA 为什么可以省显存?16. 你虽然加的是一个低秩小矩阵,但不管多小,参数总归是增加了。那为什么在参数增加的情况下,LoRA 反而还能省显存?17. 推理的时候呢?推理阶段用 LoRA 和不用 LoRA,有什么区别?效率上有什么影响?D. 多模态模型 / VLM1. BLIP-2 相关(因为LLM-as-a-Judge里面提到了这个细节)18. 你为什么选择 BLIP-2 做微调?选择 BLIP-2 的考虑是什么?19. BLIP-2 相对于 BLIP 有什么改进?2. VLM 路线理解20. 你对 VLM 这条线还有哪些了解?之前有关注过哪些相关工作?21. Qwen VL 了解吗?22. 相比于 LLaVA,Qwen-VL 有哪些不一样的地方?你有没有了解过?E. Transformer / 大模型基础23. Position Encoding 是什么?有哪些分类?24. 旋转位置编码、绝对位置编码,是直接加到 token embedding 上的吗?25. 相对位置编码呢?比如 RPE 这种,它一般是加到哪里?26. decoder 里面 causal attention 是怎么实现的?F. 手撕:最长不重复子串二、反问1. 部门目前主要负责的业务内容是什么?团队主要在做哪些事情?部门整体是做风控的,负责平台上的各类风险问题。大的方向包括内容风险,比如违规图片、违规文本;也包括用户层面的欺诈、作弊等风险。具体到他们团队,主要做几类事情:一类是机器作弊流量和攻击检测,比如爬虫、自动化攻击、人工获取数据等;一类是人机验证相关能力,比如真人检测、验证码等还有一类是识别图片、文本里隐藏得很深的网址,并判断这些网址的风险,这些网址往往会把用户引到站外赌博、色情等高风险网站。2. 这个岗位平时更 focus 哪些算法领域?更希望候选人掌握哪些知识、算法方向和工程经验?首先还是需要有大模型基础,对大模型的一些基础概念和原理要比较了解。其次,像他们做隐藏网址识别这类任务,如果输入是图片、图文、视频,本质上就是一个 VLM 问题,所以也会希望候选人具备多模态/VLM 方面的理解。还有一块是 Agent,因为他们现在也在探索用 Agent 节省人力、提高效果,所以这方面也有需求。至于为什么会追问 RL,是因为 Agent 往底层看,算法基础还是会和 RL 有关系,所以他们对这方面也是有期待的。3. 这个部门属于哪个业务?是抖音还是 TikTok 相关?会和哪些部门合作?这个部门属于 Data,可以理解成字节的中台部门。风控相关的很多需求会收在他们这里,所以也可以把他们理解成风控中台。抖音和 TikTok 两边的风控中台需求都会提到他们这里,也就是说他们同时支持抖音和 TikTok 这两边的业务。4. 这份实习是日常还是暑期?HC 情况大概怎么样?转正 HC 的情况面试官自己也不太确定,目前应该还没有完全定下来,这块后续可以再和 HR 沟通。实习本身要求至少三个月,团队会更希望实习时间长一点,因为前期熟悉业务和环境本身就要花不少时间,太短的话不利于真正做出产出。5. 团队里做的内容主要是业务算法 / pipeline 搭建,还是也会有研究课题、论文产出的可能?整体还是更偏业务,不太支持以论文为导向的事情。但也不是说让实习生直接上来扛复杂业务指标。通常的做法是从复杂业务问题里,抽取出一个相对独立、偏技术、带一些探索性的点,让同学在这个方向上做出产出。所以更偏“从业务中抽技术问题来做”,而不是纯学术研究。6. 为什么字节有些组会支持论文或者研究产出,但你们组看起来不太支持?是岗位性质不一样吗?这个团队是要为业务结果负责的,所以判断标准首先是对业务有没有帮助。面试官比较直接地表达了他的看法:很多论文并不能真正解决业务问题,甚至会被视为“水论文”。他们并不是完全排斥研究,而是强调如果某个具体业务问题确实值得研究、也确实需要前沿技术去解决,那么可以研究;但最终目标仍然应该是服务业务、能落到线上,而不是为了论文本身去做。7. 这轮面试之后,我大概多久能知道结果?正常情况下大概三天之内会有结果,但最终还是要看后续 HR 推流程的节奏陪一张昨天下午在教室拍的一角夕阳
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务