字节搜推大模型实习面经 攒人品

1.主流的开源大模型结构有哪些?
2.介绍一下layernorm和batchnorm的区别?
3.在机器学习里,怎么处理长尾数据和多峰数据?
4.怎么解决模型的冷启动问题,你觉得LLM在冷启动方面能够起到什么作用?
5.介绍一下常见的优化算法优缺点
6.为什么Adam不一定最优而SGD最优的?怎么理解分析?
7.你工作里的对比损失是怎么构造的,有什么作用?介绍常见的对比损失的公式。
代码题:
数组第K大。给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。
全部评论
手撕这个太经典了
点赞 回复 分享
发布于 02-14 10:51 江西

相关推荐

淘天搜推团队的AI应用算法工程师实习岗,整整115分钟,是我面试以来时间最长的一场。整体分为五个环节:① 自我介绍(面试官也同步介绍了搜推团队的业务)② 大模型基础知识问答(30分钟)③ 项目深挖(40分钟)④ AI Coding笔试(30分钟)⑤ 反问环节(10分钟)技术问答和项目深挖尤其硬核,面试官会顺着你说的方向一直往下追问。提问:大模型基础:- Attention的QKV怎么计算,WQ/WK/WV的形状- MOE的路由机制,稀疏vs稠密的区别- KV Cache在prefill和decoding阶段的读写差异- 大模型幻觉怎么规避- 微调后出现复读机,怎么排查- SFT够用 vs 必须上DPO/RL,怎么判断- DPO损失函数的潜在问题- KL散度在模型对齐里的作用还问到了Google的TurboQuant KV Cache,这块我确实不太了解,如实说了🫠深挖了项目,简历上的两个项目都被追问得很细。建议:简历上写的每一个点都可能被问到底层逻辑,提前想清楚“为什么这么做”。AI Coding笔试第一次遇到这种形式——不是自己闷头写代码,而是和AI协作完成一道设计题。面试官说“过程比结果更重要”,让我松了一口气。我的做法是:先让AI输出整体技术方案,确认思路后,再开多个会话并行处理各模块。笔试环境有点卡,但稳住心态、把思路讲清楚就好。整体感受:115分钟对我来说确实是新纪录,中途压力不小。但面试官整体很专业,不刁难,追问都是顺着你的思路往下挖。发个面经攒攒人品,希望能过🙏
查看10道真题和解析
点赞 评论 收藏
分享
题目是实现一个带 TUI 的命令行视频剪辑工具。核心要求有三点:能应对真实输入,稳定运行不崩交互流程清晰,用户知道下一步该干什么输出结果可验证、可复现,不能随缘素材放在 video_res/ 目录下。需要注意:里面的视频格式不统一,有不同容器(MP4、MOV 等)和编码格式(H.264、H.265 等),甚至可能混了异常文件。所以工具必须考虑兼容性,不能假设所有素材都是标准 MP4。必做功能要求1. TUI 交互(核心)需要实现四个基本操作:浏览素材列表(能看到有哪些视频可用)设置切分区间(比如只保留 00:30 到 01:20 这一段)调整片段顺序(多个片段可以重新排序后再合成)执行导出 + 展示结果(导出完告诉用户成功了还是失败了)2. 剪辑与合成单个视频能切分(取其中一段)多个视频能拼接到一起(比如 A 的前半段 + B 的后半段)输出常见的可播放格式(MP4 最稳妥)3. 错误处理用户输入非法(比如时间输成负数、选了不存在的文件)必须明确提示禁止静默失败——出了错就要让用户知道,不能偷偷崩掉约束条件:所有交互提示要面向普通用户,别直接抛底层报错(比如 "FFmpeg returned code -2" 这种)。用户看不懂,等于没提示。必做验收方式需要自己设计验证方案,至少覆盖四点:基础功能对不对(切分、拼接能不能正常工作)正常输入能跑通(给标准素材,按标准操作走一遍)异常输入要能扛住(给损坏的视频、不存在的文件、乱输参数)连续执行要稳定(跑一次没问题,连续跑十次会不会崩)交付物清单源码 + 启动命令(比如 ./run.sh 或者 python main.py)使用说明(关键操作怎么用、参数什么意思)示例输入与输出结果(别人照着做能复现)验证证明(场景描述、执行命令、结果摘要)已知限制与优化方向(坦诚交代哪里没做好、后续怎么改进)加分项如果必做做完了还有时间,可以考虑:时间线/片段预览能力:不只是一个列表,能让用户看到片段顺序、时长、大概位置任务队列与取消机制:导出可能需要时间,用户可以排队多个任务,也能中途取消可配置导出参数:码率、分辨率、帧率这些用户可以自己调,而不是写死在代码里一点思路分享拿到题目后,建议先别急着写代码。用模型帮你把必做功能拆成最小的 MVP 模块,比如:先实现素材目录扫描和列表展示再实现单个视频切分导出然后实现多视频拼接最后把 TUI 交互串起来加分项最后再做,而且尽量不破坏基础功能的代码结构。验收的时候,建议按题目要求的四点(正确性、兼容性、鲁棒性、稳定性)逐个跑一遍,截图或录屏留证,最后整理到验证证明里。另外注意素材目录里可能有异常文件,你的工具遇到这种情况不能崩,至少要提示“该文件无法处理”然后继续让用户操作其他素材。
查看17道真题和解析
点赞 评论 收藏
分享
评论
5
24
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务