【实习】字节-算法-CMPT

上一周字节hr突然打电话捞人面试,没仔细问什么岗位然后就开始面了,最后反问才知道是广告,做cv的cv的简历一下被挂,只有面些其他岗位。
1.自我介绍
2.项目背景,最终是否落地?
3.项目过程当中做的比较好的有哪些?
4.inpainting模型的原理,如何用的mask实现
5.图像擦除如何实现,对商品图擦除
6.图像当中比较常见的损失函数,分类,cross entropy,triplet loss,以及一些逐帧生成类,直接均方误差
7.如何避免个人lora和模板lora之间的影响,lora融合过程,底层的原理
8.八股,attention,attention计算,cross attention
9.coding 接雨水,.拓展 二维接雨水
10.反问,做什么业务,广告
全部评论
一样貌似三四月份投递的现在被捞起来了,还没闹明白这岗位是干什么的
1 回复 分享
发布于 2024-07-24 17:08 上海
字节这段时间疯狂kpi面
点赞 回复 分享
发布于 2024-08-03 20:46 辽宁
三十分钟,没代码,纯kpi面
点赞 回复 分享
发布于 2024-08-01 12:41 广东
请问一下过了么?
点赞 回复 分享
发布于 2024-07-30 13:52 北京
考虑我司么
点赞 回复 分享
发布于 2024-07-25 17:32 上海
佬,一样,私你了
点赞 回复 分享
发布于 2024-07-24 11:03 浙江
请问CMPT是啥意思
点赞 回复 分享
发布于 2024-07-24 10:21 上海

相关推荐

给我面没招了,发点面经攒攒人品~1*当大模型产生错误回答或幻觉时,在工程和算法层面有哪些规避手段?2* 描述 Transformer Decoder 的完整解码流程。3* KL 散度的数学意义是什么?在模型对齐(如 PPO/DPO)中起什么作用?4* MoE架构的具体实现原理是什么?路由(Router)是如何工作的?5* 面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?6* BM25 算法的数学原理是什么?它相比于简单的 TF-IDF 有哪些改进?7* Agent 系统中的LangGraph是如何搭建的?其 Memory 组件的工作机制是怎样的?8* 如果单次生成的任务量远大于模型的 Max Tokens 限制,如何实现断点继续生成?9* Transformer 中 Attention 的本质是什么?请从数学角度解释。10* 为什么在计算 Attention 时需要进行Scaling11* Self-Attention 和 Cross-Attention 在作用和输入来源上有什么区别?12* 面对极长序列Attention 的 O(L^2) 复杂度问题目前有哪些主流解决方案?13* 在 Agent 多轮对话任务中,Attention 机制的局限性体现在哪些方面?14* 为什么模型在长上下文对话中容易出现“信息遗忘”?有哪些缓解机制?15* 介绍 SFT的流程,以及如何构建高质量、多样化的数据集?16* 在什么业务场景下,必须引入 RLHF 或 DPO 这种偏好对齐技术?17* MinerU 在解析复杂的工业文档(如图文混排)时,具体的处理逻辑是怎样的?18* 在多模态检索中,文本和图片是如何映射到同一个统一向量空间的?19* Ragas 评测框架中的 Faithfulness 和 Answer Relevance 指标的具体计算逻辑是什么?20* 相比于 LangChain,LangGraph 在处理循环任务和状态管理上有哪些优势?21* LangGraph 的状态快照机制是如何实现任务回溯和持久化的?
点赞 评论 收藏
分享
评论
4
22
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务