字节Tiktok直播多模态一面 面麻了

发一下问题给大家参考,攒攒人品!!!
1.项目是基于自己的兴趣,还是follow现成项目
2.这个项目是主要是为了解决什么问题
3.训练是基于 torch 写的,还是用现有的框架
4.保存加载checkpoint怎么实现的
5.项目怎么做到能跑起来?遇到什么困难?怎么解决?
6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置
8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token
9.你用什么指标测模型
10.Deepspeed
11.zero123
12.Zero3 是模型并行吗
13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少
14.Megatron
15.8 卡环境下使用Megatron训练时,数据并行度是多少
16.训过PPO吗
17.PPO 的reward model是怎么训的
18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别
19.为什么他们是两个极端
20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么
21.你的PPO 的 critic model 是怎么初始化的
22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么
23.R和V的关系?Value 函数在估计什么量
24.DPO和PPO的关系
25.DPO加载几个模型
26.DPO的推导
27.重要性采样两个pi的比值落实到代码层面是什么计算的
28.LLaVA-one-vision、LLaVA-NeXT
29.llava怎么实现动态分辨率的
30.qwenvl系列是如何实现动态分辨率的
31.了解qwenvl系列吗
32.qwenvl在旋转位置编码上的改进
33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性
34.根号dk的作用
35.手撕self-attention
全部评论
这么难吗
点赞 回复 分享
发布于 02-10 22:26 广东

相关推荐

不愿透露姓名的神秘牛友
05-13 16:09
我入职那天分到的mentor是个工作三年的哥们儿,外号杰哥,浙大本硕,技术贼好,人也特别耐心。第一周他手把手带我熟悉项目,下班还带我去公司食堂吃晚饭,跟我讲组里的人际关系、哪个产品好沟通、哪个测试爱挑刺。我当时心里那个踏实啊,心想这mentor是真带我,运气真好。我甚至已经开始幻想转正后跟着他干。周一下午四点多,我正在改一个特别恶心的bug,他飞书突然发我:"小x,跟你说个事儿,我下周一是最后一天,我跳槽了,你之后跟着王哥学。"我当时直接回复了“????”真的以为他在开玩笑。他发了一个尴尬笑的表情,"真的,offer上个月就拿了,一直没说"。我那一瞬间真的不知道说啥。下班的时候我特意去他工位转了一圈,他已经在收拾东西来,看见我笑了一下,说"我请你吃个饭吧"。我们去了公司楼下的麻辣烫。吃饭的时候他跟我说了很多,说大厂这边晋升路径太卷,说他家在外地啊老婆怀孕了啊想离家近点什么的,说新公司虽然小但是给的钱多。我一边吃一边点头,看到一个快到中年研发人的无奈,感觉也看到了未来的我,心里挺不是滋味的。今早上午他飞书里发我一个文档链接,是他这两年攒的项目笔记,模块分工、踩过的坑、谁负责啥都有。他说"这个你留着,遇到问题先看这个再找王哥吧"。说实话,我当时贼感动,工作的这两周,他可能是我在公司里唯一真正把我当回事儿的人了。最后,我想说兄弟们,找实习真的别只看大厂光环,mentor稳定性也是玄学之一。我现在心里有点空,感觉靠山没了
鹿LF:你mt不是才工作三年吗,怎么就中年研发人了
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务