字节抖音直播后端一面挂

拷打实习

八股
tcp和udp区别
tcp有什么特点
tcp怎么保证可靠性
udp工作原理
生产者消费者模型
怎么设计一个简单的生产者消费者模型,数据结构应该怎么设计
MySQL和redis怎么做同步
悲观锁会有什么问题
什么是乐观锁
写一个sql的乐观锁
怎么优化一个悲观锁

手撕  反转链表中  left到right 的部分  撕出来了
全部评论
为啥挂了
点赞 回复 分享
发布于 2025-10-23 17:19 湖北
做啥业务的呀
点赞 回复 分享
发布于 2025-10-16 22:27 北京

相关推荐

发一下问题给大家参考,攒攒人品!!!1.项目是基于自己的兴趣,还是follow现成项目2.这个项目是主要是为了解决什么问题3.训练是基于 torch 写的,还是用现有的框架4.保存加载checkpoint怎么实现的5.项目怎么做到能跑起来?遇到什么困难?怎么解决?6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token9.你用什么指标测模型10.Deepspeed11.zero12312.Zero3 是模型并行吗13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少14.Megatron15.8 卡环境下使用Megatron训练时,数据并行度是多少16.训过PPO吗17.PPO 的reward model是怎么训的18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别19.为什么他们是两个极端20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么21.你的PPO 的 critic model 是怎么初始化的22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么23.R和V的关系?Value 函数在估计什么量24.DPO和PPO的关系25.DPO加载几个模型26.DPO的推导27.重要性采样两个pi的比值落实到代码层面是什么计算的28.LLaVA-one-vision、LLaVA-NeXT29.llava怎么实现动态分辨率的30.qwenvl系列是如何实现动态分辨率的31.了解qwenvl系列吗32.qwenvl在旋转位置编码上的改进33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性34.根号dk的作用35.手撕self-attention
点赞 评论 收藏
分享
评论
2
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务