rush_32 - 个人主页动态 - 牛客网

今天 05:25

门头沟学院算法工程师

暑期实习-字节推荐算法一面

给我面没招了，发点面经攒攒人品～1.项目拷打2.序列做了什么相关处理3.如果接着做的话，你有什么规划嘛4.对于tokenmixer是怎么理解的，它的收益主要来源于什么，理想的结构是什么第二个项目的消费侧策略的主要做法是什么5.你们场景是如何利用大模型的6.sft是怎么做的，样本是如何挖掘的7.模型的更新频率智力题一个硬币，摇到正面的期望次数是多少连续两次为正面的期望次数是多少八股1.从transformer到现在的大模型有什么变化2.大模型的实践还做过什么实践嘛3.介绍lora解决了什么问题代码auc手撕

0 点赞评论收藏

分享

03-27 16:30

门头沟学院算法工程师

阶跃星辰大模型算法实习一面

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 如何进行混合加训2. 混合加训和 continue sft 你觉得哪个效果好，为什么？3. Sft loss的起点数值和收敛情况。4. 讲解一下 rlvr 使用的策略。5. 训练 1t 模型遇到哪些困难，跟小尺寸模型有什么不同6. Benchmark 测评情况，如何根据 benchmark 进行模型效果优化。手撕：top-p sampling、grpo

查看7道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务