字节风控算法一面面经

4.2 字节一面
1.论文跟实习经历的关系
2.实习中,处理的时序数据都是什么样的数据?信号代表什么?
3.详细介绍一下项目中的技术部分是怎么做的?(基本都是结合论文)
4.做pre-training的时候loss的权重是怎么设计的?
5.简述一下几篇对比学习的工作,介绍一下技术发展脉络?是否了解MoCo?
6.有没有做过大模型微调?LoRA是否了解?为什么可以省显存?
7.Agent项目里用的框架是什么?它是怎么决定自己要做哪一步的?
8.workflow和agent的主要的区别
9.问了几个GRPO的问题
10.讲一下归纳偏置
11.解决模型过拟合的方式
12.transformer里的因果attention怎么实现的
13.介绍一下位置编码?旋转位置编码的作用
14.梯度消失和梯度爆炸的原因?如何解决?
15.手撕:最长无重复子串
#面经#  #字节风控算法#
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 昨天 10:00 广东

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务