1.实习介绍2.transformer计算的时间复杂度和空间复杂度,deepseek对transformer主要做了哪些改进?3.为什么要在推荐系统中引入rqvae?4.如何解决坍缩问题?5.对rankmixer了解吗?介绍一下?6.bn和ln的区别?在什么场景使用?7.如果qk变成同一个矩阵会有影响吗?如果一定要变成同一个矩阵,如何解决影响?8.了解lora吗?9.代码手撕mha10.反问业务,组内也是做llm4rec的二面1.实习项目介绍2.bert的预训练任务是什么?3.详细介绍一下Moe?优缺点各自是啥?4.实习中精排融合公式具体有哪些目标?如果做的多目标融合?5.介绍一下帕累托?6.如何挑选特征?7.你对推荐算法中特征工程的心得有哪些?8.讲一下最近读的论文?大模型的论文有读过吗?9.代码1.实现交叉熵(不愧是字节)2.二叉树的右视图,要求实现列表转二叉树反问作息,组内有哪些方向