发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.主页精排模型的序列如何建模的3.主页精排模型的样本是如何组织的,listwise和user level有什么区别4.你迭代模型的最终版本的结构5.tokenmixer上线了吗,没有收益的原因是为什么6.介绍tokenmixer的结构7.什么情况下tokenmixer会比mmcn、dcn有效;8.为什么数据量足够的情况下,同参数量的情况下,tokenmixer的效果要更好;为什么tokenmixer的效率更好9.八股提问1.介绍几个序列建模的方法2.din和transformer的各自的优势是什么,他们建模的本质差别是什么,他们的qkv有什么区别3.transformer对序列建模具体是怎么做的4.din的qkv和transformer的qkv都是从什么输入得到的5.长序列直接入图的方法有什么,直接用transformer建模有什么问题6.有什么降低时间复杂度的方法7.线性注意力具体是什么方法,还有什么把注意力复杂度从平方减到线性的方法手撕写一个tokenmixer得到最后的output怎么用,mean_pooling和sum_pooling有什么区别pffn具体如何实现,mixup具体如何实现