番茄大模型暑期实习面经
1. 自我介绍
2. 详细讲一下实习业务,亮点在哪里,提升在哪里
3.介绍一下双塔模型
4.训练双塔模型时,怎么处理正负样本不均衡。欠采样的方法有哪些
5. 介绍一下常用于推荐的序列模型
6.Transformer用的归一化函数?
7.为什么语言模型不能使用batch norm?Batch norm和Layer norm的区别是什么?
8. Transfomer能用来作为序列模型吗? 但是为什么transfomer不常用于精排呢?
9. Transformer和din的参数差异,计算复杂度的区别?
10. 介绍一下传统序列模型和transformer的区别?
代码:一道hard的动态规划
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2. 详细讲一下实习业务,亮点在哪里,提升在哪里
3.介绍一下双塔模型
4.训练双塔模型时,怎么处理正负样本不均衡。欠采样的方法有哪些
5. 介绍一下常用于推荐的序列模型
6.Transformer用的归一化函数?
7.为什么语言模型不能使用batch norm?Batch norm和Layer norm的区别是什么?
8. Transfomer能用来作为序列模型吗? 但是为什么transfomer不常用于精排呢?
9. Transformer和din的参数差异,计算复杂度的区别?
10. 介绍一下传统序列模型和transformer的区别?
代码:一道hard的动态规划
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享