快手实习 大模型二面 技术拷打

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1、实习经历深挖
2、是否有进行消融实验来验证效果?
3、lora核心思想
4、论文深挖
5.、为什么现在mlp的激活函数都用relu 为什么不用sigmoid/Tanh ? 6、 怎么能把序关系学得更好  7、AUC 、回归类AUC 物理含义和计算方式  8、Loss乘10和学习率乘10之间有什么区别
无手撕
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务