昆仑天工大模型二面

1. 自我介绍
2.项目介绍
3. 你的项目有用到很多微调方式,能给我解释一下吗?(lora pv2 prompt tuning 等)
4. 能详细介绍一下 Transformer 结构吗?
5. bert 在训练的时候, 如果一个 batch size 的内容长度不一样, 这个怎么解决?(我说的加 padding token)
6. 那加 padding token 会不会对计算结果有影响?
(反应了很久没理解问题, 我就说从预训练一开始就这样,应该不会影响的 ,相当于 pad token 这块都是-100 不计算 loss)
7. 这个 loss 是什么 交叉熵
还有几个提问给忘记了

做了一道 mid 难度的 dp 题,1-26 对应 a 到 z,给一个 nums 字符串,有多少种转换方式。 
第一次写没考虑 0, 他给的 case 没过,改了一下。
全部评论
佬!想问一下一面之后多久给二面通知啊焦急等待中
点赞 回复 分享
发布于 02-09 10:07 湖北
兄弟真的猛,我面了几家已经累得不行了
点赞 回复 分享
发布于 2024-04-10 13:30 北京
过几天也要面了,纯靠看你的面经过活了哥
点赞 回复 分享
发布于 2024-03-26 20:51 北京
老哥是开发转大模型了吗,之前的实习经历不是可惜了吗
点赞 回复 分享
发布于 2024-03-11 12:29 陕西

相关推荐

07-23 14:04
东北大学 C++
既然这样,为什么不点击就送呢
牛马88号:因为你合适。但有很多笔试就挂了、通过了再排序的
点赞 评论 收藏
分享
06-19 19:06
门头沟学院 Java
码农索隆:别去东软,真学不到东西,真事
点赞 评论 收藏
分享
评论
5
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务