拼多多+虾皮 算法实习生一面

主要是按照简历来问
部分分享:
虾皮:
在做领域数据清洗时有没有自己构建pipeline
垂直领域大模型增量训练的文本长度问题
增量训练有没有做分布式,deepspeed相关的问题
微调时,batch中数据长度不一致如何优化训练速率
代码:
实现梯度累计代码

拼多多:
数据清洗的pipeline
领域模型训练时专有词汇的处理
有没有做过强化学习,dpo训练后有没有看过token的概率分布变化
代码:
旋转二分查找

全部评论

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客企业服务