拼多多大模型算法实习一面
给我面没招了,发点面经攒攒人品~
1)介绍一个最能代表自己的项目
2)项目里负责的边界是什么?哪些内容是亲手实现/验证的?
3)电商领域预训练数据:低质过滤与去重会怎么做?用哪些简单指标快速判断数据质量?
4) Pretrain 和 SFT 分别解决什么问题?
5) Transformer 的基本结构怎么理解?
6)多模态模型的大致结构是什么(图像编码器+连接层+ LLM )?最容易踩坑的点通常在哪里?
7) SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
8)对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
1)介绍一个最能代表自己的项目
2)项目里负责的边界是什么?哪些内容是亲手实现/验证的?
3)电商领域预训练数据:低质过滤与去重会怎么做?用哪些简单指标快速判断数据质量?
4) Pretrain 和 SFT 分别解决什么问题?
5) Transformer 的基本结构怎么理解?
6)多模态模型的大致结构是什么(图像编码器+连接层+ LLM )?最容易踩坑的点通常在哪里?
7) SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
8)对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享
03-12 21:22
门头沟学院 Java 从0到java大王:这就是大厂笔试题吗,感觉比平时刷的力扣难,要么是数学题要么是看着比较复杂的题,只会第一道题,第四道题暴力直接超市,二三看了会就放弃了
点赞 评论 收藏
分享