2024-09-15 13:40 已编辑中山大学算法工程师发布于广东

关注

滴滴大模型面经

本人只做点业务数据sft, 做的更加偏向于粗糙业务，直接被拷打麻了，望佬看到可以给我指点一下

1. 现在有一个非常完备的sft指令集，你只能选择1w条，你如何选择数据来使模型的能力更加提升+完备？
2.我们知道sft的时候尽量不要注入知识给模型，因为只希望sft可以提升模型的指令遵循的能力，注入知识的话，可能会导致后面使用的时候模型容易出现幻觉，那我们怎么确保自己选择的这1w条数据没注入知识给模型呢？
3.7b和13b模型微调同一批数据，学习率哪个大？
4. Pretrain/sft/ppo学习率怎么变换？
5. 学习率和batch大小变化一致吗？
6. 做表征学习的时候，模型坍塌的原因？
7. 为什么做rm的时候，用不同的小模型大模型来采样生成后训练出来的rm会比以前那种方法奏效？这很反直觉，因为按照直觉来说的话，这种方式可能会让rm偏向某个权威的模型
8. 现在有很多种方法，有做完pt直接做rlhf的，也有按班就步的pt-sft-rlhf的，还有直接不做rlhf的，你觉得为什么这些方法都有效，你觉得是什么原因造成的？

#滴滴##秋招##面经# #算法# #八股#

全部评论

推荐最新楼层

河北师范大学附属中学自然语言处理

搞这么细啊。有些答案可以去llama3.1的技术报告参考，其他的等大佬回答

6 回复分享

发布于 2024-09-14 15:37 陕西

牛客344243631号

门头沟学院算法工程师

通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍，学习率对应扩大2倍即可。

4 回复分享

发布于 2024-09-14 20:40 辽宁

temu一号内tui官

拼多多集团-PDD_算法工程师

对TEMU有想法的戳我哈

1 回复分享

发布于 2024-09-22 15:45 上海

门头沟学院算法工程师

佬这是几面啊，滴滴是连着面吗🙌

1 回复分享

发布于 2024-09-15 01:15 广东

算法工程师

蹲蹲答案

1 回复分享

发布于 2024-09-14 18:14 美国

生产日期是今天

门头沟学院算法工程师

蹲蹲答案

点赞回复分享

发布于 2024-10-03 00:59 安徽

temu一号内tui官

拼多多集团-PDD_算法工程师

我们这大模型搜推方向来试试嘛

点赞回复分享

发布于 2024-09-23 16:04 上海

09-24 17:30

门头沟学院客户端其它

小红书挂了

小红书二面挂了，可惜了，原以为十拿九稳呢二面面完说我希望很大，三天之内给我答复结果一周之后给我挂了。。。。

点赞评论收藏

分享

09-21 21:08

门头沟学院测试开发

字节测开凉经

自己投的硬件岗位全给我挂了 发配测开 测开是关于ai 移动os相关（零了解）面试时间：70min手撕代码：贪心算法（数字组合与边界约束，字符串处理）基本上做出来了 有点小瑕疵 面试官提醒了并给出测试思路问了实习关于自动化测试的部分 我熟悉的只有接口自动化八股：1. http和https的区别？2. mysql索引3. redis测试：1. 如何保证线上质量？2. 完整的软件测试包括什么？面试感受：淡淡的死感 明明知道不匹配的岗位 还是去面了 意料之中的不行 安卓人配安卓岗位

查看4道真题和解析

点赞评论收藏

分享

08-14 20:53

The University of New South Wales 营销

百度面试完

有人知道这个叹号是面试挂了吗？还是什么情况呀

牛客59824974...：是的，感叹号就是挂了

点赞评论收藏

分享

08-05 18:14

门头沟学院 Java

小鹏简历挂

听说是学历厂，咋还挂简历了

小花的沉默：是学历厂没错啊，学历太高了不要

投递小鹏汽车等公司10个岗位

点赞评论收藏

分享

09-23 17:20

武汉大学 golang

无缘海康威视

笑死，面试让我写代码那题目给我搞蒙了 啥也没写出来 算了 拜拜就拜拜，无缘海康威视

点赞评论收藏

分享

评论

23

93

招聘动态

滴滴

2026届秋季校招

人保科技

2026届校园招聘

奇安信26秋招

AI×安全，破解网络暗战

猿辅导小猿AI智能硬件

2026届校园招聘

FunPlus | 趣加游戏

2026届校园招聘

理想汽车

2026届校园招聘

平安产险科技中心

2026届校园招聘

金蝶

2026届校园招聘

厦门银行

2026届秋季校园招聘

顺丰集团

2026届校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 国企秋招，你投了吗？ #

18432次浏览 157人参与

# 应届生第一份工作最好去大厂吗？ #

23751次浏览 463人参与

# 乐堡互娱校招 #

28492次浏览 254人参与

# 你在职场中沾染到的“坏”习惯 #

14787次浏览 119人参与

# 机械人，你最希望上岸的公司是？ #

184233次浏览 1899人参与

# 拿到offer之后，可以做些什么 #

32330次浏览 192人参与

# 携程求职进展汇总 #

620008次浏览 4557人参与

# 海尔求职进展汇总 #

8239次浏览 35人参与

# 你会为了工作牺牲生活吗？ #

43859次浏览 348人参与

# 机械只有转码才有出路吗？ #

140379次浏览 1629人参与

# 通信硬件岗投递时间线 #

25805次浏览 88人参与

# 贝壳求职进展汇总 #

28643次浏览 162人参与

# 央国企投递记录 #

111902次浏览 1451人参与

# 互联网回暖，腾讯要招5000人！ #

21610次浏览 584人参与

# 入职跑路最快的一次经历 #

32263次浏览 213人参与

# 机械求职避坑tips #

64935次浏览 441人参与

# 硬件开发岗知多少 #

17479次浏览 124人参与

# ___岗狗都不干，我干！ #

17664次浏览 121人参与

# 为什么国企只招应届生 #

201064次浏览 1223人参与

# kpi面有什么特征 #

79235次浏览 463人参与

# 校招谈薪技巧 #

47290次浏览 677人参与

# 歌尔求职进展汇总 #

65967次浏览 352人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务