腾讯 TEG AI LAB 大模型一面
面感不错,业务比较匹配。。。没想到现在做拟人对话的这么多。
1.自我介绍
2.详细介绍了商汤实习项目(感觉又被套了方案)
针对项目的一些提问
1.有没有用过 GPT 之类的模型对你们的数据进行打分评价?
2.有没有考虑训练一个奖励模型去评价你们的数据
(感觉可能是他们的一些方案遇到了问题)
3.介绍一下 DPO 和 PPO
4. PPO 有几个模型(4 个,但是我没记起来评论模型,说我想不起来这个名字了,其实具体训练细节也忘记了)
5.DPO的 loss 公式记得吗(确实不记得)
6. rag 和 sft 的区别(这两不是一个维度的啊,就大概讲了一下自己的理解,应该没啥问题)
7.Transformer 结构。(从头到尾仔细说了一遍)
代码题
最长回文子串
反问发现业务几乎一样,难怪项目问那么细致
整体而言就是 RLHF 两个知识点没回答好,感觉问题应该不太大。
1.自我介绍
2.详细介绍了商汤实习项目(感觉又被套了方案)
针对项目的一些提问
1.有没有用过 GPT 之类的模型对你们的数据进行打分评价?
2.有没有考虑训练一个奖励模型去评价你们的数据
(感觉可能是他们的一些方案遇到了问题)
3.介绍一下 DPO 和 PPO
4. PPO 有几个模型(4 个,但是我没记起来评论模型,说我想不起来这个名字了,其实具体训练细节也忘记了)
5.DPO的 loss 公式记得吗(确实不记得)
6. rag 和 sft 的区别(这两不是一个维度的啊,就大概讲了一下自己的理解,应该没啥问题)
7.Transformer 结构。(从头到尾仔细说了一遍)
代码题
最长回文子串
反问发现业务几乎一样,难怪项目问那么细致
整体而言就是 RLHF 两个知识点没回答好,感觉问题应该不太大。
全部评论
佬,有这个hr的联系方式吗
笑死,套方案可还行

佬,你几天被捞的啊
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享