网易互娱 AI 算法一面
网易互娱 NLP 吧,没写代码,纯纯项目八股,喉咙冒烟。
1.自我介绍
2.蚂蚁实习
问了一下项目的联邦学习 梯度攻击思路
用了哪些 peft 微调?介绍一下
有没有了解过 Qlora?他具体是怎么量化的?(不太清楚)
3.商汤实习
除了 sft 还用过什么对齐手段吗?
PPO 和 DPO 的区别讲一下?了解新的一些 RLHF 吗?KTO 啥的。(不太了解了)
线上模型是怎么评测的?涉及到人工你们是怎么做的?
4.八股
transformer 的位置编码是怎么样的形式?
还了解哪些新的位置编码?
能介绍一下 self attention 吗?
为什么要除以根号 dk?
MHA MQA GQA 了解吗?讲一下
你知道 transformer 原始的 FFN 是什么结构吗?
你知道 transformer 的 Norm 怎么做的吗?
现在大模型一般用什么 Norm?
反问
还有很多忘记了,反正就纯聊
1.自我介绍
2.蚂蚁实习
问了一下项目的联邦学习 梯度攻击思路
用了哪些 peft 微调?介绍一下
有没有了解过 Qlora?他具体是怎么量化的?(不太清楚)
3.商汤实习
除了 sft 还用过什么对齐手段吗?
PPO 和 DPO 的区别讲一下?了解新的一些 RLHF 吗?KTO 啥的。(不太了解了)
线上模型是怎么评测的?涉及到人工你们是怎么做的?
4.八股
transformer 的位置编码是怎么样的形式?
还了解哪些新的位置编码?
能介绍一下 self attention 吗?
为什么要除以根号 dk?
MHA MQA GQA 了解吗?讲一下
你知道 transformer 原始的 FFN 是什么结构吗?
你知道 transformer 的 Norm 怎么做的吗?
现在大模型一般用什么 Norm?
反问
还有很多忘记了,反正就纯聊
全部评论
他这三面后就没信了 是统一跑池子吗
佬,有后续吗?手撕是后面几次面试手撕吗?
佬约二面了吗 为啥问了这么多八股呀 我也是这个岗基本上都在问实习,上周面的还没有消息
请问投递多久约面的呢

佬,求问base是广州还是杭州
相关推荐

点赞 评论 收藏
分享
点赞 评论 收藏
分享

点赞 评论 收藏
分享
点赞 评论 收藏
分享