搜广推算法实习一面-快手
攒人品中!
1.介绍实习项目中主要负责的工作
2.论文拷打
3.项目拷打
4.讲解原始 RoPE 的原理
5.讲解 GRPO 的实现方式
6.讲解 PPO 和 DPO 的相关原理
7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成
8.定义 rag 中召回率的计算和评判标准
9.讲解 MHA 中 Q 的定义, Attention 计算过程
10.说明 MHA 采用多头设计的原因
11.对比 Encoder 和 Decoder 的主要区别
12.讲解 MQA 和 GQA 的相关原理
13.手撕:最长括号序列
1.介绍实习项目中主要负责的工作
2.论文拷打
3.项目拷打
4.讲解原始 RoPE 的原理
5.讲解 GRPO 的实现方式
6.讲解 PPO 和 DPO 的相关原理
7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成
8.定义 rag 中召回率的计算和评判标准
9.讲解 MHA 中 Q 的定义, Attention 计算过程
10.说明 MHA 采用多头设计的原因
11.对比 Encoder 和 Decoder 的主要区别
12.讲解 MQA 和 GQA 的相关原理
13.手撕:最长括号序列
全部评论
相关推荐
点赞 评论 收藏
分享

