攒人品中! 1.介绍实习项目中主要负责的工作2.论文拷打3.项目拷打4.讲解原始 RoPE 的原理5.讲解 GRPO 的实现方式6.讲解 PPO 和 DPO 的相关原理7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成8.定义 rag 中召回率的计算和评判标准9.讲解 MHA 中 Q 的定义, Attention 计算过程10.说明 MHA 采用多头设计的原因11.对比 Encoder 和 Decoder 的主要区别12.讲解 MQA 和 GQA 的相关原理13.手撕:最长括号序列