自我介绍问硕士项目transformer网络架构decoder中qkv分别是什么,与encoder的区别gpt的训练过程,预训练的loss是什么,数据长什么样,微调loss,数据,强化学习loss,数据(被拷打成2b了)强化学习算法有哪些ppo训练中有几个模型,reward模型和critic模型的作用,四个模型中哪个最重要上下文工程和提示词工程和rag和mcp的关系rag怎么实现的,向量的索引有哪些方法构建的做过agent吗kafka partition和consumer group的底层实现原理怎么实现不丢不重消费者如果一个消息正在处理,机器突然重启了会怎么样。如果处理了一半,一些状态已经被...