8.28 更新,反手给我挂了最正常的一集自我介绍问实习,讲了一下实习的活。然后一点简单的LLM八股。微调了解吗?我说会一点理论。问经典的微调算法,我说LoRA,p-tuning。让我讲一下LoRA,就大概讲了一下原理。问我实操过吗,我说玩过demo。问我调参怎么做,我说不会,因为没业务实操过。问了微调和RAG的区别,稍微讲了一下。问RL了解吗,我说了解理论。问了DPO,讲了一下原理。问公式,我说忘了,就说了winner,loser和参考策略作比做差然后最大化。问幻觉怎么处理,昨天虾皮问了,后来又回味了一下,今天答的也算有的放矢。问Transfromer,讲了一下原始论文架构。问attention score 公式,还有为什么除以根号d(感谢虾皮面试官给我讲了一下),然后就说了一下。问为什么现在都是主流的 Decoder only,我说主要是生成任务是主流。又讲了一下别的架构和适配的任务。问我刷题多吗,我说就刷了一些基本的。手撕最长无重复子串,写了一下,第一遍没跑通。面试官说你看看while条件呢,我一看,手滑写错了,改了就好了。