8.27 钉钉一面
8.28 更新,反手给我挂了
最正常的一集
自我介绍
问实习,讲了一下实习的活。
然后一点简单的LLM八股。
微调了解吗?我说会一点理论。
问经典的微调算法,我说LoRA,p-tuning。让我讲一下LoRA,就大概讲了一下原理。
问我实操过吗,我说玩过demo。问我调参怎么做,我说不会,因为没业务实操过。
问了微调和RAG的区别,稍微讲了一下。
问RL了解吗,我说了解理论。问了DPO,讲了一下原理。问公式,我说忘了,就说了winner,loser和参考策略作比做差然后最大化。
问幻觉怎么处理,昨天虾皮问了,后来又回味了一下,今天答的也算有的放矢。
问Transfromer,讲了一下原始论文架构。问attention score 公式,还有为什么除以根号d(感谢虾皮面试官给我讲了一下),然后就说了一下。
问为什么现在都是主流的 Decoder only,我说主要是生成任务是主流。又讲了一下别的架构和适配的任务。
问我刷题多吗,我说就刷了一些基本的。
手撕最长无重复子串,写了一下,第一遍没跑通。
面试官说你看看while条件呢,我一看,手滑写错了,改了就好了。
#秋招笔面试记录#
最正常的一集
自我介绍
问实习,讲了一下实习的活。
然后一点简单的LLM八股。
微调了解吗?我说会一点理论。
问经典的微调算法,我说LoRA,p-tuning。让我讲一下LoRA,就大概讲了一下原理。
问我实操过吗,我说玩过demo。问我调参怎么做,我说不会,因为没业务实操过。
问了微调和RAG的区别,稍微讲了一下。
问RL了解吗,我说了解理论。问了DPO,讲了一下原理。问公式,我说忘了,就说了winner,loser和参考策略作比做差然后最大化。
问幻觉怎么处理,昨天虾皮问了,后来又回味了一下,今天答的也算有的放矢。
问Transfromer,讲了一下原始论文架构。问attention score 公式,还有为什么除以根号d(感谢虾皮面试官给我讲了一下),然后就说了一下。
问为什么现在都是主流的 Decoder only,我说主要是生成任务是主流。又讲了一下别的架构和适配的任务。
问我刷题多吗,我说就刷了一些基本的。
手撕最长无重复子串,写了一下,第一遍没跑通。
面试官说你看看while条件呢,我一看,手滑写错了,改了就好了。
#秋招笔面试记录#
全部评论
相关推荐