字节春招大模型测开一面面经
面试的是大模型相关测试的部门,题目比较基础,但是牵扯到大模型相关的知识了,全部回答上来了,但是回答的模棱两可(太菜导致的)
1.解释一下 Transformer 的 Encoder 和 Decoder 的区别和分别做什么的?
2为什么模型参数越多,不一定代表单个 Token 推理成本越高呢?
3.为什么 MoE会导致模型参数越多,不一定代表单个 Token 推理成本越高呢?
4.解释一下什么是灾难性遗忘?
5.为什么模型会出现幻觉?
6.Temperature这个参数是干嘛的?
7.Temperature → 0 时还会有幻觉吗?
8.在向量数据库里,两个同义词是什么关系?
9.假如有完全相同意思的词语,会出现在一条线上吗?
10.RAG 的工作流程是什么?
11.从一个 Query 进来开始,完整描述一下 RAG 的流程。
12.如果 RAG 检索到的 Chunk 不足以回答问题,后续会怎么处理?
1.解释一下 Transformer 的 Encoder 和 Decoder 的区别和分别做什么的?
2为什么模型参数越多,不一定代表单个 Token 推理成本越高呢?
3.为什么 MoE会导致模型参数越多,不一定代表单个 Token 推理成本越高呢?
4.解释一下什么是灾难性遗忘?
5.为什么模型会出现幻觉?
6.Temperature这个参数是干嘛的?
7.Temperature → 0 时还会有幻觉吗?
8.在向量数据库里,两个同义词是什么关系?
9.假如有完全相同意思的词语,会出现在一条线上吗?
10.RAG 的工作流程是什么?
11.从一个 Query 进来开始,完整描述一下 RAG 的流程。
12.如果 RAG 检索到的 Chunk 不足以回答问题,后续会怎么处理?
全部评论
佬多久面的
现在还在补录吗
相关推荐
点赞 评论 收藏
分享
查看3道真题和解析 点赞 评论 收藏
分享