字节春招大模型测开一面面经

面试的是大模型相关测试的部门,题目比较基础,但是牵扯到大模型相关的知识了,全部回答上来了,但是回答的模棱两可(太菜导致的)
1.解释一下 Transformer 的 Encoder 和 Decoder 的区别和分别做什么的?
2为什么模型参数越多,不一定代表单个 Token 推理成本越高呢?
3.为什么 MoE会导致模型参数越多,不一定代表单个 Token 推理成本越高呢?
4.解释一下什么是灾难性遗忘?
5.为什么模型会出现幻觉?
6.Temperature这个参数是干嘛的?
7.Temperature → 0 时还会有幻觉吗?
8.在向量数据库里,两个同义词是什么关系?
9.假如有完全相同意思的词语,会出现在一条线上吗?
10.RAG 的工作流程是什么?
11.从一个 Query 进来开始,完整描述一下 RAG 的流程。
12.如果 RAG 检索到的 Chunk 不足以回答问题,后续会怎么处理?
全部评论
佬多久面的现在还在补录吗
点赞 回复 分享
发布于 05-14 13:47 辽宁

相关推荐

1.自我介绍2.讲一下你实习期间的成果或者说你干了什么3.讲一下分布式锁的原理4.讲一下为什么可以保证原子性5.讲一下你关于redis锁的种类了解6.将你的你的key是怎设计防止的redis没有事务(我说我将两个key和成了一个,将时间戳作为值)(用值的逻辑过期和key的过期处理两个过期)7.讲一下你的用户注册和登录模块的总体设计以及流程8.讲一下jwt的原理以及你是怎么使用这个token的9.讲一下你认为你的项目不足的地方10.我说的是双token这一块,然后就这这一点展开无限追问(我打的不好,但是面试官很认可,他不认可在他觉得这个肯定要上线,但是我说没上线,但是他说我的思路和逻辑很好)11.讲一下你是怎么防止的灰产12.将一下hppts和http的区别13.讲一下https的连接过程14.讲一下udp和tcp的区别15.讲一下udp和tcp的适用地方16.讲一下你从输入一个网址到前端完成渲染的全部流程17.讲一下mysql的索引是什么,干什么用的18.讲一下全表查一定比用索引查慢吗19.不记得了,忘记录屏了20.手撕,找到最长回文子串21.反问22.你如何设计微信红包的测试用例,越多越好23.为什么要满足最左前缀原则24.Arraysllist和LinkedList区别25.HashMap和HashTable区别26.重载和重写区别27.讲一下需求到上线的全流程,每一个环节各个岗位在干什么28.讲一下你为什么相干测试
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务