字节应用一面

应该是某部门里的算法团队,有大模型相关的
1.自我介绍
2.项目详细拷打
3.长记忆这块除了 rag,你们有试过长文本模型吗?为什么不好?你们使用的扩充到 32K 的模型还是预训练本身就 32K 的模型?
4.你们记忆检索怎么检索的?有做什么优化吗?
5. 有没有了解过 loss in middle?(应该是这个?应该是说中间的注意下降吧?不是很懂这个原理)
6.DPO PPO 能讲一下它们的区别吗?有没有了解过更前沿的 RLHF?
7.DPO 里你刚刚说的 reject chosen 的 loss 里的概率是怎么计算的知道吗?
8. 简单讲讲 transformer bert 一类的模型的结构吧。
9.attention 公式是什么?为什么要除以根号 dk?
10. 你们模型效果怎么评估?上线有具体准确率之类的要求吗?
11. 安全对齐这块,你们有做样本分布统计吗? 就是具体涉及到哪些类?

代码题最大乘积连续子数组
全部评论
是被捞的还是主动投的呀 等了几天被捞呢
点赞 回复 分享
发布于 2024-09-12 00:26 北京
今天刚通知我这个部门的三面过了 uu反问有仔细问相关业务吗
点赞 回复 分享
发布于 2024-09-11 17:10 美国
蹲一下是不是kpi 我也被捞起来了
点赞 回复 分享
发布于 2024-09-11 16:23 浙江

相关推荐

查看15道真题和解析
点赞 评论 收藏
分享
03-21 04:30
门头沟学院 Java
发点面经攒攒人品~1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?9.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?10.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?11.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?16.针对大规模PDF解析这种任务,你选择多线程还是多进程?17.如何确保Agent返回的结果是标准的JSON格式?如果模型输出中有多余的说明文字,你在后端如何提取?18.场景题:对于RAG,如果检索到了针对同一故障的两份手册,内容相互冲突,请你设计一套逻辑,让模型能够识别冲突并优先选择时效性更高的信息?19.手撕:第k大元素
查看19道真题和解析
点赞 评论 收藏
分享
评论
9
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务