大模型算法二面分享-快手实习

继续来分享下最近的面经~
1.实习拷打
2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?
3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?
4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?
5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?
6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?
7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?
8.为什么在初筛召回之后,还要加一个Rerank模型?能解决向量搜索哪些局限?
9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?
10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?
11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?
全部评论

相关推荐

📍面试公司:阿里云🕐面试时间:5.14💻面试岗位:JAVA研发❓面试问题:1. 抛开 AI 部分,讲讲整个服务架构是什么样的?包括前端怎么用、后端怎么用、前后端怎么交互?2. Redis 是存短期内容吗?是用于做缓存还是其他用途?3. 了解 Spring Boot 的整个启动原理吗?Spring Boot 打的包结构是怎么样的?服务是怎么启动的?4. 整个项目的代码是自己写的,还是主要由 AI 全部自动生成的?5. 没有 AI 之前,你自己有没有单独搞过纯手搭的项目?6. 两个 AI agent 的主要分工是什么?介绍一下对话 agent 和运维 agent 的核心能力?7. 有没有做多轮循环的控制?如果 agent 一直循环调用工具会怎么处理?8. RAG 的 TOKEN 调优省了 50%,是生成 TOKEN 还是输入 TOKEN?怎么计算的这个数值?做了哪些具体的调优工作?9. 上下文压缩有什么策略?如何避免过滤掉有用信息、留下噪音数据?10. 对于长期有效的信息,会做什么特殊处理把它留存下来吗?11. 平均检索度 80% 以上,有没有自己构建评估集?评估集是怎么处理的?处理了多少数据?12. AI agent 用的哪个大模型来做的?13. 觉得 Claude 好在哪里(从模型本身和 agent 设计两个方面)?对它的 agent 整个运行原理了解吗?14. 从你的角度看,大模型本身重要,还是整个 agent 的架构设计更重要?15. 本地生活服务平台的主要内容有哪些?开发过程中有没有碰到在线问题调试、节点故障之类的问题?16. 假设线上发现内存不停地缓慢增长,不确定是哪行代码出的问题,你会怎么排查?有办法定位到具体代码吗?17. JVM 里面主要的组件有哪些?JVM 的体系了解吗?能讲一下 JVM 的内存模型吗?18. 本地方法栈主要是用于什么用途的?19. 方法区空间出现预警了,最大的可能是什么原因?有办法回收方法区的垃圾吗?运行时怎么处理方法区空间不足的问题?20. 了解 classloader(类加载器)吗?通过 classloader 有办法处理动态类加载过多的问题吗?21. 了解 Tomcat 吗?看过整个设计吗?
查看21道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务