快手 大模型应用一面 实习面经

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
 项目
1. 简单介绍一下这个系统的知识库问答架构,从文档入库到最后回答的完整链路是怎样的?
2. 向量检索用的是什么索引类型?
3. 在召回之后有没有做重排(Rerank)之类的操作?
4. 你知识库的准确率和召回率是怎么评估的?
5. Spring AI Alibaba 的 Function Calling 是怎么实现的?模型如何决定调用哪个工具?
6. 如果工具调用失败了,你们设计了什么处理机制?
7. Execute Plan 模式具体是怎么实现的?
8. 平时哪种模型用的比较多?
9. 平时编码时会用哪些模型?
10. 在选择向量数据库时,有没有看过其他的(如 ES、Milvus 以外的选择)?它们之间的区别你大概有概念吗?
11. 在写 Prompt的时候,你有哪些实践经验或设计原则?
12. Graph Rag / Agentic Rag了解过吗
13. 在秒杀下单中,Lua 脚本具体做了什么?为什么要用 Lua,而不是分开执行多条指令?
14. 这个项目你自己做过压测吗?
15. 对系统能扛住的流量(QPS)有没有具体的概念?
16. 对于什么时候该上缓存、什么时候该上本地缓存,你大概的概念是什么
Java 基础
1. 线程池的核心参数有哪些?
2. 线程池内部的具体工作流程是怎样的?
3. 核心线程数和最大线程数一般怎么确定/计算?
场景题
1. 你觉得目前 RAG(检索增强生成)最大的瓶颈是什么?
2. 假设要给电商平台搭建一个百万/千万级的商品知识库问答系统,你会怎么设计?
3. 针对商品信息(如价格、描述)可能被商家动态更新的情况,你的知识库设计需要考虑什么?
手撕:
二叉树的层序遍历
全部评论
问题还是比较基础的
点赞 回复 分享
发布于 03-19 11:46 四川

相关推荐

05-11 10:12
已编辑
蚌埠坦克学院 Java
📍面试公司:快手🕐面试时间:03/13💻面试岗位:java❓面试问题1. 可以做个简单的自我介绍。2. 问毕业时间3. 问实习地点4. 以后预期是在北京工作吗?5. 你比较熟悉的是哪个项目?6. 列一下你比较熟悉的一个项目的表名、索引、设计用意。7. 为什么这两个表要分开?8. 有没有可能没有user表的时候有user_info表?9. 这两表的数据怎么生成的?从哪来的?10. 注册的时候会怎么做?操作两个表吗?11. 他可以不可以不绑定微信号?12. 那他可以不可以不填nickname和name?13. 所以你这个user_info表其实不能脱离user表存在,是不是?14. 那种表在数据库设计里面它叫什么?15. E-R两个字还记得吗?是什么的缩写?16. 你的user表为什么需要有个ID字段?17. 为什么不可以让user_info表里面有一个字段是user的ID?关联关系为什么反过来?18. 两个表互相关联是最好的吗?你觉得哪种方式最好?19. 那还需要ID这个字段吗?为什么选这种方案而不选你原来的设计?20. 你的方案怎么选择?为什么选某一种?在什么场景下选?21. 向量召回中,embedding是用什么做的?22. 关键字加向量语义的混合是怎么混合的?23. 搜索结果里面用哪个?24. 你们会去干预排序算法吗?排序的分值?25. 这个RAG检索底座是作为给大模型智能排错的一个工具使用的吗?26. 从0到1构建以及增量更新,耗时大概什么量级?27. 简易数据库是公司的项目还是学校的课程设计?28. 说说PG SQL和MySQL的区别?29. 可重复读隔离级别是怎么实现的?30. 算法题:把二叉树用字符串存储,再写方法解回二叉树。(手撕)🙌面试感想感谢快手给我双非一次机会,虽然我也没把握住🥲,答得很烂,数据库理论什么的完全没准备,而且简直是死抓着数据库理论追着我杀啊。算法不是hot100但是不难,力扣原题。最后毫不意外的挂了。
查看30道真题和解析
点赞 评论 收藏
分享
评论
3
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务