首页 / 大模型
#

大模型

#
1278477次浏览 13211人互动
此刻你想和大家分享什么
热门 最新
大模型应用开发面经 (5年经验)
时间范围 近半年实际面过的公司阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、彩云科技、蓝色光标、江城互娱、Aviagames、Hungry Stdios、深言科技、即时科技、RockFlow、格灵深瞳、百融云创、印象笔记、网龙、 HiDream.ai、昆仑万维、数驱互动、Authing先说总结面试内容 & 难度个人觉得,在llm应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题(当然也遇到了一两次),究其原因以下几点,一是大模型应用目前仍没有很成熟且被广泛接纳的方案,都还在探索;二是很多公司今年刚开始all in AI(我司all进去的比较早点),面试官也懂得不多,例如RAG这个东西,大部分的面试题无非是“你觉得RAG中最难的是什么?(文档切割喽)”、“你是怎么解决幻觉问题的?”,“微调和RAG的区别是啥?”等等,如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”,基本面试官都觉得ok。但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点,就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型,这是我面试中最常被问到而又只能说没做过的问题,当然大部分公司都有专门的算法团队去做这件事,自己到没机会参与其中,也是可以理解的。算法题:一半是DP问题,还有一部分难度是easy的问题,总体上都是“老熟人”,但是,你即使写出来,面试不一定就能过,有的干脆就不考算法题。八股文:明显比之前少很多,这个和面试的岗位有关系,LLM应用的岗位更偏实践,所有很多一面就是leader面,直接问项目,除非一面也不懂LLM的东西,就会考八股文,但总的来说,八股少了,但是绝对不可以不准备,好几次挂在这上面,别小瞧它。岗位内容:游戏公司:基本上是LLM + AB test for 游戏策划;BI 分析;游戏社区客服助手;toC: Agent 个人助手toB: Agent for 解决方案other: 通用 Agent 平台;公司内部AI助手、平台;Agent for 运维offer会有很多横向对比,如果你期望薪资比较高,对方说要在等等,基本上凉了。大部分涨幅基本是不到20%的,但我的期望是30%左右,最后还是拿到了(要有一点点耐心,还要有一定的运气)。不要眼高手低,先拿一个低于自己预期的offer,再慢慢谈,前提是公司想要你。规划好时间,集中面试,集中对比,由于我时间线拉的过长,后面安排的很乱。再总结每次面完都要复盘,没答好的问题,一定要重新梳理答案。没把握问题的可以直接说不会,别给个你自己都听不懂的答案。简历一定要让大模型润色,但自己要check一遍,别吹过头了。多看技术文章,扩展技术视野,提高二面面试官对你的印象。表达一定要流畅清晰,不要断断续续的,面试官会觉得你思路不清晰。项目效果评估是个很重要的问题,不管你的技术多炫酷,终究还是要看效果,看落地效果。面试题这里想到多少写多少LLM 基础大模型是怎么训练出来的?Transform 的架构,Encoder 和 Decoder 是什么?Function Call 是怎么训练的?微调的方案有哪些?自己做过没有?大模型分词器是什么?Embedding 是什么?你们用的那个模型?Lib介绍一下 langchian介绍一下 autogen有没有用过大模型的网关框架(litellm)为什么手搓agent,而不是用框架?mcp 是什么?和Function Call 有什么区别?有没有实践过?A2A 了解吗?PromptReAct 是啥?怎么实现的?CoT 是啥?为啥效果好呢?有啥缺点?Prompt Caching 是什么?温度值/top-p/top-k 分别是什么?各个场景下的最佳设置是什么?RAG你介绍一下RAG 是什么?最难的地方是哪?文档切割策略有哪些?怎么规避语义被切割掉的问题?多路召回是什么?文档怎么存的?粒度是多大?用的什么数据库?为啥要用到图数据库?向量数据库的对比有没有做过?Qdrant 性能如何?量级是多大?有没有性能瓶颈?怎么规避大模型的幻觉?微调和RAG的优劣势?怎么量化你的回答效果? 例如检索的效果、回答的效果。Workflow怎么做的任务拆分?为什么要拆分? 效果如何?怎么提升效果?text2sql 怎么做的?怎么提高准确率?如何润色query,目的是什么?code-generation 是什么做的?如何确保准确性?现在再让你设计你会怎么做?(replan)效果是怎么量化的?Agent介绍一下你的 Agent 项目长短期记忆是怎么做的?记忆是怎么存的?粒度是多少?怎么用的?Function Call 是什么做的?你最大的难题是什么?你是怎么提高效果的?怎么降低延迟的?端到端延迟如何优化的?介绍一下single-agent、multi-agent的设计方案有哪些?反思机制是什么做的?为什么要用反思?如何看待当下的LLM应用的趋势和方向为什么要用Webrtc?它和ws的区别是什么?agent服务高可用、稳健性是怎么保证的?llm 服务并发太高了怎么办?系统设计题短链系统分布式锁的设计给你一部长篇小说,怎么做文档切割?怎么做到论文翻译,并且格式尽可能和原来的统一游戏社区客服助手设计。如何绑定游戏黑话,如何利用好公司内部的文档结合线上问题快速定位项目工程代码有问题的地方有很多结构化和非结构化数据,怎么分析,再怎么得出我要的结论。八股go的内存分配策略、GMP、GCpython 的内存分配策略、GCredis 用过那些?mget 底层什么实现的?、zset怎么实现的?mysql 索引怎么设计最好?数据库隔离级别?mvcc是怎么实现的?分布式锁是什么实现的?kafka的 reblance 是什么?会产生那些问题?怎么保证数据不丢?fastapi 设计原理?go 中 net/http 如何处理的tcp粘包问题http2 是什么?比http1.1有什么优势?Linux 网络性能调优的方式如何定位Linux中的pid、端口号等等个人在每个项目的里的角色是什么?承担那些工作?项目是几个人在做?为什么离职、每次离职的原因是什么?平常怎么学习的?怎么接触到大模型的最新进展的?对大模型将来的应用发展有什么看法?你将来的职业规划是什么?
大模型小坛:所有面试题可以开源给大家 后台T一下
点赞 评论 收藏
分享
04-12 11:51
吉林大学 Java
快手后端开发实习一面面经
1. 面试官介绍自己的团队,base位置,是否能够接受。2. 自我介绍3. 了解了一下我的现状,能够实习多久。4. 聊项目5. 你测试了你的系统吗?AI服务耗时怎么样?6. 你有调研过Java语言实现AI服务的工具吗?为什么项目中要用Python开发呢?7. 你的消息队列的主要作用是什么?8. 除了消息队列,你有没有想过其他通信方案?(RPC,HTTP等)9. 为什么不使用http同步调用的方案呢?10. 这个项目中,检索业务和生成业务的性能瓶颈你觉得在哪?有没有想过优化方案?11. 聊Java八股12. 你使用的JDK版本是什么?你了解过哪些新特性?13. 你用过lambda表达式吗?你知道lambda表达式底层的实现原理吗?14. 你了解过Java最新的绿色线程吗?15. 说说Java的虚拟线程和Go语言的协程、Python的协程有什么区别吗?(本人不了解Go和Java的虚拟线程,就只讲了Python的协程)16. 用普通的线程可以做到你项目中协程的工作吗?两种实现方案有什么区别?17. 你的项目用的是什么垃圾回收器?(回答是G1垃圾回收器)你了解G1垃圾回收器的底层原理吗?18. G1标记完需要回收的region后,具体如何判断是否该对一个region进行清理呢?19. 聊AI八股20. 你说你用了langchain和langgraph,介绍一下他们和二者的关系21. 你觉得langgraph真正的强大之处在哪?他有哪些关键的机制?22. 你知道langchain和langgraph框架在Java端的适配版本吗?有调研过吗?23. 你了解过向量数据库milvus的索引吗?24. 能简单讲讲向量的稠密索引是如何工作的吗?25. 你了解微调吗?Lora微调的原理是什么?与全量微调有何区别?26. 你了解vLLM吗?你知道他的原理吗?27. 你提到你使用了一些提示词工程,比如few shot和CoT,介绍一下他们以及具体的应用场景。28. 你的项目中如何应用提示词工程的?你怎么管理不同版本的提示词呢?29. 你了解哪些降低大模型幻觉的手段?30. 除了RAG,还有别的方法吗?31. 你的项目用了几个Agent?你的多个Agent之间如何通信?32. 你有没有考虑过Agent之间无限循环调用导致token消耗爆炸的情况?有没有解决方案或者思路?33. 你的项目中是如何计算和监控token消耗量的?34. 你了解哪些Agent通信方法?算法题:高精度乘法反问面试体验比较好。虽然难度大但是也能了解到很多新知识,开阔视野。第二天进二面。
点赞 评论 收藏
分享
04-14 15:01
已编辑
吉林大学 Java
快手后端开发实习二面(没凉!已OC)
查看38道真题和解析
点赞 评论 收藏
分享
03-12 15:47
吉林大学 Java
字节后端实习一面
1. 自我介绍2. 介绍一下你的项目具体是干什么的?为什么要制作这样一个项目?这个项目的运作流程大概是怎么样的?3.你的项目中用到了大模型工作流,那你这个工作流具体是怎么样的,他如何工作?4. 我看你这个工作流里面还有向量数据库,为什么要用他?5. 你有考虑过限流吗?你说了大模型的计算资源很宝贵,那你如何确保这个服务在高并发下正常工作?6. 你说你有防范无效请求的攻击,那么假如说现在是高并发的合法请求,有大量用户需要调用大模型服务,你的系统怎么处理?(没有想出什么好的解决方案,没回答好😭)7. 我看你这里登录功能有说到密码加密,你所用的加密算法是什么?(鼠鼠回答是加盐算法)那你清楚这个算法的工作原理吗(鼠鼠答不上来,忘记复习了😭)?8. 那我们聊聊jwt,你说你用了jwt,那jwt是干什么的?你如何使用的?9. jwt具体有哪几个组成部分,你知道吗?除了你提到的payload(鼠鼠也没记全,答上来一部分😵)。10. 我看你提到了消息队列中,你知道rabbitmq和kafka,那他们有什么异同呢?11. 微服务架构和单机架构有什么区别?我们如何从中做技术选型?算法题(LeetCode上hard原题),鼠鼠极限手撕出来了,差点超时结束😥反问环节总的来说面试官人很好,作为鼠鼠第一次面试大厂体验不错,面试官还特地让我放轻松些☺️
小牛油等一个offe...:补充: 你项目中的上下文压缩,他具体如何工作?触发条件是怎样的? 对称加密和非对称加密你了解吗? http和HTTPS的差别是什么?
查看11道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务