面面俱到神

04-08 07:20 电子科技大学算法工程师

关注

快手后端ai agent算法面经分享

继续来分享下最近的面经~欢迎友好讨论，信息共享
1. Transformer 为什么能替代 RNN 成为大模型主流架构？
2. Self-Attention 的计算过程是什么，时间复杂度为什么高？
3. Multi-Head Attention 的作用是什么，为什么要分多个头？
4. 位置编码为什么必要，绝对位置编码和相对位置编码有什么区别？
5. 什么是 KV Cache，它为什么能显著提升推理效率？
6. Prefix Cache 和 KV Cache 有什么区别，分别适合什么场景？
7. 为什么大模型推理通常是 memory bound，而不是 compute bound？
8. Batch 推理和单请求推理的吞吐与延迟 tradeoff 是什么？
9. Continuous Batching 解决了什么问题，为什么对推理服务很重要？
10. Prefill 和 Decode 两个阶段的性能瓶颈分别在哪里？
11. 大模型采样里的 temperature、top-k、top-p 分别会怎样影响输出？
12. 贪心解码、束搜索、随机采样分别适合什么生成任务？
13. 重复惩罚和长度惩罚分别是为了解决什么问题？
14. 为什么模型有时会出现“复读机”现象，通常怎么缓解？
15. 量化是什么，INT8、INT4、FP16 的核心区别是什么？
16. 推理量化会对模型效果造成什么影响，如何评估是否值得量化？
17. 张量并行、流水线并行、数据并行分别适合哪个阶段？
18. 单机多卡部署大模型时，通信开销主要来自哪里？
19. 为什么 GPU 显存是大模型部署的核心约束之一？
20. 模型参数量、上下文长度、并发数三者之间是什么关系？
21. 什么是 MoE 模型，为什么它能在参数规模很大时控制推理成本？

全部评论

推荐最新楼层

04-08 12:21

门头沟学院 iOS开发

鼠鼠体检有以下异常，请问下各位佬需要复检吗，还是说会直接pass掉呀😴

点赞评论收藏

分享

04-07 00:00

广西大学算法工程师

快手大模型开发一面

1. 全参数微调的显存一般怎么估算全参数微调的显存不能只看模型参数本身，真正上线训练时至少要把参数、梯度、优化器状态和激活值都算进去。最粗略的估算方式是：如果模型参数量是 N，训练精度是 bf16，那么参数大约占 2N 字节，梯度再来一份 2N，如果用 Adam，还要额外保存两组一阶和二阶矩，通常再加 4N + 4N 字节。也就是说，不考虑激活值时，单参数相关内存大致可以按 12N ~ 16N 字节估。真正把 batch size、sequence length、checkpointing、并行策略加进去后，激活值往往才是大头。所以面试里如果只答“参数量乘 2”基本不够。更稳的答法是先给出静态...

AI-Agent面试实战...

点赞评论收藏

分享

04-08 06:25

门头沟学院 Java

AI应用开发面经汇总攒人品干货版

发一下问题给大家参考，攒攒人品！1. 如何实现多 Agent 协作系统？2. 什么是 RAG（Retrieval Augmented Generation）？3. Java 如何实现 streaming response？4. 什么是 hallucination（幻觉）？为什么会发生？5. LangChain4j 如何返回结构化 JSON？6. 如何实现 SSE 推送？7. 如何评估 Agent 的执行效果？8. LLM 服务如何做缓存？9. LangChain4j 如何实现 Tool 调用？10. 什么是 AI Agent？11. 什么是 Prompt Engineering？12. Agent 和普通 ChatBot 有什么区别？13. RAG latency 怎么优化？14. Java 调用 OpenAI API 如何设计 SDK？15. RAG pipeline 的完整流程是什么？16. RAG 系统主要组件有哪些？17. 如何设计一个 AI 问答系统架构？18. RAG 如何做 rerank？19. AI系统如何做监控？20. embedding 和向量相似度搜索是什么？21. 什么是 ChatMemory？22. Java LLM 服务如何做连接池管理？23. 如何评估 RAG 系统效果？24. Agent memory 有哪些类型？25. 如何实现对话历史 memory？26. Transformer 架构核心原理是什么？27. 如何减少大模型 hallucination？28. LLM API 如何设计接口？29. chunk size 为什么很重要？如何选择？30. 如何实现 hybrid search（向量 + keyword）？31. 什么是 ReAct Agent？32. Spring AI 和 LangChain4j 有什么区别？33. 什么是 Tool Calling？34. embedding 模型如何选择？35. AI Chat 系统的整体架构是什么？36. 文档切分有哪些策略？37. LLM 服务如何做限流？38. LangChain4j 如何实现 prompt template？39. ChatGPT 的 system / user / assistant role 有什么作用？40. LLM 为什么推理成本高？41. AI系统如何记录 Prompt 和 Response？42. Agent 如何做任务规划（planning）？43. LLM latency 如何优化？44. 如何设计 Prompt 管理系统？45. streaming response 如何实现？46. MCP（Model Context Protocol）是什么？47. Agent workflow 和普通 workflow 有什么区别？48. 大模型上下文窗口是什么？如何突破长度限制？

点赞评论收藏

分享

04-08 16:16

门头沟学院测试开发

PDD-测试工程师-二面

📍面试公司：拼多多🕐面试时间：3.17一面->4.2二面💻面试岗位：测试工程师❓面试问题：1.自我介绍2.实习时间都不长为什么？3.实习过程中负责了什么业务模块，具体请求链路是怎样的？然后就是一直问实习，问的比较仔细4.比如一个业务迭代版本比较多，可能存在一些历史遗留问题，这种情况下你有哪些方案能避免？5.开发提测后你发现问题比较多，影响你的进度，这样情况下你可以哪些事情？6.手撕：前K个最大的数字反问🙌面试感想：手撕寄了，秒挂

查看6道真题和解析

点赞评论收藏

分享

04-07 11:32

高途集团_菁英部_实习生(实习员工)

这简历能找到大中厂实习吗

不玻璃心，请狠狠锐评我我目前是收到过一个京东跟网易的面试，但是京东二面挂了，网易一面也挂了。目前是在北京，能有公司能捞捞孩子吗

实习，投递多份简历没人回...

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# Agent面试会问什么？ #

22140次浏览 794人参与

# 哪些公司一直卡在简历筛选 #

99601次浏览 301人参与

# 厦门银行科技岗值不值得投 #

18243次浏览 419人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

7524次浏览 113人参与

# 运营每日一题 #

134359次浏览 928人参与

# 烂工作和没工作哪个更痛苦？ #

15613次浏览 247人参与

# 拼多多工作体验 #

54835次浏览 373人参与

# 一人分享一个skill #

5619次浏览 156人参与

# 我们是不是被“优绩主义”绑架了？ #

43789次浏览 538人参与

# 春招至今，你收到几个面试了？ #

60615次浏览 843人参与

# 央国企投递记录 #

186984次浏览 1710人参与

# 面试体验最好和最差的公司 #

18580次浏览 140人参与

# 机械人面试中的常问题 #

267360次浏览 3692人参与

# 你觉得专业和学校哪个对薪资影响最大 #

103912次浏览 615人参与

# 我是XXX，请攻击我最薄弱的地方 #

71838次浏览 475人参与

# AI替代不了什么？ #

10332次浏览 160人参与

# 现在入门AI首先要做什么？ #

3636次浏览 92人参与

# 你收到了团子的OC了吗 #

1583280次浏览 11849人参与

# 神州数码信息服务股份有限公司笔试 #

3481次浏览 21人参与

# 你被哪些公司挂了？ #

172754次浏览 969人参与

# 面试尴尬现场 #

224015次浏览 868人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务