快手后端ai agent算法面经分享

继续来分享下最近的面经~欢迎友好讨论,信息共享
1. Transformer 为什么能替代 RNN 成为大模型主流架构?
2. Self-Attention 的计算过程是什么,时间复杂度为什么高?
3. Multi-Head Attention 的作用是什么,为什么要分多个头?
4. 位置编码为什么必要,绝对位置编码和相对位置编码有什么区别?
5. 什么是 KV Cache,它为什么能显著提升推理效率?
6. Prefix Cache 和 KV Cache 有什么区别,分别适合什么场景?
7. 为什么大模型推理通常是 memory bound,而不是 compute bound?
8. Batch 推理和单请求推理的吞吐与延迟 tradeoff 是什么?
9. Continuous Batching 解决了什么问题,为什么对推理服务很重要?
10. Prefill 和 Decode 两个阶段的性能瓶颈分别在哪里?
11. 大模型采样里的 temperature、top-k、top-p 分别会怎样影响输出?
12. 贪心解码、束搜索、随机采样分别适合什么生成任务?
13. 重复惩罚和长度惩罚分别是为了解决什么问题?
14. 为什么模型有时会出现“复读机”现象,通常怎么缓解?
15. 量化是什么,INT8、INT4、FP16 的核心区别是什么?
16. 推理量化会对模型效果造成什么影响,如何评估是否值得量化?
17. 张量并行、流水线并行、数据并行分别适合哪个阶段?
18. 单机多卡部署大模型时,通信开销主要来自哪里?
19. 为什么 GPU 显存是大模型部署的核心约束之一?
20. 模型参数量、上下文长度、并发数三者之间是什么关系?
21. 什么是 MoE 模型,为什么它能在参数规模很大时控制推理成本?
全部评论

相关推荐

04-08 06:25
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1. 如何实现多 Agent 协作系统?2. 什么是 RAG(Retrieval Augmented Generation)?3. Java 如何实现 streaming response?4. 什么是 hallucination(幻觉)?为什么会发生?5. LangChain4j 如何返回结构化 JSON?6. 如何实现 SSE 推送?7. 如何评估 Agent 的执行效果?8. LLM 服务如何做缓存?9. LangChain4j 如何实现 Tool 调用?10. 什么是 AI Agent?11. 什么是 Prompt Engineering?12. Agent 和普通 ChatBot 有什么区别?13. RAG latency 怎么优化?14. Java 调用 OpenAI API 如何设计 SDK?15. RAG pipeline 的完整流程是什么?16. RAG 系统主要组件有哪些?17. 如何设计一个 AI 问答系统架构?18. RAG 如何做 rerank?19. AI系统如何做监控?20. embedding 和向量相似度搜索是什么?21. 什么是 ChatMemory?22. Java LLM 服务如何做连接池管理?23. 如何评估 RAG 系统效果?24. Agent memory 有哪些类型?25. 如何实现对话历史 memory?26. Transformer 架构核心原理是什么?27. 如何减少大模型 hallucination?28. LLM API 如何设计接口?29. chunk size 为什么很重要?如何选择?30. 如何实现 hybrid search(向量 + keyword)?31. 什么是 ReAct Agent?32. Spring AI 和 LangChain4j 有什么区别?33. 什么是 Tool Calling?34. embedding 模型如何选择?35. AI Chat 系统的整体架构是什么?36. 文档切分有哪些策略?37. LLM 服务如何做限流?38. LangChain4j 如何实现 prompt template?39. ChatGPT 的 system / user / assistant role 有什么作用?40. LLM 为什么推理成本高?41. AI系统如何记录 Prompt 和 Response?42. Agent 如何做任务规划(planning)?43. LLM latency 如何优化?44. 如何设计 Prompt 管理系统?45. streaming response 如何实现?46. MCP(Model Context Protocol)是什么?47. Agent workflow 和普通 workflow 有什么区别?48. 大模型上下文窗口是什么?如何突破长度限制?
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务