Agent实习面经-阿里国际

攒人品中,祝大家都能拿到满意的Offer!
1*项目拷打
2* 实习拷打
3* KL 散度的数学意义是什么?在模型对齐(如 PPO/DPO)中起什么作用?
4* MoE架构的具体实现原理是什么?路由(Router)是如何工作的?
5* 面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?
6* BM25 算法的数学原理是什么?它相比于简单的 TF-IDF 有哪些改进?
7* Agent 系统中的LangGraph是如何搭建的?其 Memory 组件的工作机制是怎样的?
8* 如果单次生成的任务量远大于模型的 Max Tokens 限制,如何实现断点继续生成?
9* Transformer 中 Attention 的本质是什么?请从数学角度解释。
10* 为什么在计算 Attention 时需要进行Scaling
11* Self-Attention 和 Cross-Attention 在作用和输入来源上有什么区别?
12* 面对极长序列Attention 的 O(L^2) 复杂度问题目前有哪些主流解决方案?
13* 在 Agent 多轮对话任务中,Attention 机制的局限性体现在哪些方面?
14* 为什么模型在长上下文对话中容易出现“信息遗忘”?有哪些缓解机制?
15* 介绍 SFT的流程,以及如何构建高质量、多样化的数据集?
16* 在什么业务场景下,必须引入 RLHF 或 DPO 这种偏好对齐技术?
17* MinerU 在解析复杂的工业文档(如图文混排)时,具体的处理逻辑是怎样的?
18* 在多模态检索中,文本和图片是如何映射到同一个统一向量空间的?
19* Ragas 评测框架中的 Faithfulness 和 Answer Relevance 指标的具体计算逻辑是什么?
全部评论
问的还挺多的
点赞 回复 分享
发布于 03-19 23:19 北京
感谢面经,攒人品
点赞 回复 分享
发布于 03-16 21:11 陕西
问的可真的多,感觉这个可以
点赞 回复 分享
发布于 03-15 19:22 北京

相关推荐

02-27 11:25
门头沟学院 Java
有面试过同岗的朋友欢迎评论区交流!1.若用户量大幅增长,实习的项目相关系统能否应对,瓶颈是什么?2.你平时会使用大模型处理哪些任务,觉得大模型在哪些任务上处理得好,哪些任务处理得不好?3.你做的另一个项目的核心目标和整体架构是什么?4.你做的另一个项目是生成文档还是生成核心代码?5.你做的另一个项目若工业界落地失败,会如何处理?6.你做的另一个项目在记忆模块设计上有什么思路,如何让相关技能更好地发挥作用?7.你做的另一个项目中,模型是如何选择的,有什么选择依据或方法?8.大模型幻觉问题该如何处理,服务化过程中会产生哪些相关问题?9.你做的另一个项目现在能否在本地运行?10.RAG的优缺点有哪些?11.多任务相关模型有什么适用场景?12.常见的Agent产品有哪些特质?13.若发现项目中模型执行不成功,会如何处理?14.长期记忆相关设计中,关键关注点有哪些?15.从整体设计角度,长期记忆相关功能会从哪些角度考量?16.长期记忆相关设计还有哪些可优化的点?17.Agent领域的发展趋势是什么?18.若代码生成成本越来越低,工程师的核心竞争力会发生什么变化?19.平时会通过哪些渠道关注AI技术动态?20.最近有没有遇到让你觉得印象深刻的AI应用,其情节或功能有较大亮点?21.进入项目后遇到新的工具技术,会如何评价技术是否能解决问题?
查看21道真题和解析
点赞 评论 收藏
分享
评论
1
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务