Agent实习一面 阿里国际 感觉好难啊

给我面没招了,发点面经攒攒人品~
1*当大模型产生错误回答或幻觉时,在工程和算法层面有哪些规避手段?
2* 描述 Transformer Decoder 的完整解码流程。
3* KL 散度的数学意义是什么?在模型对齐(如 PPO/DPO)中起什么作用?
4* MoE架构的具体实现原理是什么?路由(Router)是如何工作的?
5* 面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?
6* BM25 算法的数学原理是什么?它相比于简单的 TF-IDF 有哪些改进?
7* Agent 系统中的LangGraph是如何搭建的?其 Memory 组件的工作机制是怎样的?
8* 如果单次生成的任务量远大于模型的 Max Tokens 限制,如何实现断点继续生成?
9* Transformer 中 Attention 的本质是什么?请从数学角度解释。
10* 为什么在计算 Attention 时需要进行Scaling
11* Self-Attention 和 Cross-Attention 在作用和输入来源上有什么区别?
12* 面对极长序列Attention 的 O(L^2) 复杂度问题目前有哪些主流解决方案?
13* 在 Agent 多轮对话任务中,Attention 机制的局限性体现在哪些方面?
14* 为什么模型在长上下文对话中容易出现“信息遗忘”?有哪些缓解机制?
15* 介绍 SFT的流程,以及如何构建高质量、多样化的数据集?
16* 在什么业务场景下,必须引入 RLHF 或 DPO 这种偏好对齐技术?
17* MinerU 在解析复杂的工业文档(如图文混排)时,具体的处理逻辑是怎样的?
18* 在多模态检索中,文本和图片是如何映射到同一个统一向量空间的?
19* Ragas 评测框架中的 Faithfulness 和 Answer Relevance 指标的具体计算逻辑是什么?
20* 相比于 LangChain,LangGraph 在处理循环任务和状态管理上有哪些优势?
21* LangGraph 的状态快照机制是如何实现任务回溯和持久化的?
全部评论
佬应聘的是agent算法吗
点赞 回复 分享
发布于 03-17 12:09 广东

相关推荐

攒人品中,祝大家都能拿到满意的Offer!1*项目拷打2* 实习拷打3* KL 散度的数学意义是什么?在模型对齐(如 PPO/DPO)中起什么作用?4* MoE架构的具体实现原理是什么?路由(Router)是如何工作的?5* 面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?6* BM25 算法的数学原理是什么?它相比于简单的 TF-IDF 有哪些改进?7* Agent 系统中的LangGraph是如何搭建的?其 Memory 组件的工作机制是怎样的?8* 如果单次生成的任务量远大于模型的 Max Tokens 限制,如何实现断点继续生成?9* Transformer 中 Attention 的本质是什么?请从数学角度解释。10* 为什么在计算 Attention 时需要进行Scaling11* Self-Attention 和 Cross-Attention 在作用和输入来源上有什么区别?12* 面对极长序列Attention 的 O(L^2) 复杂度问题目前有哪些主流解决方案?13* 在 Agent 多轮对话任务中,Attention 机制的局限性体现在哪些方面?14* 为什么模型在长上下文对话中容易出现“信息遗忘”?有哪些缓解机制?15* 介绍 SFT的流程,以及如何构建高质量、多样化的数据集?16* 在什么业务场景下,必须引入 RLHF 或 DPO 这种偏好对齐技术?17* MinerU 在解析复杂的工业文档(如图文混排)时,具体的处理逻辑是怎样的?18* 在多模态检索中,文本和图片是如何映射到同一个统一向量空间的?19* Ragas 评测框架中的 Faithfulness 和 Answer Relevance 指标的具体计算逻辑是什么?
查看17道真题和解析
点赞 评论 收藏
分享
03-17 00:07
已编辑
哈尔滨工业大学 golang
📍面试公司:字节跳动🕐面试时间:2.6投简历 推到2.26一面 2.27二面 3.2三面 3.6hr面 3.16 oc❓面试问题:一面面试官比较新手,先自我介绍一下,然后好奇了一下我的比赛都在做什么。然后考了一点八股链表和数组的区别/应用场景快排的原理哈希表的实现和冲突解决红黑树和avl树的区别和应用(读多写少/读少写多)dp是什么,思路进程线程协程的区别goroutine的gmp模型死锁是什么,怎么避免linux io模型和复用虚拟内存和页表的过程tcp的三次握手四次挥手tcp/udp的区别和应用tls的握手过程go的runtime负责做什么,如何垃圾回收然后拷打20min项目最后给了两个简单的算法题,一个是字符串中最长的不重复字符串,一个是矩形网格左上走到右下权值最小路径二面二面拷打的比较厉害,比较紧张记不太清了上来先问了问八股,没问算法相关的,直接问的操作系统相关的仔细问了问线程切换和协程切换,c++的协程和goroutine有啥区别goroutine的工作窃取怎么做的深入拷打死锁,还有银行家算法怎么做的拷打项目,比较深入,结合这个项目为啥这么设计和怎么调试(因为我讲了中间遇到竞态问题)三面三面就面试了半小时,没怎么问八股聊了聊python,golang,c++的区别,应用场景解释器和编译型区别,为啥要用golang 还有runtime逃逸分析啥的,比较聊天然后聊了聊agent开发(有一个相关项目)的事,还问了问用没用过openclaw 有啥感想最后问了下期望的工作地点和到岗时间就结束了
查看26道真题和解析
点赞 评论 收藏
分享
评论
2
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务