阿里大模型算法一面分享 65min
感觉面完人都通透了,努力沉淀中
1.Transformer 中 Attention 的本质是什么?从数学角度简要解释一下。
2.在 Agent 多轮对话任务中,Attention 的局限性体现在哪里?
3.SFT 的核心流程以及数据构建策略,SFT 之后常见的 Post-Training 有哪些?面试官专门问 DPO 和 PPO 区别,以及 GRPO 有没有用过。
4.RAG 是什么,它和传统检索+生成的流程有何不同,如何评估一个 RAG 系统是否 work?
5.有没有用过端到端的 RAG 评估框架,项目里的 Modular Agent 是怎么实现多步规划的?调度策略如何设计,有没有异常 fallback?
6.手撕算法:岛屿数量(LeetCode 200)
1.Transformer 中 Attention 的本质是什么?从数学角度简要解释一下。
2.在 Agent 多轮对话任务中,Attention 的局限性体现在哪里?
3.SFT 的核心流程以及数据构建策略,SFT 之后常见的 Post-Training 有哪些?面试官专门问 DPO 和 PPO 区别,以及 GRPO 有没有用过。
4.RAG 是什么,它和传统检索+生成的流程有何不同,如何评估一个 RAG 系统是否 work?
5.有没有用过端到端的 RAG 评估框架,项目里的 Modular Agent 是怎么实现多步规划的?调度策略如何设计,有没有异常 fallback?
6.手撕算法:岛屿数量(LeetCode 200)
全部评论

感觉问的似乎不多呀
相关推荐
点赞 评论 收藏
分享
查看28道真题和解析