阿里大模型算法一面分享 65min

感觉面完人都通透了,努力沉淀中
1.Transformer 中 Attention 的本质是什么?从数学角度简要解释一下。
2.在 Agent 多轮对话任务中,Attention 的局限性体现在哪里?

3.SFT 的核心流程以及数据构建策略,SFT 之后常见的 Post-Training 有哪些?面试官专门问 DPO 和 PPO 区别,以及 GRPO 有没有用过。

4.RAG 是什么,它和传统检索+生成的流程有何不同,如何评估一个 RAG 系统是否 work?

5.有没有用过端到端的 RAG 评估框架,项目里的 Modular Agent 是怎么实现多步规划的?调度策略如何设计,有没有异常 fallback?

6.手撕算法:岛屿数量(LeetCode 200)
全部评论
感觉问的似乎不多呀
点赞 回复 分享
发布于 04-19 23:20 北京

相关推荐

投了十几个无人回应
花环鞣: 佬,我隔壁的
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务