大模型Agent校招面经-阿里淘天

继续来分享下之前的面经~欢迎友好讨论,信息共享
1. Transformer中Attention的本质是什么?你能从数学角度简要解释一下吗?
2. 在Agent多轮对话任务中,你觉得Attention的局限性体现在哪些方面?
3. 简要介绍一下SFT的核心流程,以及数据集的构建策略,SFT之后常见的Post-Training还有哪些?它们之间的目的有何区别?
4. 什么是RAG,它是怎么提升生成质量的?与传统检索+模型生成的流程有何不同?如何评估一个RAG系统是否work的?
5. PPO和DPO在大模型对齐中的主要区别是什么?DPO训练通常有哪些注意事项?用过GRPO么?
6. 项目里的Modular Agent,你能讲讲它是如何实现多步规划的吗?
7. 项目提到了多个工具调用链路,调度策略是如何设计的?是否有异常fallback策略?
8. Agent评估体系包括哪些维度?如何衡量planning能力 vs hallucination rate?
9. 项目里微调Qwen,选择的训练阶段和Loss函数是如何决定的?
10. Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?
11. 场景题:假如一个Agent 推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?
12. 代码:岛屿数量
全部评论

相关推荐

03-09 17:10
门头沟学院 Java
腾讯会议录制后的AI会议总结(30min)这是一场关于计算机技术岗位的面试会议。本次会议主要围绕应聘者的项目经验、技术能力和对Java、MySQL等技术的理解展开讨论。面试官还询问了应聘者对AI领域的了解程度以及未来实习转正的可能性。1、面试开场与设备问题面试开始时,面试者设备出现问题,摄像头无法打开,请求重启设备。面试官同意面试者重启设备,面试在设备重启后继续进行。2、面试者自我介绍面试者自我介绍为郑州大学计算机技术专业的27届硕士在读研究生,有两段实习经历和一些项目经历。面试者掌握的技术包括SSM框架、MySQL、Redis、RabbitMQ等工具,并能熟练使用AI进行编程。3、实习经历与项目介绍面试者第一段实习是在老师的横向项目中,第二段是在本地企业实习三个月。面试者详细介绍了一个名为“聚宝盆”的ERP系统项目,该系统服务于中小型商超,包含多个模块如主数据中心、库存中心等。面试者在项目中主要负责接口开发,特别是顾客支撑模块的接口开发。4、技术问题讨论面试官询问项目中的并发处理方案,面试者提到在价签打印模块使用了分布式锁和MySQL异步处理。面试官进一步询问如何提升系统并发能力,面试者提到缓存优化和硬件提升。面试者介绍了电商直播赋能平台项目中的Redis主从加哨兵架构,以及接口限流和防刷策略。5、Java技术点讨论面试官询问HashMap的底层原理,面试者详细介绍了Java 1.7和1.8版本的差异及put流程。面试官询问红黑树的插入和遍历,面试者简要回答并承认对旋转操作不熟悉。6、MySQL技术点讨论面试官询问MySQL的三大日志,面试者回答为redo log、undo log和binlog。面试官询问脏读和不可重复读的概念及解决方案,面试者简要回答并承认对MVCC实现细节不熟悉。7、公司业务与实习机会面试官介绍公司业务为AI领域,涉及医疗等多个行业,主要做大模型和Agent相关项目。面试者询问实习转正机会,面试官表示取决于能力和工作表现。面试者询问入职后的培训,面试官表示会有项目指导但非一对一教学。会议待办深入研究并理解红黑树的插入和遍历过程
查看14道真题和解析
点赞 评论 收藏
分享
评论
1
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务