蚂蚁智能化应用开发二面面经

1、自我介绍
2、聊了一下工作地点,职业规划
3、简单问了下实习
4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的?
5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的
6、讲一下你对强化学习的了解
7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等)
8、这些强化学习算法与大模型中的强化学习是什么关系?
9、了解PPO算法吗?
10、谈谈对目前主流大模型的认识以及底层架构
11、DeepSeek在哪些方面做了改进使其训练成本显著降低?
12、GRPO算法了解吗?
13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系?
14、你的项目中,微调要解决的具体问题是什么?
15、微调具体使用的是哪些模型,选择时是如何考虑的
16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本
17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么?
18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作
19、Agent项目是基于什么平台或框架实现的
20、反问
全部评论
这是开发?这不是算法
1 回复 分享
发布于 2025-10-18 16:49 上海

相关推荐

01-06 15:38
门头沟学院 Java
1. 内镜可视化手术导航系统用到200组真人病例,该系统是已经投入使用了吗?2. 1mm的精度控制是你的工作对它有什么影响吗?3. 五视图渲染是什么?用什么实现的?是串行的还是并行的?4. 内镜图的获取的元数据是视频还是图片?5. 有没有了解过python的GIL锁?6. 这个项目选python是基于师兄之前的工作还是自己选的?7. 生活服务平台项目是学校在开始用了吗?8. 百万订单表的覆盖索引的设计的原理是什么?9. 你优化后时间从609ms到1ms是自己做的监控还是怎么样的?10. 你的100万条数据是怎么来的?11. 高并发秒杀系统为什么要用redis+lua?12. 可以用分布式锁实现吗?13. redis比mysql抗压能力强的主要原因是什么?14. MySQL有I/O多路复用吗?15. 简单介绍实习的主要工作16. 多租户、多空间的资源调度是怎么调度的?17. 任务管理除了有一些底层资源的要求以外,还有没有说比如说他要做的数据量级18. 任务执行的耗时和状态同步有做吗?19. 日常和峰值情况下的任务有多少?20. 在这个工作中你有遇到什么性能瓶颈吗?21. 队列资源管理这部分你有了解过这部分一些开源的平台吗?比如编排的一些工具?22. redis有哪些数据结构?23. Zset底层是怎么实现的?24. 跳表是怎么样的结构?25. redis内存淘汰策略有哪些?26. mysql的主从同步机制是怎么样的?27. mysql有哪些锁?28. MVCC知道吗?29. mysql隔离级别有哪些?默认是哪个?30. MVCC完全能把锁替代吗?为什么?31. 手撕:lc原题环形链表Ⅱ。我用的快慢指针,问我为什么它们一定会相遇,能讲一下原理吗?
点赞 评论 收藏
分享
评论
点赞
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务