蚂蚁智能化应用开发二面面经

1、自我介绍
2、聊了一下工作地点,职业规划
3、简单问了下实习
4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的?
5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的
6、讲一下你对强化学习的了解
7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等)
8、这些强化学习算法与大模型中的强化学习是什么关系?
9、了解PPO算法吗?
10、谈谈对目前主流大模型的认识以及底层架构
11、DeepSeek在哪些方面做了改进使其训练成本显著降低?
12、GRPO算法了解吗?
13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系?
14、你的项目中,微调要解决的具体问题是什么?
15、微调具体使用的是哪些模型,选择时是如何考虑的
16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本
17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么?
18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作
19、Agent项目是基于什么平台或框架实现的
20、反问
全部评论
这是开发?这不是算法
1 回复 分享
发布于 10-18 16:49 上海

相关推荐

1.接口的抽象类的区别 分别应用场景2.final finally 区别  final 使用场景3.java中有哪些map4.hashmap原理 节点阈值扩容5.扩容中0.75是什么的0.75是数组容量还是bucket   扩容后元素的位置以及为什么2倍扩容6. ConcurrentHashMap项目有实际使用吗 以及简单的原理7.怎么评估 ConcurrentHashMap 和hashtable 的性能好坏8.cas实现流程 为什么觉得cas比synchronized 性能好9.线程池的关键参数和执行流程10.new thread 和单线程的线程池都抛异常分别可能是因为什么11.如果你要设计一个线程池,那么你怎么进行参数的设置12.如果想要任务高效执行,并且下游接口希望快速返回结果,该怎么设计线程池13.任务丢失对你的项目有影响吗,怎么去设置拒绝策略14.spring事务的传播行为有哪些,传播行为实现机制15事务传播行为在db层面上是怎么保证的,在一个事务里的必要条件16.spring声明式事务需要注意的点有哪些17.aop不用动态代理还有其他实现办法吗18.spring bean的创建过程19.多例什么时候创建20.springboot 做了哪些事21.starter 具体实现原理22.springboot 怎么知道要创建哪些bean呢23.索引失效场景24.b+树优点,为什么不用二叉树25.b+树和二叉树全部加载在内存中,性能判断,层高的影响26.主键选择,自增主键,uuid,雪花id对比27.uuid 除了页分裂还有啥问题28.数据库2000万数据经典问题,为什么觉得2000w是一个瓶颈呢29.mysql 3层层高要多少次io30.给sql语句,索引,表结构判断是否走索引,走哪个索引手撕LRU :linkedhashmaphashmap 和双向链表都可以实现
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务