蚂蚁智能化应用开发二面面经

1、自我介绍
2、聊了一下工作地点,职业规划
3、简单问了下实习
4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的?
5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的
6、讲一下你对强化学习的了解
7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等)
8、这些强化学习算法与大模型中的强化学习是什么关系?
9、了解PPO算法吗?
10、谈谈对目前主流大模型的认识以及底层架构
11、DeepSeek在哪些方面做了改进使其训练成本显著降低?
12、GRPO算法了解吗?
13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系?
14、你的项目中,微调要解决的具体问题是什么?
15、微调具体使用的是哪些模型,选择时是如何考虑的
16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本
17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么?
18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作
19、Agent项目是基于什么平台或框架实现的
20、反问
全部评论
这是开发?这不是算法
1 回复 分享
发布于 2025-10-18 16:49 上海
你这是算法岗吧
点赞 回复 分享
发布于 03-06 11:51 北京

相关推荐

03-28 23:32
门头沟学院 Java
攒人品中! 问八股:1.介绍一下transformer架构,它解决了rnn和cnn哪些无法解决的问题?2.怎么理解词与词之间距离的概念?为什么大模型需要知道这个距离?3.transformer的核心机制是什么?能不能用一个具体的例子串一遍里面所有概念?4.你提到的QKV能不能具体讲一下?它的核心作用是什么?5.模型层叠加之后会出现什么问题?我们要引入什么机制去解决这个问题?6.传统的残差机制会有什么问题?现在业界有没有提出一些新的解决方案?7.现在业界有很多先进的大模型,有些是7b,有些是325b,这个b的概念是什么?我们在做模型选择的时候怎么选?8.对于不同的细分领域,能不能讲一下你对现有的模型厂商他们参数量选型的了解?9.现在给你一个场景,比如说我们做ai coding,你会怎么去选择参数量?10.对话型模型和推理型模型之间的区别是什么?分别适用于什么样的场景?11.简要的介绍一下engine、sub engine、skill、mcp这几个概念,他们的用途是什么?在代码开发过程中分别用来解决什么问题?12.在开发过程中,多轮迭代会话后工程越来越难以维护,你有没有什么好的建议?13.对于上下文工程的最佳实践,常用到的一些技术或者解决方案都有哪些?14.目前这个体系还很复杂,有没有现成的东西来辅助我?有没有了解现在开源社区很火的一些解决方案?问实习:15.聊一下实习期间你遇到最困难的一件事,这件事你是怎么解决的?得到了一个什么样的效果或结果?16.为什么你会选择lsp这个方案?你是怎么找到和评估这个方案的?17.如果说进一步提升的话,你觉得还有什么方向可以改进?让你现在再做一遍的话你是否会选择重新设计?无手撕
查看17道真题和解析
点赞 评论 收藏
分享
评论
点赞
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务