蚂蚁智能化应用开发后端二面

二面 1、实习项目中spdlog库的使用方法 2、聊了一下工作地点,职业规划 3、简单问了下实习 4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的? 5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的 6、讲一下你对强化学习的了解 7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等) 8、这些强化学习算法与大模型中的强化学习是什么关系? 9、了解PPO算法吗? 10、谈谈对目前主流大模型的认识以及底层架构 11、DeepSeek在哪些方面做了改进使其训练成本显著降低? 12、GRPO算法了解吗? 13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系? 14、你的项目中,微调要解决的具体问题是什么? 15、微调具体使用的是哪些模型,选择时是如何考虑的 16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本 17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么? 18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作 19、Agent项目是基于什么平台或框架实现的 20、反问
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务