淘天 Agent 面经
1.简单介绍实习的整个项目背景
2.训练数据是怎么构建的,大概有多少量;测试集如何构建
3.为什么你在项目中选择用 Qwen 的模型而不用内部模型;文本检索时有 embedding 初步排序和重排两种模型可选,为什么选择 Rerank 方式做重排,而非其他重排方式
4.GRPO/ GSPO 训练的流程是什么,一条数据的处理过程及损失计算方式是怎样的, GSPO 相比 GRPO 做了哪些改进; GSPO 训练时,损失函数是怎么设计的;数据相同的情况下,为什么 GSPO 相比 GRPO 优化效果
5.实习项目是否已上线,每天的访问量多少;系统中有很多重复或相似的用户问题,一直检索会浪费资源,有哪些优化方式能节约资源
6.传统的记忆机制在使用过程中,该怎么进行更新和遗忘
7.一个标准的 RAG 系统包含哪些模块,整个 RAG 流程是怎样的
8.结合实践,写效果好的大模型 Prompt 一般有什么经验,其模块或每个部分应该写什么内容;除了你提到的, Prompt 还有其他比较重要的模块或部分吗;假如针对某个任务(比如 RAG 系统最后做总结)写了一个初始 Prompt ,发现结果有问题、不能很好遵循要求,有什么样的优化策略方式;还有其他能想到的优化方式吗
9.你自己在以后的工作中,更感兴趣做模型优化还是做应用相关的工作?这方面是怎么考虑的
10.手撕三选二:LC200最大岛屿,LC221最大正方形,LC31搜索旋转排序数组
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.训练数据是怎么构建的,大概有多少量;测试集如何构建
3.为什么你在项目中选择用 Qwen 的模型而不用内部模型;文本检索时有 embedding 初步排序和重排两种模型可选,为什么选择 Rerank 方式做重排,而非其他重排方式
4.GRPO/ GSPO 训练的流程是什么,一条数据的处理过程及损失计算方式是怎样的, GSPO 相比 GRPO 做了哪些改进; GSPO 训练时,损失函数是怎么设计的;数据相同的情况下,为什么 GSPO 相比 GRPO 优化效果
5.实习项目是否已上线,每天的访问量多少;系统中有很多重复或相似的用户问题,一直检索会浪费资源,有哪些优化方式能节约资源
6.传统的记忆机制在使用过程中,该怎么进行更新和遗忘
7.一个标准的 RAG 系统包含哪些模块,整个 RAG 流程是怎样的
8.结合实践,写效果好的大模型 Prompt 一般有什么经验,其模块或每个部分应该写什么内容;除了你提到的, Prompt 还有其他比较重要的模块或部分吗;假如针对某个任务(比如 RAG 系统最后做总结)写了一个初始 Prompt ,发现结果有问题、不能很好遵循要求,有什么样的优化策略方式;还有其他能想到的优化方式吗
9.你自己在以后的工作中,更感兴趣做模型优化还是做应用相关的工作?这方面是怎么考虑的
10.手撕三选二:LC200最大岛屿,LC221最大正方形,LC31搜索旋转排序数组
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
10-28 07:25
门头沟学院 Web前端 点赞 评论 收藏
分享
360集团公司福利 405人发布