顺丰大模型算法实习面经-八股拷打

1,介绍RAG流程,分段有没有做优化;编码模型和重排模型用了什么;Qwen3系列和bge系列的原理,Qwen3系列编码模型是怎么训练的
2,RAG怎么评估,用了哪些指标;RAGAS有哪些指标,为什么不直接用库
3,Agent的思想是什么,Agent包含哪些部分;介绍DeepResearch;介绍Agent怎么做任务规划和问题分解
4,SFT数据集怎么构建,问题不够多样化怎么解决
5,介绍LoRA原理;LoRA分支怎么初始化,为什么这么做
6,self-attention公式;为什么要scaling
7,介绍KV Cache;vllm是怎么加速推理
8,RLHF,介绍PPO,包含多少个模型;GRPO与PPO的区别;GRPO的缺点;介绍GSPO
全部评论
接好运!!!
点赞 回复 分享
发布于 02-05 18:21 江苏
谢谢面经分享
点赞 回复 分享
发布于 02-05 18:20 广东

相关推荐

1、自我介绍2、Agent项目是实习项目还是个人项目?有没有上线?3、拷打实习(10min)4、大模型微调,你的训练数据集是如何构建的?数据量有多大?5、在构建数据集的过程中,遇到了哪些挑战?花了多长时间?6、你之前的实习经历偏后端工程,你未来的职业规划更倾向于纯后端开发,还是希望从事与AI/大模型结合的工作?7、详细讲一下Golang中Channel的概念和作用,它是否是并发安全的?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、讲一下GMP模型10、当P的本地队列为空或者不为空时,它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似淘宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明微信扫码登录的完整流程和背后发生的原理17、在微服务架构中,服务发现和负载均衡是如何实现的?18、服务注册中心(如Nacos, Consul)是如何工作的?服务实例如何注册和保活(如通过心跳机制)?19、讲一下Agent中的“长短期记忆”20、什么样的信息应该放在长期记忆,什么样的信息放在短期记忆?21、当对话轮数很多,上下文窗口不足时,有哪些处理策略?(如截断、压缩)22、如果要进行记忆压缩,通常有哪些方法?23、了解过Agent的设计范式吗?有哪些?24、你设计的Agent是怎么实现ReAct模式的?详细讲讲25、手撕:实现一个并发任务处理器:给定一个包含100个任务ID的列表,要求控制最大并发数为3,模拟并发调用某个外部接口(如打印ID)26、反问
查看24道真题和解析
点赞 评论 收藏
分享
查看10道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务