秋招面经-京东算法一面
1.llm项目深挖
2.PPO和DPO GRPO的区别
3.on policy和off policy的区别
4.R1的创新点和优化点
5.介绍常见的位置编码
6.介绍MLA和kv cache
7.介绍deepspeed
8.llm推理的框架
9.vllm的原理
10.怎么算ndcg和f1 score
coding:三数之和
2.PPO和DPO GRPO的区别
3.on policy和off policy的区别
4.R1的创新点和优化点
5.介绍常见的位置编码
6.介绍MLA和kv cache
7.介绍deepspeed
8.llm推理的框架
9.vllm的原理
10.怎么算ndcg和f1 score
coding:三数之和
全部评论
相关推荐
点赞 评论 收藏
分享
查看30道真题和解析 点赞 评论 收藏
分享
11-27 10:04
门头沟学院 Java 点赞 评论 收藏
分享

