抖音大模型算法校招一面 base北京
1.论文用了哪些 RL 算法? 为什么用 DAPO,论文怎么写的?
2.DAPO 超参数对你的领域影响是什么? 你觉得 Clip higher 为什么起作用
3.还有哪些 RL 算法,GSPO 了解过吗? 为什么你的 ACL 的 Agentic 没有用 GSPO?
4.MLLM 训练有哪些节省内存方法?
5.相比较 CV 的小模型,MLLM 你的部署有哪些 trick? 推理加速有什么方法吗?
6.对个人信息 memory 检索和存储有什么好的 trick 和 idea?
7.agentic 思维链信息过长优化方法? 超出上下文导致遗忘或者幻觉严重你是如何解决的?
8.手撕:最长字符子序列
9.反问:业务内容
2.DAPO 超参数对你的领域影响是什么? 你觉得 Clip higher 为什么起作用
3.还有哪些 RL 算法,GSPO 了解过吗? 为什么你的 ACL 的 Agentic 没有用 GSPO?
4.MLLM 训练有哪些节省内存方法?
5.相比较 CV 的小模型,MLLM 你的部署有哪些 trick? 推理加速有什么方法吗?
6.对个人信息 memory 检索和存储有什么好的 trick 和 idea?
7.agentic 思维链信息过长优化方法? 超出上下文导致遗忘或者幻觉严重你是如何解决的?
8.手撕:最长字符子序列
9.反问:业务内容
全部评论
相关推荐
帮你内推|阿里巴巴集团 实习 点赞 评论 收藏
分享
03-25 18:24
广东海洋大学 前端工程师
smile丶snow:感觉可以加一些ai相关的内容吧。现在面试很少能逃掉这些问题。羡慕里面感觉缺少一个项目背景。比如第二个项目后台管理系统…你为什么要做这个后台管理系统呢?是为了解决什么问题。比如你管理一个商品列表的增加减少。需要一个背景吧。哦或者说你第一个电子书那个是c端的,你肯定需要一个管理系统吧,那就是第二个后台管理系统,但这两个难道不应该是一个项目吗?可以稍微包装一下,最起码让人看着不是玩具项目。个人观点。 点赞 评论 收藏
分享
03-27 17:02
湖北大学 Java 点赞 评论 收藏
分享