04-12 03:30 门头沟学院算法工程师

关注

27实习腾讯pcg大模型算法一面

给我面没招了，发点面经攒攒人品～
1.项目拷打
2.pagedattention核心原理；continuous batching；vllm部署的推理策略。
3.grpo和ppo的区别以及两者训练时的细节。
4.如何判断推理能力和最终答案之间是否有关联；如果不匹配怎么改进？
5.推荐场景chosen/reject怎么构造？
6.历史反馈有曝光偏差，学不到真实偏好，怎么解决？
7.多目标reward怎么设计

全部评论

推荐最新楼层

04-10 20:07

广西大学算法工程师

面壁智能大模型应用开发二面

1. 项目拷打 问的非常细 , 聊了30min2. GRPO 里的 reward 一般怎么设计，怎么避免模型学歪GRPO 的 reward 设计关键不是“打分越多维越好”，而是要保证相对排序真的有意义。常见做法是把 reward 拆成几部分，比如正确性、格式遵循、长度惩罚、拒答合理性、安全性这些，再做加权组合。对于推理任务，最核心的一般还是结果正确性和过程可验证性；对于开放式生成，还得控制风格漂移和模板化输出。真正难的是 reward hacking。模型很容易学会一些表面上拿高分、实际上没解决问题的套路，比如故意写很长、固定套模板、强行迎合裁判模型。所以 reward 设计通常不能只靠单一 ...

AI-Agent面试实战...

点赞评论收藏

分享

03-21 17:50

门头沟学院推荐算法

米哈游大模型算法实习二面 55min

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.你如何评估大模型的性能？有哪些常用的评估指标？3.请描述一下你如何对大模型进行优化，以提高其性能和效率。4.你是否有过使用或开发大模型的经验？请分享一个具体的案例。5.大模型中的注意力机制是如何工作的？它在大模型中起到了什么作用？6.大模型中的优化算法有哪些常见的选择？它们各有什么优缺点？7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题？8.在大模型设计中，如何权衡模型的复杂度和性能？9.面对大模型训练和推理所需的庞大计算资源，你有什么解决建议？10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?reward model如何训练的，训练目标是什么?13.dp0训练的损失函数和训练目标，dpo如何改进怎么理解大模型安全，包含哪些方面的内容？

查看13道真题和解析

点赞评论收藏

分享

04-06 23:55

广西大学算法工程师

去哪儿大模型开发一面

1. 因果推断在多模态训练里能解决什么问题，为什么不是普通相关性学习就够了多模态场景里最容易出的问题就是模型学到“看起来相关”的捷径，而不是任务真正依赖的稳定因素。比如图像里某类背景、拍摄角度、文本描述习惯，可能和标签高度共现，但它们并不是真正决定结论的原因。因果推断的价值在于尽量把这些混杂因素拆出来，让模型更关注跨环境都稳定成立的信号。如果只靠相关性学习，训练集上可能效果很好，但一换数据源、设备、标注风格，性能就会掉得很厉害。因果思路不一定意味着一定要上完整的因果图模型，也可以体现在样本构造、环境分组训练、反事实增强和不变风险约束上。它本质上是在问：模型到底学到了可迁移规律，还是只记住了数据...

AI-Agent面试实战...

点赞评论收藏

分享

04-18 15:12

北京大学 Java

我觉得可以从几块入手：先把大模型的基本原理搞懂，比如推理方式和上下文机制；再学一下工具调用、函数调用这些怎么和外部系统交互；框架的话可以看看 LangChain、Agent流程这些。最后还是要自己做点小项目，把流程跑通更重要。

想从事Agent应该学习...

点赞评论收藏

分享

03-26 09:27

门头沟学院 Java

AI时代岗位活路全景图

刷到这个话题，发现很多同学对AI时代的岗位认知，还停留在“AI能写代码=程序员要失业”的表层焦虑里。作为在AI行业摸爬滚打了一年的开发，结合行业现状和招聘市场的真实需求，今天给大家做一份完整的「AI时代岗位活路全景图」，分6大类讲清楚：哪些岗位不仅不会被AI替代，还会在AI浪潮里迎来长期红利，核心壁垒是什么，入行需要什么能力，全是干货，没有一句废话。先给一个最核心的底层逻辑：AI能替代的，是标准化、重复性、低决策成本的执行类工作；永远替代不了的，是需要非标准化、深度思考、复杂决策、业务理解、人性洞察的工作。判断一个岗位有没有活路，就看它的核心价值，是执行，还是思考与决策。一、AI原生核心赛道：...

你觉得什么岗位会被AI替...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

61962次浏览 535人参与

# 机械笔面试考察这些知识点 #

17814次浏览 121人参与

# 商战，最累的是我们 #

31435次浏览 97人参与

# AI时代还有必要刷leetcode吗？ #

45742次浏览 550人参与

# 分享一个让你热爱工作的瞬间 #

69736次浏览 504人参与

# 米哈游笔试 #

671301次浏览 1207人参与

# 毕业租房也有小确幸 #

173443次浏览 4555人参与

# 字节7000实习来了，你投了吗？ #

42243次浏览 319人参与

# 想从事Agent应该学习哪些技术？ #

13286次浏览 379人参与

# 机械制造秋招总结 #

117691次浏览 927人参与

# 大学生该如何认清当下的就业环境？ #

165565次浏览 905人参与

# 国企/银行/研究所公司爆料 #

209038次浏览 917人参与

# 26届春招投递记录 #

4727次浏览 49人参与

# 有哪些公司在面试时考察AICoding？ #

26315次浏览 427人参与

# 实习必须要去大厂吗？ #

202152次浏览 1784人参与

# HR面都在聊什么？ #

20797次浏览 230人参与

# 初创公司值得加入吗？ #

44660次浏览 226人参与

# 春招什么时候投？ #

52391次浏览 709人参与

# 你都在哪些场所面过试？ #

80865次浏览 506人参与

# 你现在一天AI几次？ #

21929次浏览 147人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务