米哈游大模型算法 实习面经

发点面经攒攒人品~
1.项目拷打
2.你如何评估大模型的性能?有哪些常用的评估指标?
3.请描述一下你如何对大模型进行优化,以提高其性能和效率。
4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。
5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?
6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?
7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?
8.在大模型设计中,如何权衡模型的复杂度和性能?
9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?
10.请简述你了解的大模型的主要结构特点。
11.reward bench上的reward model分哪几类?
12. reward model如何训练的,训练目标是什么?
13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?
14.指令跟随能力的评估集有什么,如何评估的?
15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?
16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?
全部评论
大佬这是暑期还是日常实习啊
点赞 回复 分享
发布于 03-19 16:37 天津
可以问下bg吗
点赞 回复 分享
发布于 03-17 18:25 上海

相关推荐

03-17 09:38
已编辑
门头沟学院 C++
更新:我知道自己懂的东西也不是很全面,比如 Redis 默认的持久化策略我事先其实真的没有去了解。我也没能在在整个面试陷入奇怪的境地前,理解面试官的意图,尝试用理论知识把它拉回来并引导面试官的提问方向。但是我依旧觉得面试官也有很大问题。其实一面的体验就不是很好,但是二面更让我难受。虽然我也不是什么后端领域大神,但是这场面试真的让我惊呆了。我在简历上写着用 Docker Compose 部署了一个服务(后端程序+数据库+Redis+Nginx,一共四个实例),面试官一直不理解我的 Redis 使用方式,问我怎么持久化。我说不需要持久化,因为只是缓存数据和限流数据。面试官说那服务重启怎么办,数据不会丢失吗。我就说这些数据丢失也是无所谓的,而且我只需要重启后端程序,缓存依旧保留在 Redis 里。跟面试官说了很久都不明白,他觉得我的服务一重启缓存就全丢失了。后来他甚至觉得我不了解我的项目,觉得我分不清缓存是在后端程序的内存里还是 Redis 里,我很无语…我跟他说在 Redis 里,不持久化,慢慢地他就觉得我用 Redis 没有用,他觉得 Redis 缓存和走数据库一样得经过网络,没有提速效果,差不了多少,缓存到后端程序里才有意义。后来我们不聊这个了(那时我的体验已经很不好了),我们开始写算法题。我就写了一题,用滑动窗口判断是否是连续的重排子串。结果我不知道面试官是不是不懂 C++,他仿佛看不懂我的代码。我写了两版,第一个用两个 unordered map 存储短字符串的字符出现数和窗口里的字符出现数。我写完第一版时他去忙别的了,我觉得可以只用一个 unordered map 存窗口 diff,开始写着他就回来了。对于第一个版本,他就没有多问。对于第二个版本,这是我最心累的部分——他好像看不出我循环里的 i 是窗口左边界还是右边界,对于循环终止条件也不清晰,听不懂我说的对于长度 3 的短串在长度 4 的长串里只会循环 2 次的说法,一直问我第 3 次循环会发生什么,我真的很疑惑。他说我的代码肯定是错的,让我测试样例,结果我都通过,他很不解。我们就一起把面试至少三分之二的时间花在单步口头调试这个程序上,最后没时间了才进入下一个回合。下一个回合更奇特,他直接问我前端知识。虽然我在简历里写了一些前端,但是我面试的是后端,前端只是我项目的一部分。然后就是一些过场,问我 Vibe Coding、OpenClaw,我如实回答。最后到反问部分,我只想赶紧结束这次尴尬的面试,直接回答“没有问题”,然后互相道别。全程没有问到大家面经里说的 InnoDB 设计、Redis 数据结构等等。非常难受的经历。
查看5道真题和解析
点赞 评论 收藏
分享
查看13道真题和解析
点赞 评论 收藏
分享
评论
3
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务