03-18 03:50 门头沟学院推荐算法

关注

度小满大模型算法实习一面

欢迎友好讨论，信息共享
1.项目拷打
2.moe架构的专家路由是对每个token路由还是对每个序列路由
3.如果是对每个token路由，那么代码实现时是如何避免写对每个token的循环的
4.部署qwen3合成数据时候用的什么框架
5.在用qwen3-32b做推理时显存占用是多少
6.在多卡上部署模型时，用了什么策略使得GPU利用率能拉满
7.讲一讲vllm框架，他是如何保证GPU利用率的
8.讲讲flash attention
9.算法题：反转链表

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

看着问的还行啊

点赞回复分享

发布于 03-22 22:11 北京

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。 import torch import torch.nn as nn class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=...

查看24道真题和解析

点赞评论收藏

分享

05-07 12:21

复旦大学 C++

AI 项目面试，最容易翻车的【落地部署与痛点】

很多人准备 AI 项目只准备训练部分，结果被部署和实际痛点直接拷打翻车。面试官常问：模型怎么部署的，FastAPI 还是容器化，推理延时多少、能不能扛高并发。上线后有什么实际问题，大模型幻觉、RAG 检索不准怎么解决。还会追问项目里踩过最大的坑是什么，怎么排查定位、最后怎么复盘改进。更会问项目有没有实际业务价值，能不能落地投产。只停留在实验阶段、没考虑工程落地的，这一轮基本直接被问住。

查看4道真题和解析

点赞评论收藏

分享

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

04-14 08:50

广西大学算法工程师

快手大模型算法开发一面

1. 自我介绍2. 项目拷打3. Reward Model 在对齐训练里扮演什么角色Reward Model 本质上是在学一个“人类更偏好什么”的可微近似函数。SFT 学的是“像人那样答”，RM 学的是“人更喜欢哪种答法”。它并不直接生成答案，而是给候选答案打分，把人类偏好从离散排序信号压进一个标量目标里，后续无论是 PPO 还是其他策略优化方法，核心都要依赖这个分数去推动模型往偏好更强的方向移动。RM 最大的价值不是替代人工，而是把人工偏好从逐条监督扩展成可批量泛化的训练信号。真正难的地方在于它很容易学到表面模式，比如更长、更像模板、更会说套话的答案可能被错判成更优，所以 RM 训练的上限很...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

17167次浏览 120人参与

# Vibe Coding 会干掉初级岗位吗？ #

51864次浏览 330人参与

# 我的求职总结 #

487262次浏览 6873人参与

# 美团秋招笔试 #

219005次浏览 1197人参与

# 27届实习投递记录 #

85805次浏览 908人参与

# 实习生应该准时下班吗 #

360641次浏览 1762人参与

# 职场吐槽大会 #

361577次浏览 2308人参与

# 面试常问题系列 #

311217次浏览 4803人参与

# 面试中的破防瞬间 #

1269015次浏览 11141人参与

# 我是XXX，请攻击我最薄弱的地方 #

96396次浏览 642人参与

# 拼多多工作体验 #

62870次浏览 439人参与

# 机械人还在等华为开奖吗？ #

342076次浏览 1655人参与

# 华为工作体验 #

332494次浏览 1439人参与

# 牛油的搬砖plog #

207784次浏览 1337人参与

# 什么专业适合考公 #

73575次浏览 476人参与

# AI Coding实战技巧 #

32144次浏览 400人参与

# 实习工作，你找得还顺利吗？ #

597434次浏览 6758人参与

# 求职遇到的搞笑事件 #

192975次浏览 962人参与

# 运营每日一题 #

147765次浏览 981人参与

# 小厂实习有必要去吗 #

95268次浏览 453人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务