03-18 03:50 门头沟学院推荐算法

关注

度小满大模型算法实习一面

欢迎友好讨论，信息共享
1.项目拷打
2.moe架构的专家路由是对每个token路由还是对每个序列路由
3.如果是对每个token路由，那么代码实现时是如何避免写对每个token的循环的
4.部署qwen3合成数据时候用的什么框架
5.在用qwen3-32b做推理时显存占用是多少
6.在多卡上部署模型时，用了什么策略使得GPU利用率能拉满
7.讲一讲vllm框架，他是如何保证GPU利用率的
8.讲讲flash attention
9.算法题：反转链表

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

看着问的还行啊

点赞回复分享

发布于 03-22 22:11 北京

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。 import torch import torch.nn as nn class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=...

查看24道真题和解析

点赞评论收藏

分享

04-12 03:30

门头沟学院算法工程师

27实习腾讯pcg大模型算法一面

给我面没招了，发点面经攒攒人品～1.项目拷打2.pagedattention核心原理；continuous batching；vllm部署的推理策略。3.grpo和ppo的区别以及两者训练时的细节。4.如何判断推理能力和最终答案之间是否有关联；如果不匹配怎么改进？5.推荐场景chosen/reject怎么构造？6.历史反馈有曝光偏差，学不到真实偏好，怎么解决？7.多目标reward怎么设计

查看7道真题和解析

点赞评论收藏

分享

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

04-08 23:46

已编辑

华中农业大学 golang

到底谁在做AI infra呀！

欢迎投递简历！ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动基础设施基础技术团队负责公司统一的基础软件，编译器&amp;语言，DPU，大规模池化存储以及云原生计算集群，AI for Infra，Infra for AI等相关领域，覆盖了在线存储、实时、离线、机器学习、软硬一体、AIOps等多种应用场景，支持公司内外广泛的场景和需求。1、负责集团云原生计算底座，支持推荐、广告、搜索、大模型等训推场景集群管理与调度工作，同时支持集团整体的通用计算业务；2、参与字节跳动GPU集群统一调度系统的设计与实现，优化大规模AI训练与推理场景的资源分配效率；3、参与Agent Runtime底层系统开发，探索轻量级虚拟化、高密度容器镜像等前沿技术；4、参与基础设施的智能化运维，用Agent方式重构传统运维流程，提升系统的自动化与智能化水平；5、参与超大规模基础设施的可用性和稳定性保障。

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

15981次浏览 163人参与

# 26届秋招投递记录 #

124486次浏览 688人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

46677次浏览 510人参与

# 如果春招能重来，我会___ #

17059次浏览 195人参与

# 你觉得实习能学到东西吗 #

153583次浏览 1489人参与

# 除了线上，还能去哪些地方投简历 #

9691次浏览 109人参与

# 大家每天通勤多久？ #

119351次浏览 1653人参与

# 为了实习逃课值吗？ #

81894次浏览 580人参与

# 想做Agent可以做哪些岗位？ #

14203次浏览 437人参与

# 面试官拷打AI项目都会问什么？ #

14608次浏览 479人参与

# 互联网公司评价 #

535903次浏览 4187人参与

# 九月了，是考研还是就业？ #

110004次浏览 610人参与

# 金三银四，你的春招进行到哪个阶段了？ #

36181次浏览 336人参与

# 转正答辩报告怎么写 #

61266次浏览 810人参与

# 你觉得最好用的AI编程工具是_ #

5307次浏览 98人参与

# 一份好的简历长什么样？ #

41590次浏览 504人参与

# 浅聊一下我实习的辛苦费 #

291553次浏览 1801人参与

# 实习，不懂就问 #

214959次浏览 1711人参与

# 你找工作的时候用AI吗？ #

209034次浏览 1021人参与

# 通信硬件薪资爆料 #

1318650次浏览 7290人参与

# 影石Insta360求职进展汇总 #

189864次浏览 1383人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务