求职战斗鸡

03-16 22:40 合肥工业大学算法工程师

关注

字节大模型算法日常实习一面

攒攒人品！有面试过同岗的朋友欢迎评论区交流
1.深挖多模态论文介绍transformer架构
2.详细说一下Decoder的因果注意力 QKV分别来自哪
3.Attention为什么要做scaled 不做会怎么样为什么用根号d_k
4.Transformer怎么做加速训练（KV缓存）训练和推理有什么区别（并行化）
5.深挖多模态大模型论文用的video-llama 讲一下大模型的结构
6.论文用了CoT讲一下论文的CoT是怎么样的
7.微调用的LoRA介绍一下LoRA
8.LoRA初始化怎么做的，用的秩是多少，为什么不选其他的数
9.知道deepspeed和megatron吗？分别介绍一下
10.论文用的deepspeed详细讲了一下三个stage分别是什么

全部评论

推荐最新楼层

牛客331535281号

上海理工大学 C++

请问是博士学历嘛

点赞回复分享

发布于 03-18 13:54 黑龙江

03-15 14:19

门头沟学院 Java

真的没招哩，快手上周四一面完的，现在还没有消息，这周三给hr打电话，hr说面试官还没有提交面评，这周五打电话已经不接了，这种情况怎么办

给个二面行不行：这种就默认挂就行了

点赞评论收藏

分享

03-17 08:17

吉林农业大学算法工程师

商汤科技大模型开发二面

1、自我介绍2、讲一下你做过的一个最有代表性的项目3、RAG 里 chunk 怎么切，为什么这是个关键点chunk 切分会直接影响召回质量和最终回答质量。因为向量检索不是按整篇文档检，而是按切分后的片段检。如果切得太长，一个 chunk 里会混入很多无关信息，虽然语义覆盖大，但相似度不一定集中，模型拿到后也不容易抓住重点。如果切得太短，单个 chunk 虽然很纯，但上下文不完整，容易导致召回回来的内容缺少关键信息。实际做的时候一般会根据文档类型来定。像制度文档、说明文档，可以按标题、段落、语义边界切；如果是 FAQ 或问答对，本身就天然适合按条切。通常还会设置 overlap，避免一个关键信息...

查看11道真题和解析

点赞评论收藏

分享

03-16 14:10

门头沟学院推荐算法

大模型算法日常实习二面-字节

攒人品中～ 1.  项目里最核心的贡献是什么？怎么评估效果？2.  对比学习中如果负样本和正样本拉不开距离（或太像了），你会怎么修改损失函数或采样策略？3.  FlashAttention 原理：跟普通 Attention 的差异是什么？实现里 $QK^T$、Softmax、$PV$ 这几步是怎么落地的？4.  分布式框架3D 并行与通信：怎么理解 DP/DDP？通信瓶颈一般卡在哪些环节？5.  14B 模型，FP16 权重大概多大？训练时还要加哪些开销？如果用INT8 大概能省多少显存？6.  `torch.contiguous()` 是干嘛的？为什么推理阶段在意内存连续性？7.  代码题：井字棋判胜：读取 txt 井字棋（3×3）状态，判断当前玩家是否获胜。8.  代码题：交叉熵损失：解释原理并手写实现。9.  代码题：线性回归 SGD：推导更新公式并手写实现。

查看9道真题和解析

点赞评论收藏

分享

02-21 15:47

上海交通大学算法工程师

阿里大模型一面

岗位名称：大语言模型算法面试时长：1h–1.5h自评分：8/10是否下一轮：是模型架构与基础原理目前主流大语言模型在架构设计上有哪些异同点？（追问）Decoder-only 和 Encoder-Decoder 在实际应用场景上有什么区别？介绍一下大语言模型中的注意力机制，多头相比单头注意力有何优势？（追问）如果减少头数会发生什么？是否一定性能下降？什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？（追问）涌现能力是否和模型规模线性相关？什么是 Embedding？词嵌入和句嵌入有何不同？（追问）Embedding 层是否会参与微调？为什么？大语言模型中的 Tokenization 是如...

技术必备题库

点赞评论收藏

分享

03-10 12:18

已编辑

电子科技大学 Java

美团暑期测试开发

官网投递了转正实习，直接约面说是项目实习，但是表现优秀可以转正（画饼），有人了解具体是个什么情况吗

如果实习可以转正，你会不...

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

25907次浏览 181人参与

# 实习生如何通过转正 #

129538次浏览 1467人参与

# MiniMax求职进展汇总 #

12705次浏览 222人参与

# 跟HR说什么能被秒回？ #

8120次浏览 152人参与

# 电信求职进展汇总 #

45165次浏览 207人参与

# 春招/暑实第一面是哪家？ #

17410次浏览 217人参与

# 巨人网络春招 #

9803次浏览 163人参与

# 快手年终开大包 #

11769次浏览 97人参与

# 海信求职进展汇总 #

97897次浏览 419人参与

# 面试官最爱问的 AI 问题是...... #

13636次浏览 478人参与

# 银行笔面经互助 #

184643次浏览 1303人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2418次浏览 82人参与

# 秋招提前批，你开始投了吗 #

728989次浏览 8459人参与

# 设计人秋招体验最好的公司 #

85913次浏览 742人参与

# 你的嫡系AI是哪个？ #

3511次浏览 96人参与

# 现在入门AI应该走哪些方向？ #

3455次浏览 84人参与

# 你收到了哪些公司的笔试？ #

15610次浏览 86人参与

# 迅雷笔试 #

5341次浏览 27人参与

# 机械人，说说你的烦心事 #

135402次浏览 1136人参与

# 你最近一次加班是什么时候？ #

114531次浏览 561人参与

# 找工作中的小确幸 #

85103次浏览 463人参与

# 实习学到最有价值的工作习惯 #

64628次浏览 491人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务