08-25 12:10 门头沟学院机器学习

关注

阿里大模型一面

1. 在LLM推理里，我们经常听到一个词叫prefill，能解释一下它是什么意思吗？

2. 我们来聊聊Transformer的基础吧。能先介绍一下Softmax函数吗？然后整体讲讲Transformer模型，特别是里面的QKV（Query, Key, Value）机制，能详细说说这个过程吗？

3. Transformer的训练复杂度还挺高的，尤其是在处理长序列时。你了解哪些工作是致力于降低它训练时间复杂度的？

4. 长上下文（long context）是现在LLM的一个研究热点，你都知道有哪些方法可以解决或者缓解长下文问题？

5. GQA（Grouped-Query Attention）的原理是什么？它又是怎么实现的？

6. 现在主流的大模型，像GPT系列，大多都用的是Decoder-only架构。为什么不采用像T5那样的Encoder-Decoder架构呢？

7. LoRA作为一种高效的微调方法，它的核心原理是什么？能讲讲吗？

8. 为了优化推理速度，KV Cache是一个很关键的技术。它的原理是什么？

9. 我们来聊聊你的项目经历吧。可以挑一个你觉得最有意思的实习、论文或者科研项目详细讲讲。

10. 来个场景题吧。假设我们是做电商的，你觉得可以怎么用大语言模型来解决我们的一些实际业务问题？

11. 最后来做两道算法题吧。第一道是“无重复字符的最长子串”，第二道是“排序链表”。

全部评论

推荐最新楼层

上海理工大学系统集成

已经很强了

点赞回复分享

发布于 08-26 17:46 上海

想要吃不胖

河北建筑工程学院机械结构工程师

我之前面阿里云，被拷打的不行了

点赞回复分享

发布于 08-26 17:02 河北

郑州大学 Python

感觉提问好简单

点赞回复分享

发布于 08-25 17:43 河南

骚客履薄冰

阿里巴巴_虎鲸文娱_算法工程师(实习员工)

牛蛙，阿里云，强度太高了

点赞回复分享

发布于 08-25 14:42 上海

09-03 21:29

南京邮电大学 Java

团子二面面经

加上代码题一共1h30min面试官介绍业务自我介绍前面40-50min全程拷打实习项目，面试官人很好，问的非常仔细不会的也会耐心给你解答，还请牛油们把自己项目吃透，多问为什么，另外不要包装太过😂后面简单的几道八股加算法题，计网相关，多看看模型，tcp，url总结，以实习项目为主发面经求好运

查看3道真题和解析

点赞评论收藏

分享

08-28 16:10

门头沟学院机器学习

字节大模型算法工程师面经

自我介绍——5min项目相关细节提问——5min（对项目不是很感兴趣）项目相关技术提问——25min * 2面（与之前的面经贴中重复的技术问题不在展示）1. 了解 DeepSpeed 吗？训练时用 ZeRO 优化主要是解决啥问题？ZeRO 的三个阶段分别都是啥？2. TP 或 PP 了解吗？3. 并行训练时，如果模型参数量不大，怎么决定用 PP 还是 TP 策略？它们各自有啥好坏？4. 如果用 TP=2 的策略，self-attention 层里的 QKV 矩阵具体是怎么切分的？5. 用 TP 的时候，主要会发生哪些通信？不同的切分方式会改变通信行为吗？举个例子呗。6. 讲讲 Flash At...

查看7道真题和解析

点赞评论收藏

分享

08-25 20:14

门头沟学院算法工程师

字节大模型一面

📍面试公司：抖音💻面试岗位：大模型算法❓面试问题：1. 拷打实习，问了很多很详细的数据和做强化学习的motivation2. 八股拷打（好久没看基础机器学习了都忘了）介绍一下优化器的发展现在大模型的优化器是什么ln和bn的区别encoder-only和decoder-only区别以及应用场景qkv具体是什么为什么是多头注意力上下文长度是什么，有什么作用lora和全参区别欠拟合和过拟合具体要怎么办3. 手撕一个复杂度o(1)的插入删除和随机等概率返回（最近怎么遇不到hot100了）🙌面试感想：面试官人很好业务也很好玩，可惜了我手撕写了好久好久还磕磕巴巴

查看11道真题和解析

点赞评论收藏

分享

08-28 19:02

已编辑

哈尔滨工业大学（深圳）算法工程师

快手大模型应用算法三面挂

本来以为快手是推的最快的那家，没想到三面一拖再拖最后还是挂了……tl：一面：8.7 面完第二天中午约二面二面：8.12 面完第二天发三面邀请 时间是8.18周末重新接到了面试邀请，时间改到8.198.19面试前5分钟，hr打电话说面试官出差了，约到8.25三面：8.25 问了下项目的角色，问了些场景题，然后开始聊天，比如兴趣、老家、规划、有没有别的offer，面完面试官说他们会横向一下于是，8.27早上一看，官网已经结束流程了，无电话通知无感谢信快手你好狠的心，再捞我我也不面了，三面挂阴影太大了这周有四家三面（主管面），目前周一面的快手已经挂了，周二雷火主管面，我问到是否还有下一面时回答道接下...

点赞评论收藏

分享

09-02 22:34

已编辑

门头沟学院测试开发

科大讯飞timeline

7.20 投递7.26 笔试8.21 一面8.28 二面+hr面9.2 已收到意向书 秋招第一个意向书！面试进展太速度了

点赞评论收藏

分享

评论

5

30

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 发面经攒人品 #

85912次浏览 1566人参与

# 巨人网络工作体验 #

20162次浏览 24人参与

# 开立医疗秋招 #

9715次浏览 110人参与

# 你被哪些公司挂了？ #

23282次浏览 145人参与

# 大厂无回复，继续等待还是奔赴小厂 #

215731次浏览 1466人参与

# 实习心态崩了 #

27555次浏览 204人参与

# 简历无回复，你会继续海投还是优化再投？ #

97544次浏览 803人参与

# 我的秋招日记 #

203856次浏览 3514人参与

# 邪修秋招思路 #

7169次浏览 147人参与

# 海康威视求职进展 #

86748次浏览 476人参与

# 一起聊字节 #

5531次浏览 51人参与

# 机械人值得去的小众企业 #

18336次浏览 48人参与

# 海康威视工作体验 #

39882次浏览 151人参与

# 柠檬微趣工作体验 #

10842次浏览 61人参与

# 听到哪句话代表面试稳了OR挂了？ #

33158次浏览 222人参与

# 25届如何提前做秋招准备？ #

182214次浏览 2506人参与

# 哪些公司一直卡在简历筛选 #

23419次浏览 119人参与

# 实习学到最有价值的工作习惯 #

11365次浏览 105人参与

# 你觉得第一学历对求职有影响吗？ #

117082次浏览 782人参与

# 一人一道大厂面试题 #

25544次浏览 319人参与

# 科大讯飞工作体验 #

23676次浏览 55人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务