求拉，谢谢_牛客网

2022-08-02 14:45

关注

求拉，谢谢

06-05 16:44

门头沟学院算法工程师

大模型面经每日总结(奇安信2025/6/5)

简述 Transformer 多头注意力机制理解词间关系的原理。训练 Transformer 时，如何解决梯度消失或梯度爆炸问题？GPT 等模型对 Transformer 结构做了哪些改进以提升生成效果？如何优化 Transformer 模型预测速度？说明 RAG 结合外部知识库与大语言模型提升回答准确性的机制。用 RAG 构建问答系统时，如何处理检索内容不相关或不全的问题？如何确定 RAG 系统中文档的合适切分粒度？当 RAG 系统知识库数据量大、检索慢时，有哪些提速方法？如何协同使用 Transformer 与 RAG 以发挥最佳效果？用 RAG 优化模型回答，有哪些实用...

查看12道真题和解析

点赞评论收藏

分享

昨天 09:56

门头沟学院算法工程师

大模型面经每日总结（京东大模型实习）

1. 基础概念题：什么是大模型核心加速技术中的 “算子融合”？举例说明其作用。答案要点：算子融合是将多个连续计算算子合并为一个，减少计算图中的节点数和显存读写次数，降低延迟。举例：如将 Transformer 中的 Add（残差连接）与 RMSNorm（归一化）融合，减少两次内存访问，提升推理速度。2. 技术原理题：Flash Attention V2 如何优化注意力计算效率？与 V1 的核心区别是什么？答案要点：• V1：通过分块计算注意力，减少显存占用（避免存储所有中间键值对）。• V2：引入 “内外循环交换策略”，将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式，进一步提升计算效率，尤其在长序列场景下加速明显。3. 量化技术中，FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异？4. RAG 系统中，文档切分粒度如何影响检索和生成效果？实际中如何确定最优粒度？5.在长序列推理场景中，PagedAttention 和 Prefix Caching 分别解决什么问题？如何配合使用？答案要点：• PagedAttention：将 KV Cache 分块存储在非连续显存中，避免显存碎片，支持处理超长序列（如百万 Token）；• Prefix Caching：缓存历史对话的 KV 对，跨请求复用，减少重复计算（如多轮对话中复用上文缓存）。配合逻辑：PagedAttention 解决显存限制，Prefix Caching 减少计算量，两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中，如何根据需求选择量化方案？举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应；金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。

点赞评论收藏

分享

05-27 17:46

已编辑

宁夏理工学院 C++

［26实习/已oc］泰隆银行暑期超级实习生

鼠鼠的第一个实习offer，感谢泰隆收留，泰隆的恩情还不完🖐️😭🖐️bg双非硕，本科打过a，简历上一个c++渲染器项目和一个go分布式缓存项目。时间线4.26 测评4.29 笔试5.12 一面通知5.16 一面5.20 二面通知5.22 二面5.26 oc面试问题话说泰隆的面试好短，一面20分钟，二面30分钟，属于是刚进状态就结束了。一面讲一个你打xcpc时用过的算法。（胡乱讲了讲线段树，自认讲的挺乱的）项目相关，细讲arc缓存算法。（依然是意识模糊向讲解，还好面试官理解能力超群）反问：实习生日常工作内容是什么。（介绍工作内容时提到过go）银行也有go的岗位？二面二面有两个面试官，一个h...

查看13道真题和解析面试问题记录

点赞评论收藏

分享

昨天 16:04

天津科技大学 Java

请问银行的金融科技岗暑期实习看学历吗？

本硕双非计算机，java路线，投了几个银行的科技岗都没消息，是我太菜了吗

金融银行求职进展汇总

点赞评论收藏

分享

昨天 16:21

东南大学 C++

嵌入式面经不是面试时才看！！

学弟学妹们，别等到临近秋招或者已经开始秋招才开始搜面经！嵌入式面经应该越早看越好🧠 为什么面经要提前看？我认识不少同学，都是秋招时才临时开始刷面经，结果发现：项目根本讲不清楚，面试被问穿了；操作系统、RTOS、C++基础一问三不知；面试时间间隔太短，临时学根本来不及。面经从来不是“考前突击包”，而是“学习指南”。你在库库学C、RTOS、Linux，可你知道这些知识企业是怎么考察的吗？学了一堆，是在感动自己，还是真的学了面试需要的东西？你知道你做的项目，哪些点是面试官关注的？哪些能写进简历打动HR？这些都得通过看面经、整理八股才能建立“对标意识”。📄 面经怎么整理，怎么用？📌两个方向整理八...

嵌入式笔面经分享牛客创作赏金赛

点赞评论收藏

分享

牛客热帖

更多

正在热议

更多

# 我的实习收获 #

24900次浏览 431人参与

# 在国企工作的人，躺平了吗？ #

333239次浏览 3862人参与

# 实习吐槽大会 #

26555次浏览 129人参与

# 商战，最累的是我们 #

12736次浏览 50人参与

# 晒一晒你的工位 #

84272次浏览 299人参与

# 我的租房踩坑经历 #

20636次浏览 237人参与

# 穿越回高考你还会选现在的专业吗 #

18324次浏览 235人参与

# 毕业旅行去哪玩儿 #

1004次浏览 29人参与

# 小厂实习有必要去吗 #

46383次浏览 267人参与

# 求职你最看重什么？ #

69547次浏览 393人参与

# 牛友们，签完三方你在忙什么？ #

94896次浏览 837人参与

# 夸夸我的求职搭子 #

190783次浏览 1890人参与

# 摸鱼打卡站 #

39307次浏览 687人参与

# 携程求职进展汇总 #

530223次浏览 3949人参与

# 产运销实习日记 #

51963次浏览 551人参与

# 打工人锐评公司红黑榜 #

145360次浏览 908人参与

# 网易求职进展汇总 #

101828次浏览 982人参与

# 你小时候最想从事什么职业 #

95477次浏览 1719人参与

# 作业帮求职进展汇总 #

52425次浏览 354人参与

# 高学历就一定能找到好工作吗？ #

47545次浏览 589人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务