02-09 13:20 西安交通大学算法工程师

关注

日常大模型算法智谱一面

1.讲一下版式分析是怎么做的？bbox 的 IOU 是什么？
2.版式分析怎么做优化？目标检测有自己训模型吗？
3.现在有哪些版式解析的工具？都有什么优劣？
4.讲一下你的论文
5.讲一下你的这个横向，有演示视频吗？
6.clip 你是怎么用的？有微调过吗？
7.向量数据库了解多少？有一大堆图片如何过滤相似图片？
8.PDF 文档太长如何解决？RAG 讲一下
整体面试还是不错的，但是没后续了，不知道是哪里出了问题

全部评论

推荐最新楼层

在写日记的赖床专家很犯困

复旦大学搜索算法

CLIP现在还是非常强大的算法

点赞回复分享

发布于 03-05 15:39 河北

湖南大学安卓

难不成也是kpi面，被做局了

点赞回复分享

发布于 02-28 17:10 江西

02-21 15:47

上海交通大学算法工程师

阿里大模型一面

岗位名称：大语言模型算法面试时长：1h–1.5h自评分：8/10是否下一轮：是模型架构与基础原理目前主流大语言模型在架构设计上有哪些异同点？（追问）Decoder-only 和 Encoder-Decoder 在实际应用场景上有什么区别？介绍一下大语言模型中的注意力机制，多头相比单头注意力有何优势？（追问）如果减少头数会发生什么？是否一定性能下降？什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？（追问）涌现能力是否和模型规模线性相关？什么是 Embedding？词嵌入和句嵌入有何不同？（追问）Embedding 层是否会参与微调？为什么？大语言模型中的 Tokenization 是如...

技术必备题库

点赞评论收藏

分享

03-10 12:25

门头沟学院人工智能

实习面经腾讯大模型算法二面攒人品

给我面没招了，发点面经攒攒人品～1.GRPO 和 PPO 在 RLHF 中的核心区别是什么？2.KL 散度在 RLHF 中的作用是什么？它的公式如何直观理解？3.vLLM 的核心优势是什么？它是如何通过 PagedAttention 提升显存利用率的？4.Qwen3 和DeepSeek-R1 在架构上有哪些关键差异？5.微调数据集的结构是怎样的？有多少条？数据清洗和有效性验证是怎么做的？6.奖励函数是如何设计的？7.怎么避免模型靠堆字数刷奖励？8. KV Cache 在长上下文推理中可能被污染，你们有做缓存隔离或清理机制吗？9.本地部署时，如何平衡vLLM 的上下文长度和显存占用？是否做过量化或动态批处理？10.手撕：乘积最大子数组（LeetCode 152）

查看10道真题和解析

点赞评论收藏

分享

03-14 23:06

中山大学算法工程师

拼多多大模型

【一面】 1）介绍一个最能代表自己的项目2）项目里负责的边界是什么？哪些内容是亲手实现／验证的？3）电商领域预训练数据：低质过滤与去重会怎么做？用哪些简单指标快速判断数据质量？4) Pretrain 和 SFT 分别解决什么问题？5) Transformer 的基本结构怎么理解？6）多模态模型的大致结构是什么（图像编码器+连接层+ LLM )？最容易踩坑的点通常在哪里？7) SFT 数据如何更贴近业务：如何避免过度模板化？如何做基础的 train / test 去重来避免评测失真？8）对齐（ RLHF / DPO 等）整体思路是什么：为什么需要偏好对／奖励信号？【二面】1）做过的最有影响力的一件事是什么？具体推动了什么变化？2）训练不稳定怎么排查（ loss NaN 、 OOM 、吞吐下降）3) Long Context 常见思路有哪些？在业务里如何做&quot;能看长文本但不太贵&quot;的折中（摘要／分段／滑窗等）?4）如何做一套简单可执行的离线评测集？如何覆盖不同语言与类目？5）多模态场景怎么评估：如何检查&quot;图文一致性／不编造信息&quot;？优先加哪些自动化检查？6) Prompt ／模板如何管理：如何版本化、如何回滚、如何避免一次改动导致整体波动？7) 手撕：实现一个最简单的 top - k 采样（给定 logits ／概率，取 top - k 后重新归一化采样），并说明边界情况怎么处理。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

03-10 20:45

门头沟学院推荐算法

米哈游llm算法实习面经狠狠被拷打

被横向挂了，希望发出来对大家有帮助！1* 简单概述你简历中的两个项目，包括项目背景以及你的具体分工，是独立完成还是团队协作2* 项目的数据来源是什么？你是如何确定优化目标的？3* 比如数据从 100 条扩充到 1.2 万条，是否全通过自动化生成？生成的样本具体是什么样的？举个例子说明一下生成前后的对比4* 怎么保证自动化生成数据的正确性呢5* 在通过调整参数直到模型回答正确为止的过程中，是否意味着生成的CoT中存在错误逻辑？6* 经过数据清洗后，最终用于SFT的有效数据量是多少？7* 在做微调时，除了 LoRA 是否对比过其他的微调算法8* 你是如何评价微调效果的？测试集的比例是多少？微调前后的准确率分别是多少？原有的模型性能保留了多少？9* LLM常用的结构是什么？10* 说一下Transformer 的整体结构11* 目前主流大模型最常用的位置编码是什么？。12* 写一下多头注意力机制的数学公式。13* 公式中为什么要除以 \sqrt{d_k}？其对梯度消失或梯度爆炸有什么影响？14* 在 Transformer 的 Encoder 和 Decoder 中，哪些部分是可以并行计算的，哪些不可以？15* 除了 LoRA，你还了解哪些微调方法？16* 大模型训练通常使用什么损失函数17* 在机器学习基础中，二分类问题、多分类问题以及回归问题分别使用什么损失函数？18* 你了解哪些优化算法19* 模型训练中出现过拟合的常用解决方案有哪些？20* Dropout 在训练阶段和预测阶段的处理方式是否一致？为什么要这样做？21* 大模型中的“复读机问题重复生成是什么原因导致的？如何从解码策略或训练层面解决？22* 幻觉问题产生的原因是什么？目前常用的工程解决方案有哪些？23* 写出逻辑回归的数学公式。

点赞评论收藏

分享

03-14 18:52

已编辑

上海戏剧学院算法工程师

字节一二三面

一面：讲一下论文。深挖了一下项目。讲一下强化学习。代码题不是leetcode，完整做出来了。二面：讲一下论文。grpo和ppo的区别。大模型训练流程。拒绝采样数据处理怎么回事的。问了一下对自己的期待和未来职业规划。问了我的优点和缺点。没有编程题。三面：讲一篇自己的论文。介绍项目。问了微调大模型如何卡阈值。为什么CLIP的嵌入效果不好？有什么解决办法。手撕了infonce代码。许愿hr面。

查看14道真题和解析

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

14263次浏览 123人参与

# 重来一次，你会对开始求职的自己说 #

38210次浏览 409人参与

# MiniMax求职进展汇总 #

5968次浏览 135人参与

# 跟HR说什么能被秒回？ #

5315次浏览 106人参与

# 你的mentor是什么样的人？ #

56530次浏览 770人参与

# 春招/暑实第一面是哪家？ #

12380次浏览 165人参与

# 巨人网络春招 #

6482次浏览 114人参与

# 你认为工作的意义是什么 #

264907次浏览 1523人参与

# 华为海思工作体验 #

44530次浏览 160人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

1296次浏览 58人参与

# 面试官最爱问的 AI 问题是...... #

9031次浏览 337人参与

# 哪些瞬间让你真切感受到了工作的乐趣 #

26935次浏览 111人参与

# 现在入门AI应该走哪些方向？ #

2105次浏览 62人参与

# 你收到了哪些公司的笔试？ #

10934次浏览 64人参与

# 26年哪些行业会变好/更差 #

56739次浏览 527人参与

# 你的嫡系AI是哪个？ #

2143次浏览 62人参与

# 你今年的保底offer是哪家 #

176086次浏览 730人参与

# 27届实习投递记录 #

2974次浏览 67人参与

# 你现在的工作，是“成长”还是“消耗”？ #

6115次浏览 105人参与

# 为什么国企只招应届生 #

244227次浏览 1306人参与

# 烟草笔面经互助 #

27818次浏览 202人参与

# 快手求职进展汇总 #

741923次浏览 7119人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务