05-18 16:46 已编辑华南农业大学自然语言处理发布于湖北

关注

vivo大模型研究员一面

📍面试公司：vivo

💻面试岗位：大模型研究员

❓面试问题：

1、自我介绍
2、项目介绍
3、项目交流
4、讲一下为啥用DPO
5、数据集是怎么构建的？
6、怎么去的分析badcase
7、会去写训练代码吗？
8、chatglm结构
9、代码题：和最大子数组
10、反问

🙌面试感想：Boss投的，应该是日常实习。岗位叫啥研究员，感觉不太像搞啥研究

，部门好像是做图片视频理解的。两个面试官，轮着交流。听说就两面，后面还有一面hr面，看看有无后续。

#面试问题记录# #面经# #大模型算法工程师# #算法工程师#

全部评论

推荐最新楼层

牛客396532196号

南京邮电大学 Java

楼主的项目涉及到ChatGLM吗？

点赞回复分享

发布于 05-30 08:21 江苏

门头沟学院 Java

xd啥背景呀，好多面，羡慕

点赞回复分享

发布于 05-26 17:07 辽宁

牛客372710554号

百度_大搜_搜索(实习员工)

官网能投暑期

点赞回复分享

发布于 05-20 20:42 北京

IWillHave6Offers

门头沟学院人工智能

今天面的吗？

点赞回复分享

发布于 05-18 17:58 上海

06-03 19:25

已编辑

门头沟学院 Java

大模型面经（第二期）

上期写道刚开始面试的时候，这期写一写5月11号时候，这个时候手上就已经有两三家offer了，然后去北京的前一两天又发了三家offer随便选了个离公司近的工资高点的就去了。那么这期还是讲一下怎么去面试。其实面试的东西都一样，就是说你干过什么，回答问题就行了你要考虑的，不是这么去背八股文，而是要去琢磨到底要不要去实习，我个人而言，我最开始是因为电脑配置带不动才去好点的公司有好的卡给我用，然后呢去了也有工资，但是我的自由被限制了，我没法再天天琢磨新玩意我很痛苦，然后学会了怎么摸鱼，人家都是9点半来，我一开始是8点40到，我现在就吃了早饭再去差不多9点能到（就尽力偷懒还是最勤奋的那一批，因为人家都是老...

查看13道真题和解析牛客激励计划面试问题记录

点赞评论收藏

分享

05-30 16:03

门头沟学院算法工程师

B站大模型一面

📍面试公司：B站💻面试岗位：大模型❓面试问题：手撕多头注意力机制，然后问了为什么除以dk，除了注意力，transformer还有什么，batch norm和layer norm的区别，非线性是谁提供的对比学习的loss聊了很久的论文，具体都有什么场景dpo和ppo的区别，包括理论上，还有项目实际落地闲聊+反问🙌面试感想：体验良好，整体氛围很轻松

哔哩哔哩一面137人在聊

查看8道真题和解析面试问题记录

点赞评论收藏

分享

06-05 10:36

北京蜜堂有信科技有限公司_运营部_运营经理

2025年国内AI推理大模型效果对比：DeepSeek、通义千问、腾讯混元

随着人工智能技术的飞速发展，AI推理大模型已经成为各行业关注的焦点。2025年，国内AI推理大模型领域呈现出百家争鸣的态势，其中DeepSeek、通义千问和腾讯混元等模型尤为引人注目。本文将从技术架构、性能表现、应用场景等多个维度对这三款模型进行对比分析。 本文针对5个服务商分别从数学逻辑推理、化学逻辑推理、生物逻辑推理能力、产品优势、基础技术参数、核心性能指标来进行对比。我们提供了一份详细的比较报告，涵盖多维度分析和丰富的数据对比，帮助用户快速了解服务商的特点，做出专业、明智的选择。 下图是我们对DeepSeek、腾讯混元、KimiGPT、百川大模型、通义千问多款AI文本生成工具进行多维度的...

点赞评论收藏

分享

05-28 20:13

中山大学算法工程师

强度拉满:网易大模型算法岗

1️⃣一面时间：9.12  时长：1hcode：统计岛屿数量、最大岛屿面积，DFS方法解了然后介绍实习项目，面试官非常耐心地听，没有打断八股1.bert和gpt的区别？（从模型架构、训练方式、使用场景方面回答的）2.训练/微调一个LLM的流程？3.实习时用的 megatron 框架吗，对分布式训练框架了解多少？（回答了deepspeed和megatron区别，以及几种并行方式，以及deepspeed的三种zero）4.了解强化学习吗，跟SFT有什么区别？5.反问：业务，对岗位的期望💣评价：有点紧张，算法题有一个小失误没注意到2️⃣二面时间：9.14  时长：1h八股1.写一下 attention 公式（代码实现了下）2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别？4.计算attention时为什么要除以d_k，这个d_k的含义是？5.attention计算时还有哪些scale处理？6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？7.解释数值上溢、下溢问题8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt9.讲一下SFT，会对哪部分计算loss？为什么？10.讲一下deepspeed11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？12.训练模型时用了几张卡，有遇到什么异常中断问题吗？反问： 在乎候选人什么能力？对面试表现有哪些改进意见？💣评价： 基础不够扎实，网上有的知识都能回答上来，在同龄人里算比较优秀，欠缺一些多机多卡实践经验。  

查看17道真题和解析

点赞评论收藏

分享

05-19 14:11

已编辑

TCL实业_家庭机器人交互产品实习生(实习员工)

面试唠嗑时说这些大模型知识能唬住面试官（1）

（一）语言模型的发展历程词元（Token）1. 统计语言模型（Statistical Language Model，SLM）通常是根据词序列中若干个连续的上下文单词来预测下一个词的出现概率，即根据一个固定长度的前缀来预测目标单词。2. 神经语言模型（Neural Language Model，NLM）使用神经网络来建模文本序列的生成，例如word2vec（构建了一个简化的浅层神经网络来学习分布式词表示，所学习到的词嵌入（分布式词向量）可以用作后续任务的语义特征提取器）。3. 预训练语言模型（Pre-trained Language Model，PLM）代表：ELMo、BERT、GPT-1编码器...

《大语言模型》阅读笔记面试问题记录牛客激励计划

点赞评论收藏

分享

评论

3

7

招聘动态

华泰证券Fintech星战营

奇安信—菁英计划（26届）

网安一哥可转正实习专场招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习吐槽大会 #

47598次浏览 218人参与

# 产品实习，你更倾向大公司or小公司 #

150500次浏览 1931人参与

# 我的实习收获 #

39127次浏览 564人参与

# 得物求职进展汇总 #

96295次浏览 805人参与

# 晒一晒你的工位 #

89129次浏览 318人参与

# 硬件兄弟们甩出你的华为奖状 #

103821次浏览 689人参与

# 现在还是0offer，延毕还是备考 #

1030563次浏览 7549人参与

# 产品每日一题 #

43292次浏览 560人参与

# 如何看待offer收割机的行为 #

777303次浏览 6020人参与

# 大城市找工作会更容易吗 #

38070次浏览 332人参与

# 工作中，努力重要还是选择重要？ #

122871次浏览 1536人参与

# 来聊聊你目前的求职进展 #

627184次浏览 6725人参与

# 投格力的你，拿到offer了吗？ #

82158次浏览 571人参与

# 互联网回暖，腾讯要招5000人！ #

17097次浏览 557人参与

# 我的租房踩坑经历 #

40645次浏览 384人参与

# 26届秋招投递记录 #

6086次浏览 156人参与

# 提前批过来人的忠告 #

103241次浏览 1126人参与

# 为什么国企只招应届生 #

172646次浏览 1140人参与

# 硬件人秋招的第一个offer #

72201次浏览 1110人参与

# 移动求职进展汇总 #

1825次浏览 19人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务