首页 / 智谱AI
#

智谱AI

#
28623次浏览 406人互动
此刻你想和大家分享什么
热门 最新
2024-09-11 19:39
已编辑
西安交通大学 算法工程师
这周的一些面经
这周一腾讯QQ一面秒挂影响了心情,这周的面经都没写面经的话尽量回忆一下联想一面1. 问了一个比较怪的问题,我没有很理解。就是我项目里面有做RLHF,他就问我的RM怎么训练的,回答给SFT模型加一个线性层输出reward值,然后就问我这个过程需要导什么库?答加载模型需要transformers库,然后问我加那个reward头需要什么库?有点懵,不是很懂他想问什么,加头的做法是参照LlamaforSequntialClassification做的2. 然后其他的都是一些常规问题,不太记得了,没有做题腾讯 QQ 一面1. 主要拷打了一下实习和项目2. 然后问我如果在QQ想做什么,回答了可能做QQ短视频、小世界的一些推荐(给自己挖坑,推荐只是速成了一下,不是很熟悉)3. 然后开始问推荐怎么和大模型进行结合?问开放性问题:怎么去给QQ短视频里面的视频做推荐?怎么挖掘这些视频的标签? 只能说自己挖坑自己受苦4. 手撕出了一个 寻找目标值,之前面试的时候做过,结果这次做的有些小bug,感觉是这个导致了最后挂字节 广告算法 一面重量级来了1. 上来没有问实习,没有问项目直接开始八股轰炸2. transformer相关经典八股,问了有一个问题我觉得值得说一下,就是问我知不知道序列中每一个token的embedding在经过很多层self attention之后会变得相似的问题以及对应的原因?之前没有思考过,当场思考了一下,意思大概是深层网络往往学到的是序列的全局特征,所以会相似,还有就是每一次做self attention相当于在做平滑。这部分确实还得再想想3. 开始机器学习相关,手撕一个二分类的全流程,从输入到embedding到分类网络到sigmoid函数到交叉熵loss(中间的具体模型用一个函数代替即可)4. 手撕上述交叉熵loss的链式求导,就是loss对p求导,p对sigmoid求导(这里需要记住sigmoid的导数等于sigmoid x (1-sigmoid),不然现场推怕是推不了一点)5. 做一个最长公共子序列,算是常规6. 改成子串再做一遍。。。。(这个还是想了好久怎么改DP的条件)只能说不愧是字节,希望二面不要太折磨人😩中兴 算法工程师(智算)一面会议室里面进来了四个人😨,离谱1. 主要还是问实习和项目2. 其中一个面试官感觉像是套方案,疯狂问我实习部分继续预训练的数据大小、数据配比、数据清洗、训练流程、训练参数、学习率,感觉是遇到这种面试官还真得牢记项目的全流程,一些环节忘了就有点尬了智谱AI GLM对齐团队 一面1. 实习、项目拷打2. 因为是对齐团队,所以很care我有没有关注目前前沿的RLHF方法(前沿的关注不了一点,只能说了一些感觉有点早的东西)3. 大概讲了 从优化PPO出发和优化DPO出发的两类对齐方法,优化PPO的比如deepseek的GRPO,优化DPO的比如一堆DPO变体,以及DPO加正则化的方法。中间还让我从强化学习的角度给出优化PPO的方法,我就讲了一下老本行,从PG到REINFORCE到TRPO到PPO,然后表示我也不知道怎么优化PPO,已经是强化学习工业界用的最广泛的了哈哈哈哈哈4. 手撕了一个transformer的decoder block5. 记忆里应该还是问了Deepspeed跟Megatron智源人工智能研究院 行业大模型 一面1.时长半个小时,主要拷打实习经历,我实习做的也是领域大模型。非常巧的是,面试官也在美团同一个部门实习过,甚至认识我老板,希望不要跟我老板对情况,戳穿我吹牛逼的东西快手 推荐大模型 二面1. 记不太清问了些啥了,感觉是实习主要加LLM的一些经典八股(感觉是不超出我目前写过的面经的范围)2. 手撕了一道最小编辑距离,写的时候有一个地方=写成==了,一直检查不出来,给面试官逗笑了京东 NLP 二面1. 主要拷打实习,比较关注数据质量处理,以及模型评估方面,会care具体上线业务没有2. 一些常规的LLM八股,有一个问题值得说一下。问了一个LLM推理的时候,如何从prompt到response?他想问的意思其实是LLM出来的结果不是prompt+response嘛,然后怎么去把response分出来,还说具体的代码里面会有一些额外操作,不是简单的截取然后decode,让我下去仔细看看3. 手撕了一个topk,我直接heapq.nlargest,面试官说也行哈哈哈哈哈中兴 算法工程师(智算)二面1. 这一面感觉是很HR面的感觉,介绍实习的时候也是比较关注数据的来源、处理、采样方面,然后是聊天,各种查户口面试时间硬是拖到一个小时,本来预约的是半个小时。。---------------------------又是忙碌的一周,感觉是腾讯给我秒挂了真的很影响心情,毕竟是最想去的厂了麻花腾!再给我一次👅的机会吧
RZ_Q:面试流程中的: 1. 京东 NLP 三面(已约) 2. 快手 推荐大模型 三面(已约) 3. 拼多多 算法工程师 三面(已完成,官网状态还是面试中不知道后面还有没有HR面之类的) 4. 科大讯飞 飞星 NLP 二面(已完成,官网状态面试中,但是超过一周没推进了,就当挂了) 5. 中兴 算法工程师(智算)二面(已完成) 6. 字节 广告算法 TAC 二面(已约) 7. 智谱AI GLM对齐团队 二面(已约) 8. 联想 一面(已完成) 9. 智源人工智能实验室 行业大模型 一面(已完成) 10. 同花顺 大模型 一面(已完成,超过一周没有推进,当挂了) 已经挂了的: 1. 腾讯 QQ 一面挂 2. 快手 快star大模型应用 一面挂,大语言模型算法、机器学习 简历挂 3. 作业帮 对话方向 一面挂 4. 米哈游 NLP 简历挂 5. 鹰角网络 做完笔试挂 6. 淘天集团 做完笔试挂 7. 字节 ailab 内推 简历挂 8. Minimax 简历挂 9. TCL 简历挂 10. Insta360 简历挂 11. 滴滴提前批 大模型出行方向 简历挂 12. 通义实验室 boss上问HR被告知最低要求一篇paper 简历挂 还在筛选:很多 阿里系的刚投,还没有面试(测评跟笔试给人做🤮了,每次投一个就得做一遍)
查看25道真题和解析
点赞 评论 收藏
分享
智谱一面
经典过简历项目,重点问了最近这段的实习经历的主要工作,并且面试官的提问全程都非常落地,投递的Infra岗位,提问感觉像是在拷打算法,罗列几个回答的不太好的问题:1、你们的场景是如何使用并行策略的?比如TP/DP等答:采用TP2,DP8,EP16的单机16卡的并行策略2、接着问:TP和DP应用在哪个权重计算的位置,并且两者是如何进行协同的?答:TP/DP应用在Attention+FFN结构中的Attention,MoE模型的FFN使用EP,如何协同没回答上来,问了很久这个地方,最后和面试官说抱歉了,这部分的工作我没有具体落地做过,所以没有仔细研究过,然后面试官很有耐心的给我讲了一遍这部分的原理,也算是学习了3、问我对推理Infra调度方面的策略有没有了解过,比如动态批处理...等几个调度方面的工作答:简单描述了一下动态批处理的机制,主动说没有做过这方面的落地4、还问了对于推理框架的KVCache管理策略有没有了解过?答:介绍了一下vLLM社区的PageAttention,但是介绍的也非常粗糙,说类似于传统OS中的页表管理,并且言多必失,我说这个Page大小需要被精心设计,不能过大也不能过小,然后被拷问了为什么不能过大以及为什么不能过小的原因,感觉回答的也不是很好,被用例子拷打了接下来就是手撕阶段了,手撕也比较抽象,手撕的是MoE层的Dispatch过程,我用C++写的:输入是token的gating_scores和k,要求返回k个专家分配到的对应的token_id这个写的比较艰难吧,写的速度比较慢,最后时间不太够了,面试官看了我前面的实现代码和我说:思路我看了一下基本上是正确的,时间不够了也没叫我接着讲思路,就说那我们今天就到这里吧PS:面试过程感觉面试官非常有耐心,真的非常专业,实打实的一线开发人员,并且也乐于分享,回答不上来或者回答错误的问题面试官都耐心的给我讲解了,感觉自己发挥的不是很好,感觉虽然过的概率不大,但还是希望智谱能给个机会
查看5道真题和解析
点赞 评论 收藏
分享
2024-09-11 19:36
已编辑
西安交通大学 算法工程师
智谱AI 中兴 智源研究院 面经
mamazi00:智谱是这样的,对大家的经历都不太感兴趣,尤其是如果只做过sft的基本就不用浪费时间投递了。
查看6道真题和解析
点赞 评论 收藏
分享
2024-11-13 20:51
已编辑
苏州大学 自然语言处理
OFFER选择(大厂or小厂)
投票
投递快手等公司10个岗位
点赞 评论 收藏
分享
2024-11-08 18:46
已编辑
门头沟学院 产品经理
智谱AI内推
北京智谱华章科技有限公司实习、社招内推码: PVTCZ56投递链接: https://zhipu-ai.jobs.feishu.cn/s/iAr2yeGC(投递后私我查看进度哦~)1. 公司介绍:北京智谱华章科技有限公司(简称“智谱”)致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言(chatglm.cn)、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。公司践行Model as a Service(MaaS)的市场理念,推出大模型MaaS开放平台(https://open.bigmodel.cn/),打造高效率、通用化的“模型即服务”AI开发新范式。通过认知大模型链接物理世界的亿级用户,智谱基于完整的模型生态和全流程技术支持,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。2. 招聘岗位:算法、工程(前后端)、产品、解决方案、销售等;岗位投递建议最多 3 个,务必优先投递自己最想去的岗位;3. 相关福利:早9-10点晚18-19点,双休,10天年假。除16 薪外还有各种项目、学术奖金。全额五险一金(公积金12%),公司配备Mac或同等办公电脑,打车报销,免费三餐,法定假日,节日礼品,下午茶零食咖啡,每年至少2次全员团建活动、兴趣小组,技术讲座等,期待你的加入!
点赞 评论 收藏
分享
2024-11-05 00:05
已编辑
北京物资学院 产品经理
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务