26校招-美团大模型应用算法一面

1.八股:NLP和LLM最大的区别是什么?两者有何共同和不同之处?
2.八股:激活函数有了解吗,你知道哪些LLM常用的激活函数?为什么选用它?
3.八股:开源框架了解过哪些?Qwen,Deepseek的论文是否有研读过,说一下其中的创新点主要体现在哪?
4.项目:介绍微调负责的工作,大模型微调最重要的是什么?
5.项目:SFT+DPO训练怎么组织这部分数据的?是自己构造还是用公开数据?
6.项目:看你做过LoRA微调,那你是怎么选rank值?合并adapter权重的时候有没有遇到梯度爆炸?
7.项目:说下LoRA的原理,LoRA是不是只能在Linear层插?为什么不能插在LayerNorm之后?这会对训练稳定性造成什么影响
8.项目:刚才提到用过QLoRA,能具体说说QLoRA是怎么降低资源成本吗?
9.项目:llm推理效率,如果真的部署到在线系统里,这个效率的问题怎么解决呢
10.项目:有没有尝试过模型裁剪?比如 low-rank adaptor、LoRA 融合,或者用Mamba替换部分token path?
11.代码题:实现Casual mask的MHA,说下计算复杂度
全部评论
忍耐王
点赞 回复 分享
发布于 2025-12-23 20:11 广东

相关推荐

2025-12-13 20:41
算法工程师
央企研究所人工智能实习生招聘一、工作内容1.智能体工具链开发与集成:基于主流 LLM/Agent 框架搭建智能体能力,开发可复用的工具(Tools)与插件(如检索、知识库、代码执行、函数调用、流程编排等),并完成工程化集成;2.视觉算法边缘部署与加速:将视觉模型部署到边缘设备(如 Jetson / 工控机 / ARM 等),进行模型导出(ONNX/TensorRT 等)、量化/剪枝等轻量化优化,提升端到端推理速度与资源利用率;二、招聘要求1.在校研究生或特别优秀的大四学生。2.掌握 Python、PyTorch,能够熟练运用其进行代码编写与测试。3.熟悉 Ubuntu 系统的基本操作,可独立完成训练环境部署。4.具备机器学习的基本知识,拥有一定的代码开发和调试经验。5.具备自驱力,工作态度积极主动,拥有良好的沟通能力,并有使用先进 AI 工具辅助工作的意识。三、时间要求每周(工作日)最少实习4天,连续实习3个月以上。工作时间:早 9 点至下午 5 点。到岗时间:越快越好。四、实习待遇实习薪资 280 元 / 天。五、工作地点工作地点:北京市海淀区东升科技园(不提供住宿)。如果你认为自己符合以上条件,且渴望在央企研究院开启一段充实且有意义的实习经历,请将你的简历发送至 [**********],邮件主题请注明 “实习生应聘 - 姓名 - 学校 - 专业- 年级 - 实习x个月”。期待你的加入,一起在技术研究的道路上发光发热!
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务