中科闻歌 大模型算法岗面经

拷打项目,时长30分钟
1. 微调的数据配比,数据来源
2. 微调的任务类型,轮次
3. Embedding用的什么模型,是分块Embedding吗
4. 数据怎么分块
5. 数据返回的查询top
6. 微调之后对比之前的模型性能提高了多少
7. 数据库实时更新还是离线更新
8. 用的什么数据库
9. 本地部署的框架如何搭建
10. 如何评估rag
11. Qwen2.5 vl架构
12. 有相关的实习吗?实习期间做了什么?
13. 主要做文本还是多模态方向?
14. 做了一些小项目吗?
#大模型面经# #中科闻歌#
全部评论
面试的agent岗位吧
点赞 回复 分享
发布于 09-16 14:13 辽宁

相关推荐

09-11 14:12
已编辑
北京邮电大学 Web前端
1.浏览器从输入url到页面渲染的过程2.浏览器做了哪些工作解析HTML最终形成页面展示(渲染过程)3.对js的解析是解析什么内容4.就是假设我们已经解析完了,不管它是解析什么内容,那解析完之后的话,它其实会有一个事件循环的机制,介绍一下js的事件循环机制5.事件循环在nodejs和浏览器的区别6.vue3的vue2响应式的话有哪些区别7.vue3实现一个自定义的响应式的数据应该怎么实现8.对于引用类型和基础类型的ref 实现上有什么区别?基础类型通过包装对象实现响应式,引用类型则借助 reactive 转换为代理对象,两者最终都通过 .value 访问,但内部处理机制不同。9.vite的热更新为什么比webpack快?10.vite是怎么支持解析所有文件的为什么?11.性能优化的方式,首屏加载优化资源层面,优先压缩和拆分资源,如用 Vite/Webpack 拆分代码(Code Splitting),大文件分片加载;图片懒加载非首屏图片。通过 CDN 分发静态资源。代码层面,路由懒加载(如 React.lazy、Vue 异步组件)。缓存层面,设置 HTTP 缓存(强缓存 Cache-Control,协商缓存 ETag)12.大文件进行分片加载是如何实现的?首先前端获取文件总大小,按固定尺寸(如 1MB)计算分片数量;然后通过 HTTP Range 请求头,每次请求一个分片(如Range: bytes=0-1048575);服务端根据 Range 返回对应片段;前端接收所有分片后,用 Blob 或 ArrayBuffer 合并成完整文件。13.强缓存的,就是说要用强缓存。那你如果强化了之后,那你怎么更新呢?就比如我发了个紧急的 V3版本,你是当前可能强化才能 V1,那我怎么更新到 V3?给静态资源(JS/CSS/ 图片等)添加版本标识,如在文件名后加哈希值(app.8f3d2.js)或版本号(app.v3.js)。构建工具(Webpack/Vite)可自动生成哈希,哈希值随文件内容变化而变。14.标识是在哪里做的?构建工具(如 Webpack、Vite)会在打包时,根据文件内容生成唯一哈希值(如 MD5),并添加到文件名中(如index.abc123.js)这一步由构建工具的配置实现。15.那如何要设置html的强缓存,如何做到强制更新?16.RAG(检索增强生成)到底是什么东西,工作原理怎么样17.为什么要做向量化的过程?18.RAG减少的原因是什么,还有什么方式可以减少幻觉19.就是你是如何去了解一个全新的一个技术领域的,就是你是怎么去做对应的一个学习的?有没有一些学习的方法论可以分享一下20.分享一下Mi-BRAG21.手撕:要实现支持并发限制和先进先出(FIFO)的异步任务调度器22.追问:task返回什么类型任务执行失败了上面功能能执行么,promise如何处理失败,但是不阻塞队列->finally()catch的时候,能否将其重新加入队列重试📍面试公司:字节跳动-今日头条💻面试岗位:前端开发
查看24道真题和解析
点赞 评论 收藏
分享
09-03 20:48
龙岩学院 护士
攒个人品,秋招不指望了,希望春招能有机会上岸吧。------------------------------------------------------没有自我介绍环节,一上来直接拷打实习,边拷打边问八股,基本上是我说一个做的东西,然后面试官就要开始问对应的八股了,记录一下问的八股:1. Qwen 与传统的Transformer模型相比,有什么结构上的改进?2. RMSNorm相较于LayerNorm有什么优势?公式是什么?3. SwiGLU的公式是什么?4. GRPO的公式是什么,这样做为什么更好?5. KL散度的公式是什么,为什么要用KL散度?6. LLM的损失函数是什么?给你一个10w的词表,计算出事的损失值7. GRPO为什么要做clip,直接用SFT后的模型还会不稳定吗?优势度可以怎样改进?8. 为什么你要用GRPO?GPRO结果比之前好多少?显存开销多大?训练一个Step需要多久?奖励函数如何设置的,为什么?有没有想过为什么一开始Reward出现大幅度震荡?GRPO是否一定有效,还有什么解决方法?9. Post-Training 的工作机制,为什么要做三阶段训练?什么情况下应该用GRPO?为什么DeepSeek用了GRPO?如何从V3到R1?10. 微调是如何进行微调的?为什么LoRA能够work?除了LoRA外,还了解哪些微调方法?11. 后训练用的哪个框架?你用过什么框架?如何使用deepspeed进行分布式训练?脚本是你自己写的吗?12. 知道什么Linux命令?13. 用过C++,Java吗?平时用什么多?14. 如何去评价你工作的产出和质量(基本上每个面试官都会问)15. FLUX的工作原理,LoRA在这个地方起到了什么作用?16. 你认为实习过程中哪些是从零到一的工作?(全部!鼠鼠之前学地理的)遇到一个不熟悉的领域,你会如何进行学习?-------------------------------------------------------大概是这些,可能不是很全手撕:删除链表中的节点;快慢指针秒了反问:面试官先介绍了下部门业务,随后反问:1. 为啥初试后又是初试?(可以自己点的,实际上就是二面)2. 后续几轮面试呢?(三轮,还有大老板面)3. 工作强度 (8-9.30左右)4. 这个岗位需要什么样的人? (努力学习新知识,耐心)总而言之美团的面试体验真没的说,面试官会笑这一点就值得夸了,全程没啥压力,但是估计凉了,有些没答好
查看17道真题和解析
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务