腾讯混元大模型面经

1.自我介绍

2.主要介绍实习内容

1.整体项目背景,其中第一个SFT工作的motivation,目标要求

a.我主动从此起手的,因为业务背景与动机真的很重要

b.背景会让面试官知道你是在什么样的背景下展开的,体现你对业务的整体理解;

c.动机体现你知道为什么要做,可以说工作都是为了解决现存的卡点,这点能体现你的hold与自主思

考,而不是只会接活就干

2,详细介绍第一个SFT工作,主要是我在讲,中间穿插细节询问

a.你的数据是怎么构造的,其中特殊形式是什么样的 b,会有多少的人工标注参与,最终量级有多大

c.你用的是Qwen3的小模型SFT,它分为推理/非推理模式,你怎么实现的非推理微调 d.顺着拷问原理,Qwen3的Rope原理

e.只做了SFT,没做后续训练是吧,最后有对模型做量化吗

f,有对比过prompt直出的效果吗,差距有多少(业务就是这样,方法越简单,效果能达标就行)

3.手撕 最长公共子序列(二维动态规划)

4.反问当前组内工作内容,元宝组内的

全部评论

相关推荐

10-03 18:26
门头沟学院 Java
一面 8.18面试官迟到15分钟1. 在高并发的情况下java线程池参数怎么设置2. JDK不同版本有什么区别3. 消息队列怎么保证可靠性(幂等,顺序,消费)4. 如果消息丢失了怎么办,在业务层有没有做什么处理(我说了分布式事务里面数据库持久化然后定时失败监听)5. AI项目细节,chunk怎么分,怎么保证查询的向量都是相关的,长记忆和短记忆的区别6. AOP+redis限流怎么实现的,为什么使用lua脚本7. 怎么实现分布式锁,redis持久化,redission和redis的关系,redission在jvm中的优化(这是什么?)8. 情感分析模块一般处理比较慢,如何解决阻塞问题(我这里是结合我自己做的项目,讲了k8s的缩扩容)然后问了点k8s基础。9. 怎么协调团队合作10. 开发中有什么好的习惯(我说了一个遵守阿里巴巴的Java开发手册,然后我有什么准则)无手撕(约了22号的二面,在二面的早上给我打电话说要补个手撕,于是约了个下午2.的面试,就写了个二叉树最大路径和)二面 8.221. 为什么没有去互联网实习2. 讲一个项目,项目的难点有哪些,问的很深入,每个步骤为什么要这么做都问了3. 问了AI的项目,展开了一些4. 做爬虫的时候可能每个网页的html结构都不一样,人工去解析很麻烦,有什么办法吗?(我说可以专门弄个agent模块来处理,面试官说有点意思让我具体讲讲,结果后面讲的不是很明白)5. 对ai的了解有哪些(照例报菜名)6. 怎么让长上下文的情况下记忆更准确7. rag能做哪些优化呢8. 现在生活中对ai的使用主要有哪些,怎么看待ai对未来工作的影响9. http1-3都有哪些优化10. http2有没有解决tcp头阻塞问题11. http3是怎么解决tcp头阻塞问题的12. quic是怎么保证可靠性的,保证了这些可靠性难道就不会阻塞吗(这个问题我不是很理解)13. tcp的阻塞控制四个阶段分别是怎么样的14. 什么时候毕业15. 现在有没有其他的offer16. 更期望的base地17. 本科学的gis,硕士却读软件工程,为什么?职业规划是怎么样的。18. 自己的优点和缺点,这里也有一些展开的追问19. 没在互联网实习过,你怎么看待互联网现在卷的氛围,你觉得你能适应吗hr面 9.24(等麻了)很阿里味的hr面,问了几个agent相关的技术问题意向 9.29
查看29道真题和解析
点赞 评论 收藏
分享
计网: 1. 计算机网络模型是什么样子2. TCP和UDP区别与应用场景3. 三次握手,四次挥手4. 为什么是等待2msl秒5. 为什么建立连接是三次握手,断开要四次6. HTTP和HTTPS区别操作系统与组成原理:1. 什么是进程什么是线程2. 什么是死锁3. 如何避免死锁4. 常见的进程调度的条件5. 为什么要划分内存态和用户态6. 常见的内存管理方式数据结构与算法:1. 常见的排序算法2. java的sort用的什么排序3. 快排的思路4. 快排最坏的时间复杂度算法题:最长不重复连续子串空间上是否能优化java:1. ==和equals的区别2. 重写equals还会重写什么3. 常见集合类型4. hashmap结构5. 为什么链表变红黑树是8,红黑树变回链表是6,而不是两个数相同6. arraylist和linkedlist区别7. 工作中用哪个比较多,为什么8. 常见创建线程的方法有哪些9. runable接口和callable接口区别10. jvm结构11. java为什么比c++或者python更常用于工程领域12. 分代回收机制和gc算法13. spring ioc 和 aopai相关:1. agent与传统应用+ai的区别2. 模型训练分哪些种类面试官人挺好的,流程也很规范。聊的感觉还行,不过有些细节还是需要继续看一下,有些回答不那么成体系,亮点不够突出,所以还是挂了。
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务