腾讯混元机器学习平台-后台开发面经

一面
1. 实习中的工作队列是指的什么队列?
2. 这个队列有什么作用?
3. 怎么利用事务解决与下游数据不一致的情况
4. PD分离部署是什么意思
5. 你PD分离部署这个做了哪些工作
6. 为什么要做PD分离,为什么提高了大模型处理速度(讲了很多,包括其数据流,也一起讨论了很多,包括当前如何做路由,PD节点怎么通信,KVCache如何存取,他们部门一般会做这个点相关的哪些工作)
7. 关于其中不懂的问题,你是怎么解决的
8. 讲下实习的第三个工作你做了什么
9. 为什么要用redis队列
10. 但是消息队列不是可以解决你这问题吗?为什么要用redis
11. 你是如何同步离线任务的状态呢?为什么要这么做
12. 讲讲你两个项目经历
13. RAG技术的原理是什么?
14. 如何去检索信息的?
15. pdf你是如何切片的
16. 分页方法有什么问题,你是如何解决的
17. 科研项目做了哪些工作
18. 你在工作中有遇到过两件冲突的事,但是都要处理,你是如何解决的
19. 我们部门主要是做go的,看你的项目大部分都是java,接受转吗
20. 听说过MOE吗
21. 大模型答非所问怎么办
22. 如何实现一个mater-slave同步模式
23. 怎么避免由于从节点数据同步不一致问题导致一直读到脏数据呢
24. 手撕3选1:m个相同的球放进n个相同的篮子,篮子可以为空,输出放法的总数
全部评论

相关推荐

10-03 18:26
门头沟学院 Java
一面 8.18面试官迟到15分钟1. 在高并发的情况下java线程池参数怎么设置2. JDK不同版本有什么区别3. 消息队列怎么保证可靠性(幂等,顺序,消费)4. 如果消息丢失了怎么办,在业务层有没有做什么处理(我说了分布式事务里面数据库持久化然后定时失败监听)5. AI项目细节,chunk怎么分,怎么保证查询的向量都是相关的,长记忆和短记忆的区别6. AOP+redis限流怎么实现的,为什么使用lua脚本7. 怎么实现分布式锁,redis持久化,redission和redis的关系,redission在jvm中的优化(这是什么?)8. 情感分析模块一般处理比较慢,如何解决阻塞问题(我这里是结合我自己做的项目,讲了k8s的缩扩容)然后问了点k8s基础。9. 怎么协调团队合作10. 开发中有什么好的习惯(我说了一个遵守阿里巴巴的Java开发手册,然后我有什么准则)无手撕(约了22号的二面,在二面的早上给我打电话说要补个手撕,于是约了个下午2.的面试,就写了个二叉树最大路径和)二面 8.221. 为什么没有去互联网实习2. 讲一个项目,项目的难点有哪些,问的很深入,每个步骤为什么要这么做都问了3. 问了AI的项目,展开了一些4. 做爬虫的时候可能每个网页的html结构都不一样,人工去解析很麻烦,有什么办法吗?(我说可以专门弄个agent模块来处理,面试官说有点意思让我具体讲讲,结果后面讲的不是很明白)5. 对ai的了解有哪些(照例报菜名)6. 怎么让长上下文的情况下记忆更准确7. rag能做哪些优化呢8. 现在生活中对ai的使用主要有哪些,怎么看待ai对未来工作的影响9. http1-3都有哪些优化10. http2有没有解决tcp头阻塞问题11. http3是怎么解决tcp头阻塞问题的12. quic是怎么保证可靠性的,保证了这些可靠性难道就不会阻塞吗(这个问题我不是很理解)13. tcp的阻塞控制四个阶段分别是怎么样的14. 什么时候毕业15. 现在有没有其他的offer16. 更期望的base地17. 本科学的gis,硕士却读软件工程,为什么?职业规划是怎么样的。18. 自己的优点和缺点,这里也有一些展开的追问19. 没在互联网实习过,你怎么看待互联网现在卷的氛围,你觉得你能适应吗hr面 9.24(等麻了)很阿里味的hr面,问了几个agent相关的技术问题意向 9.29
查看29道真题和解析
点赞 评论 收藏
分享
10-04 14:06
门头沟学院 Java
一面 1. 选择一个项目或实习经历展开讲解。2. 批跑工具中,手包和整包耗时是模拟数据还是计算得出?3. 模型交互使用的协议是什么?4. 批跑工具的数据是否涉及模型、插件调用?输出是否包含图片、视频等媒体资源?5. 输入数据的量级是否有限制?6. 智能问答助手的本地知识库对格式有要求吗?7. 文档向量化入库时,上下文与 chunk 拆分是自己实现还是调用现成方法?有评测过拆分效果吗?8. 用过哪些 Java 容器?9. HashMap 的底层数据结构是什么?10. 使用 Go 语言时是否用过 defer 关键词?函数中先后定义两个 defer(分别打印 A、B),执行顺序是什么?11. 用过用 Photo Buffer 包装的产品吗?12. HTTP 状态码 100、200、300、400、500 分别代表什么?13. HTTP 协议是有状态还是无状态的?若要维护状态该如何做?14. UInt 64 类型在内存中如何存储?是多少字节?每个字节多少位?15. 用过 K8S 做过相关事情吗?Kubernetes 中容器和 Pod 是什么关系?16. 如何用 SQL 实现 “先查询表中 count 字段值,再基于该值修改,且期间保证其他会话不能修改” 的功能?17. 用 Redis 做分布式锁一般怎么做?18. 已知进程 PID,如何查看对应进程的位置(执行路径)?19. 如何统计 1 小时日志文件中出现次数最高的 10 个 client IP?20. 如何判断一个数是否为回文数?不转为 string 类型该怎么做?21. 实现两个线程,分别打印 1 和 2,主函数调用后需交替打印 1212... 共 50 轮,说明实现思路。二面1. 问实习2. ChatMemory 接口重写的核心痛点是什么?持久化用了什么方案?如何解决 “改写结构偏差” 问题?3. 本地知识库与联网搜索当前是怎么协同的?有没有后续的优化思路?4. 文档分块用了什么策略?为什么选这个策略?向量数据库的元数据设计了哪些字段,作用是什么?5. 登录模块的 JWT 双 token,具体是如何实现鉴权和续期的?6. SSE 和 WebSocket 的核心区别是什么?分别适合什么场景?7. MySQL 索引优化有哪些方法?能解释下 “索引下推” 的原理吗?8. Redis 的缓存雪崩、缓存击穿、缓存穿透,分别是什么问题?对应的解决方案是什么?9. 消息队列如何保证消息不丢失?如何避免重复消费?10. 分割等和子集、最长回文子串
查看30道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务