美团交易结算部门二面

1.什么场景需要用到线程池?
2.线程池的参数和作用?
3.有一个基础组件,需要能够实时的感知线程池的运行情况,例如等待队列的大小,队列有没有满,并且能够对异常情况做预警,如何实现这个组件?
4.在Java里面多线程的通信方式有哪些?
5.有ABCD四个线程,如何实现AB执行完C执行,C执行完D执行?
6.Countdownlatch的源码有没有看过,它的实现原理是什么?
7.Spring容器的启动过程描述一下
8.Spring的循环依赖问题是怎么解决的?
9.Spring的AOP实现原理是什么?
10.spring的动态代理怎么选择?
11.MySQL的事务隔离级别有哪些?
12.简单说一下MVCC的实现原理,他是怎么保证事务隔离的?
13.有一张表有三个字段,姓名,性别,分数,如果我要查询姓李的女生分数大于500分的人有多少个,SQL应该怎么写?应该怎样建立索引?
14.介绍一下MySQL索引有哪些类型?采用哪些数据结构?
15.手撕买卖股票最佳交易III(hard)
手撕没写出来,估计是G了,动态规格没想到,只刷hot100没办法
全部评论
佬 冒昧打扰下 我司考虑么 考虑的话 可以看我主页帖子
点赞 回复 分享
发布于 04-12 10:42 上海
同学 拼多多暑期实习考虑吗 核心部门 hc目前还充足 可以看我主页帖子或私聊 可以传授经验
点赞 回复 分享
发布于 04-07 21:19 上海
预警怎么实现
点赞 回复 分享
发布于 03-26 10:38 北京
为啥出hard,是前面回答的不太好吗
点赞 回复 分享
发布于 03-26 00:44 四川

相关推荐

04-12 15:26
已编辑
北京航空航天大学 Java
面试轮次:三面岗位:AI平台研发/机器学习平台工程师难度:⭐⭐⭐⭐⭐📝面试题“为大规模分布式模型训练(如千卡级别训练ERNIE 4.0)设计一个高性能、可扩展的数据预处理与采样服务。要求:1️⃣ 能从海量(PB级)原始日志/文本中,实时清洗、去重、标准化,生成训练样本;2️⃣ 支持复杂的采样策略(如按热度负采样、难例挖掘);3️⃣ 服务需以高吞吐(>10W样本/秒/节点)向训练集群供给数据,并保证全局采样分布的一致性。给出架构设计、核心数据处理流水线,并解决数据倾斜与背压问题。”💡解析:AI工业化生产的“数据引擎”💻 这道题直击AI工业化生产的核心——数据流水线。它要求构建一个从原始数据到模型输入的“端到端”高效转化系统,既要处理海量数据,又要保证数据质量与采样智能性,是机器学习基础设施的关键环节。📌设计思路🔹分层异步流水线📥 数据摄取层工具:Apache Kafka/Pulsar作用:承接来自各业务的实时数据流,解耦数据生产与消费,提供缓冲能力。🛠️ 数据处理层核心引擎:Apache Flink(流批一体)处理逻辑:解析:将原始日志(如JSON、文本)解析为结构化数据。过滤:去除无效、重复或低质量样本。标准化:统一字段格式、单位、编码等。向量化:将文本等非结构化数据转换为模型可处理的数值向量。复杂采样:在Flink中实现自定义ProcessFunction,支持按热度负采样、难例挖掘等策略。💾 存储与供给层存储:处理后的样本写入Alluxio(内存加速)或HDFS,兼顾性能与成本。供给:通过Petastorm、TensorFlow Datasets或自研DataLoader服务,以高吞吐、随机化方式供给训练器。🔹全局采样一致性🌐 挑战:分布式环境下,各节点独立采样可能导致全局分布不一致,影响模型收敛。💡 解决方案:引入中心化采样状态协调器(基于Redis或数据库)。每个采样器在采样前向协调器申请一个“全局epoch”和“种子”。确保所有训练进程在同一epoch内看到相同的、确定性的随机采样序列。🔹背压与弹性处理🚨 背压机制:Flink内置背压传递,当训练器消费变慢时,背压会沿流水线反向传递至Kafka,自动调节消费速率,避免系统崩溃。📊 数据倾斜处理:在keyBy操作前对热点key添加随机后缀进行打散。在后续处理完成后再合并结果,平衡各节点负载。💼应用业务场景📈 实际案例:字节跳动AI Lab训练下一代大模型(如ERNIE 4.0)。抖音推荐模型需实时吸收用户最新交互日志。翻译模型需处理全网新增平行语料。数据预处理管道是模型效果的“第一道质量关”和“效率瓶颈”,其性能直接决定模型迭代速度和上限。📚核心考点📊 大数据处理框架:Flink流批一体、状态管理、窗口机制。🌐 分布式机器学习:数据供给模式、采样一致性、并行训练。🎲 采样算法工程化:复杂采样策略的实现与优化。💾 高性能存储:Alluxio、HDFS、Parquet/TFRecord等格式的选择与优化。🔧 系统稳定性:背压处理、故障恢复、资源隔离。🛠️实践(避坑指南)🔸序列化开销💨 问题:样本在JVM对象与存储格式间反复序列化是主要开销。🔧 解决方案:使用高效序列化框架(如Apache Avro、FlatBuffers)。优化Schema设计,减少冗余字段。🔸状态管理📈 问题:流式去重或时间窗口统计时,Flink状态可能巨大。🔧 解决方案:精心设计状态后端(RocksDB)和状态TTL。考虑分级存储,将冷数据卸载到外部存储。🔸资源隔离⚠️ 问题:预处理作业可能消耗大量CPU和内存,影响线上服务。🔧 解决方案:与线上服务容器进行物理或逻辑资源隔离。使用Kubernetes等容器编排工具进行资源限制和调度。💬 关注呼吁:各位小伙伴们,如果觉得这篇解析干货满满,对大家准备面试有很大帮助,那就多多关注呀!后续还会有更多超实用的面试真题解析和行业前沿知识分享,关注不迷路,一起在求职路上披荆斩棘!🚨趋势押题预测🔮预测名称:在线学习与增量数据实时融合训练系统📝押题题目:“设计一个支持在线学习的模型训练系统。新产生的数据需要近乎实时地被用于增量更新线上模型,而不是等待下一次全天重训练。系统需处理:1️⃣ 流式数据与历史数据的混合采样;2️⃣ 新模型与旧模型的热切换与A/B评估;3️⃣ 保证训练过程不影响线上服务的稳定性与资源。阐述端到端架构、模型更新策略,以及如何解决‘灾难性遗忘’等机器学习问题。”📊押题依据:📈 频次统计:在顶级的机器学习平台岗位面试中,“训练管线”与“实时性”的结合是终极挑战之一,相关设计题年出现12次,是区分普通平台开发与领域专家的试金石。🚀 新趋势需求:业务迭代速度要求模型具备“快速学习”能力。例如,新闻推荐模型需要能立刻学会刚刚爆发的热点事件。在线学习/增量学习是实现这一目标的关键技术,是各大厂研究与应用的重点。📚 信息来源:参考业界对在线学习系统的探索论文,以及头部公司在模型快速迭代方面的技术分享。🤔押题逻辑理由:更前沿、更复杂的范式是让训练本身“流式化”和“在线化”。这不仅是系统设计上的革命(需要处理动态图、状态化服务、滚动更新),更触及机器学习理论(稳定性与可塑性权衡)。考察此类问题,能够全面评估候选人在系统架构和算法原理交叉领域的顶尖实力与前瞻性思考。📚核心考点:🧠 在线学习算法框架:如FTRL、Online Gradient Descent等。🌐 流式训练系统架构:动态图处理、状态管理、模型版本控制。🔄 模型版本管理与热部署:无缝切换、A/B测试、回滚机制。📈 模型稳定性监控:性能指标、灾难性遗忘检测与缓解。💼适配岗位:机器学习平台架构师、AI基础设施负责人。🎯押中概率:60%​ (前沿探索性题目,用于选拔具有研究能力和架构视野的顶尖人才)【示例代码】查看我的专栏取...........~~~💬 最后互动:宝子们对未来的面试趋势有什么想法呢?觉得在线学习与增量数据实时融合训练系统这个方向怎么样?快来评论区畅所欲言,咱们一起探讨求职新方向!同时别忘了关注作者,获取更多精彩内容哦!~~~关注/评论区:接好运~~~~~~上岸~!
查看2道真题和解析
点赞 评论 收藏
分享
评论
点赞
26
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务