【小红书4面已OC】大数据开发-数据平台

已OC,评论区有意向群大家可以加入交流

一面:

挺走流程的,项目+八股+性格

二面:

项目+做题+性格,题目是一个实时指标,一个离线指标,居然要求在web上写flink,然我选择用SQL写离线,题目是统计一个直播间的最大在线人数,感觉挺好的,但是说方向偏业务,问了我的意向,我没表达出兴趣。

三面:

1.自我介绍

2.项目介绍

3.Hudi项目难点

1).FlinkJob怎么配置采集表的个数:个数太多会导致单个slot输入数据量太多,Hudi累计的数据存在state里(超过阈值会flush),累计太多做ck的时候需要的时间就越长,CK的GAP需要加长,会影响实时采集的时效性。所以对数据库的采集需要多个Job来保证时效性,同时要保证每个Job的表大小尽可能相等(Job里业务表的TPS需要大概相同)

2).Hudi的bucket数量,bucket对应一个分区下面的file group,他也是写并发的最大值,它数量过多会导致一个小文件问题,数量过小会导致File group里面的parquet+log过大,影响下游的查找优化。(社区说是用hashMap的方式,也看到RFC使用一致性hash来动态扩展Buket数量)

4.Ozone项目

5. B+树和LSM-T区别

5.各自使用的场景

6.OLTP和OLAP *

7.范式建模和维度建模 *

8.优缺点-各自优势 (这里可以扩展很多,列存储和行存储,指令的向量化优化,AP提前聚合宽边来构建指标,TP范式拆分来支持快速修改)

四面:HRBP

问对小红书的了解,优缺点

#小红书校招#
全部评论
群号 874459763
1 回复 分享
发布于 2022-10-09 21:12 四川
老哥啥时候笔试的,我一直卡在笔试已完成
1 回复 分享
发布于 2022-10-06 16:24 北京
hr面约了吗
1 回复 分享
发布于 2022-09-30 10:38 广东
可以问下时间线吗
点赞 回复 分享
发布于 2022-10-11 15:44 河南
感觉大佬的知识深度很棒,赞
点赞 回复 分享
发布于 2022-10-06 11:29 广东
希望我面的时候也是同样的问题啊
点赞 回复 分享
发布于 2022-09-28 23:13 山西

相关推荐

在AI产品设计中,Agent(智能体)和Workflow(工作流)是两种核心范式,分别代表了智能化与流程化的不同方向。要从以下方面展开分析:一、核心区别二、Agent的核心特性三、Workflow的设计逻辑四、协同关系五、选择决策要点具体来说:1. 定义与功能:   - Agent:自主决策实体,能感知环境、做出决策并执行动作   - Workflow:预定义的任务序列,按照固定流程执行2. 执行方式:   - Agent:动态响应,根据输入和环境变化自主调整行为   - Workflow:线性执行,严格遵循预设步骤3. 灵活性:   - Agent:具备学习适应能力,可处理未知情况   - Workflow:静态结构,变更需要手动修改流程4. 决策能力:   - Agent:内置决策逻辑,可实时评估选择最佳路径   - Workflow:无自主决策,完全依赖流程设计5. 复杂度:   - Agent:通常包含状态记忆和目标导向行为   - Workflow:侧重任务编排和顺序控制6. 典型应用:   - Agent:聊天机器人、自动驾驶、游戏AI   - Workflow:数据处理流水线、审批系统、CI/CD流程7. 错误处理:   - Agent:可自主尝试恢复或寻找替代方案   - Workflow:依赖预设的错误处理分支总结:Agent是“大脑”,Workflow是“骨架”,二者结合可构建从灵活到稳定的AI应用光谱。未来方向是通过低代码平台降低两者融合门槛,实现智能化与自动化的统一。      
点赞 评论 收藏
分享
评论
3
30
分享

创作者周榜

更多
牛客网
牛客企业服务