百分点科技-数仓开发-一面面经

#牛客AI配图神器#上来自我介绍,个人信息、在校所学专业、毕业时间、为什么学习大数据。
询问出生年份。(没懂为什么专门问这个)
介绍项目,离线数仓的五层是怎么设计的,DataX做首日的全量采集、Maxwell做后续每日的增量采集,Flume传输数据,Kafka起缓存作用,解耦各个组件。
大数据竞赛拿了全国一等奖,那么这个竞赛中做的是什么业务?
学校主修课是什么,大数据是否是自学?
介绍一下简历中的离线数仓。
说一下Maxwell的底层实现原理。
讲一下Hive On Spark引擎的特点。
介绍一下简历中的实时数仓。
说一下checkpoint机制和精准一次。
Docker的常用命令。
Doris需要更新数据吗,怎么更新数据的,是用update吗?
Doris在项目中的作用。
Kafka的偏移量需要手动维护吗。
项目的数据来自哪里,是真实的数据吗?数据量有多少,能达到什么级别,有一亿条数据吗?
HBase在项目中是怎么使用的,为什么维表存到HBase中?为什么没有存到Redis中?
FastJson了解吗,说一下。
SpringBoot的拦截器和过滤器的区别。
现在是否在校?

反问
工作压力大吗?
公司有食堂吗?(我在想没食堂 可以买拼好饭吃😋)
刚才回答的内容还算可以吗?(面试官:回答得没问题,学生能学到这个程度,已经可以了)

写面经攒人品,希望能一把过

#数仓面试##数据开发##数仓开发#
全部评论
我的简历在我发的上一个帖子中
点赞 回复 分享
发布于 03-18 20:55 河北

相关推荐

09-04 10:10
已编辑
门头沟学院
总计1h 0. 面试官介绍1. 自我介绍2. 深挖项目(这里巨细无比,连怎么开发的,设置什么参数都涉及到了,太狠了)3. 上一段实习经历为什么没转正?这一段实习经历能转正吗?4. spark了解吗?说下spark遇到查询时间过长的时候怎么解决5. 直接问具体表现是什么6. DAG图哪个地方?如何确定是map算子还是shuffle算子时间过长? exchange exchange exchange!7. Flink的时间语义讲一下,最多用在哪个方面?8. Flink的sink了解吗?怎么sink的?9. 为什么选择落到doris中,是什么原因让你们选择了doris?10. Doris的性能优化讲一下11. 用过doris的索引吗?比如bitmap索引12. 你们在计算uv的时候有用到吗?13. 你说doris的多维聚合和分析能力很强,实际用过吗?14.  如何确保实时和离线指标一致? 我差点展开说,被制止了15. 目前秋招进度怎么样了?有意向了吗? 这里我说太多了,有点后悔,不应该具体说细节的手撕:sql:group聚合+lag窗口函数问我会不会java,我答不会,会python,手撕算法作罢反问:1. 业务有哪些?2. 对应届生的技术栈和性格素质的期待?3. 工作强度大吗?最后面试官给我提了个意见/建议,说我话太多了太冗余了,需要精简,确实应该好好思考一下。1h后更新:1面过了
查看19道真题和解析
点赞 评论 收藏
分享
评论
6
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务