思特奇 数据开发

总体来说不难,但是牛客和脉脉的风评不太好,有点害怕

思特奇一面 19min
1. 自我介绍
2. 介绍一下你在实习中用到最多,掌握最好的技术?
3. 介绍一下你项目中,从数据采集,到数据加工到标签生成,整个流程能介绍一下吗?
4. 标签用什么语言开发?能简单介绍一下hive吗?hive的分区?hive表能单条删数据吗?
5. 你能说一下hive sql的性能优化吗?参数+代码
6. 说一下你的比赛内容?你能介绍一下你对数仓的理解吗?
7. 你对大数据未来的职业规划是什么?
反问:数仓建设和业务? 面向运营商,有自己的大数据平台和大模型,给运营商做数仓,数据中心。

二面(30min):
1. 自我介绍
2. 谈谈你对数据开发岗位的理解?数据的分析具体怎么做呢?怎么做数据指标呢?
3. 谈谈你对大数据组件的理解?采集-存储-计算-调度-应用
4. 介绍一下你的实习项目,包括团队规模,项目职责,遇到什么难点?
5. 你了解ai吗,机器学习和深度学习?
6. 大学期间给自己制定了哪些目标,最终实现的情况如何
7. 能介绍一下你参加的比赛吗?
8. 你最大的优势和不足是什么?
9. 你在项目的时候,你认为可以从哪些方面衡量你做的好不好?
反问:入职后的培养流程?  入职后会有2周培训,培训后有1v1的导师,具体问题,面试通过后会给你定岗定位,然后详细沟通。
开发规模? 上万个项目,3000个人员,80%是技术人员
全部评论
哥们,是92本还是硕,让我死心
1 回复 分享
发布于 2023-10-23 00:53 湖北
一面大概多长时间有希望?
点赞 回复 分享
发布于 2023-12-26 11:10 北京
友友,最终签了吗
点赞 回复 分享
发布于 2023-12-26 11:09 北京
佬岗位名字是哪个
点赞 回复 分享
发布于 2023-10-20 20:04 广东

相关推荐

一·语言方面:由于很多大数据框架都是基于JAVA开发的,个人认为JAVA语言是必不可少的,有余力的话可以去掌握以下PYTHON😊二·数据结构与算法:大二课上没好好学,现在只能再补一遍了,悲😣打算刷完Leetcode的Hot100就先放一边,等秋招再刷别的题😇三·MYSQL:一个关系型数据库管理系统,SQL BOY的开始,初步领略通过建表来管理数据的思想,学完可以去刷一下基础50题和进阶50题(虽然本菜鸡只刷了基础50😓)四·Linux:会安装虚拟机,掌握常见linux常见命令即可五·Hadoop:一个分布式计算框架。所谓分布式,就是将一台电脑无法处理的数据量分散给一个由多台电脑组成的计算机集群来处理,互相分工,彼此合作,形成一个有机整体。框架分为三部分:HDFS(数据存储),MapReduce(数据计算),Yarn(资源调度)。虽然MapReduce已经逐渐被Spark淘汰,但思想依然值得借鉴。高可用机制也应当学习六·Maven:会用即可,打包项目用的七·Hive:也是一种SQL,有了MYSQL的基础应该还算好理解八·Scala和Spark:Spark是用Scala写的,在学习之前得先浏览一遍基本语法。Spark是基于内存的批式计算引擎,已经逐渐取代MapReduce(基于磁盘的计算引擎),APACHE也基本上停止了对MapReduce的更新(经典白学😃)。将来很多离线数仓项目也都是基于SPARK的,可以说非常重要了九·Kafka,Hbase,Flume和ZooKeeper:都是一些小组件,将来面试可能会问到十·Flink:一个流式实时计算引擎,本人JAVA基础较弱,听的时候也是懵懵懂懂当然,仅仅这些肯定远远不够,本人将来还要学Doris,数仓建模理论,数仓项目,八股面经等等。上述理解如有错误还请友好指正(叠甲叠甲叠甲😱)。这些理论也只是匆匆过了一遍(大一太贪玩,大二2月份才开始学),发布笔记也只是记录自己的学习过程,提醒自己不要懈怠(还有当个免费网盘😏)。如果能帮助到你就更好了,虽然我也比较迷茫😖
点赞 评论 收藏
分享
评论
10
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务