网易大数据研发实习面经
#23届找工作求助阵地# #实习# #网易智企#
一轮面试:
1.比赛相关(自动化敏感信息提取项目中:数据提取、清洗和转换是怎么做的?数据量大概有多少?最终的训练模型的数据结构是怎么样?有没有涉及到分布式集群来训练模型?)
2.课题相关(刚才说这个项目不是用到多卡多去存储,应该是相当于HDFS文件上面对吧?有没有用到它里面的一些计算的一些引擎,那你存储它的用它的组件的目的是什么?Hadoop的集群架构是单机还是分布式的?是自主搭建的吗?)(因为分布式集群我回答的比赛没有用,课题项目用了,但是回答的不好,然后引导面试官转换到正在做的离线数仓项目)
3.离线数仓项目(介绍一下Hadoop架构的组件?简单介绍map reduce和Spark它们之间有什么区别,哪个性能方面更好以及适用于哪一些场景?)
4.技能(flume的应用场景?如何实现的数据采集?离线数仓整个体系的分层?从原始数据层ODS到汇总数据仓DWD再到应用数据层中间的数据处理是怎么做的?如果各层时使用的是hive sql进行数据处理的,那么应该有类似于ETL任务调度,那这种调度在终端中是怎么实现的?所以都是手动写好脚本定时来执行?有没有用过spark做一些处理?全量和增量是怎么做的?客户端和服务端的日志采集最终是写到Kafka,那么卡夫卡再到Hadoop的中间过程是怎么实现的?介绍一下Kafka的集群架构?BI工具在业务上又是干嘛用的?mqsql数据库的索引机制?索引是基于什么实现的?什么样的数据会放到mysql里面?MySQL的事务和基本原则?MySQL的默认事务隔离级别?不同的隔离级别会出现哪一些问题,简单描述一下?为什么会造成数据的脏读和幻读?Java的GVM机制?Spring boot机制?shell中的vim如何退出,退出会保存吗?怎么查一个CPU占用较高的线程?)
5.其它(简历上的项目,有没有什么遇到特别难的难点,简单分享一个)
6.反问(当时脑子卡壳了,只问了实习生干的什么,应该问下面试表现和需要改进的地方)
一轮面试:
1.比赛相关(自动化敏感信息提取项目中:数据提取、清洗和转换是怎么做的?数据量大概有多少?最终的训练模型的数据结构是怎么样?有没有涉及到分布式集群来训练模型?)
2.课题相关(刚才说这个项目不是用到多卡多去存储,应该是相当于HDFS文件上面对吧?有没有用到它里面的一些计算的一些引擎,那你存储它的用它的组件的目的是什么?Hadoop的集群架构是单机还是分布式的?是自主搭建的吗?)(因为分布式集群我回答的比赛没有用,课题项目用了,但是回答的不好,然后引导面试官转换到正在做的离线数仓项目)
3.离线数仓项目(介绍一下Hadoop架构的组件?简单介绍map reduce和Spark它们之间有什么区别,哪个性能方面更好以及适用于哪一些场景?)
4.技能(flume的应用场景?如何实现的数据采集?离线数仓整个体系的分层?从原始数据层ODS到汇总数据仓DWD再到应用数据层中间的数据处理是怎么做的?如果各层时使用的是hive sql进行数据处理的,那么应该有类似于ETL任务调度,那这种调度在终端中是怎么实现的?所以都是手动写好脚本定时来执行?有没有用过spark做一些处理?全量和增量是怎么做的?客户端和服务端的日志采集最终是写到Kafka,那么卡夫卡再到Hadoop的中间过程是怎么实现的?介绍一下Kafka的集群架构?BI工具在业务上又是干嘛用的?mqsql数据库的索引机制?索引是基于什么实现的?什么样的数据会放到mysql里面?MySQL的事务和基本原则?MySQL的默认事务隔离级别?不同的隔离级别会出现哪一些问题,简单描述一下?为什么会造成数据的脏读和幻读?Java的GVM机制?Spring boot机制?shell中的vim如何退出,退出会保存吗?怎么查一个CPU占用较高的线程?)
5.其它(简历上的项目,有没有什么遇到特别难的难点,简单分享一个)
6.反问(当时脑子卡壳了,只问了实习生干的什么,应该问下面试表现和需要改进的地方)
全部评论
二面凉了

上周五问的咋全是算法啊?我真的哭死(自我介绍过后就是手撕算法极大联通图,我真的一点儿也没准备)
研二吗 这找的实习是春季吗 年后去上班的那种吗?
佬是硕吗
这实习问这么多吗😅
相关推荐
牛客28967172...:说的还是有道理的,我校招时就拿到过网易雷火好几个顶级项目组方向的offer,基本上流程和你说的一样。
但本质还是劝退互联网的游戏方向,本质上是代价更高,而且职业生涯容错率很低,方向比较窄。
代价是众所周知的严重加班,游戏大版本赶工基本上通宵无休,甚至国庆五一都没放假是常态。
职业生涯性价比低是因为游戏行业本质上就是赢家通吃,但你要跳槽只有腾讯网易等头部,要么就是米哈游莉莉丝库洛三七等少数中厂,然后就没了,公司是断崖的少
游戏开发相比互联网方向岗位非常非常少,比如网易整个雷火也才五六百人,里面十几个工作室,招人比例非常低,其他游戏公司也是一样。
而且方向也很窄,你做引擎开发就只能跳相关,你做游戏客户端也只能跳相关(游戏客户端都算吃香的,但市场hc也非常非常少,跳槽机会更少),基本上很难转回互联网
这里对比传统互联网,大厂多的都说不过来,而且容错率很大,你做搜索方向可以跳推荐,你做推荐方向可以跳广告,要求远没有游戏行业那么严,甚至你之前干测试都能跳槽研发方向
点赞 评论 收藏
分享