bilibili(b站) 大数据基架 基础架构2026(infra)一面面经
1. 自我介绍
2. 项目介绍
3. 详细介绍一下抽奖项目的流程(穿插一些八股,分布式锁……定时任务……缓存数据库一致性……防止超卖……ThreadLocal如何从父线程传递到子线程……)(有些忘了)
共计十分钟
场景共计35分钟,基本都是连续追问问道无法回答为止,问答顺序记不清楚了
场景题1:
4.线程池的实现原理(八股)
5.有一千个任务在线程池内,任务的执行时间各不相同(大数据场景),我们希望同时解决多个问题包括
(1) 长任务超时会保留数据,不会重来,不能重新发任务
(2) 多个执行的任务中,有的时间长有的时间短,我们不希望长任务的长时间执行导致短任务的饥饿
(3) 短任务的结果能优先看到
场景题2:
6.看你是图数据的科研方向,如果一张日活用户图上有4000w个用户点,点赞/关注都可以都可以作为边,考虑如何评价前二十(top 20) 的高质量用户并予以奖励?以什么作为评价指标?如何计算?如何让偏差率收敛到1-5%之内?
7.单机无法计算的情况下,如何拆分?拆分原则是什么?如果分多台机器,那些会被分到哪些机器上?如何判定边界?如果判定了边界导致南北方人,或者不同文化背景的人所处的图不同,违反了b站的原则(不分具体的人只看质量,不能用相似类型评判质量)怎么办?你的划分还有效吗?(最后提示去看google的pagerank论文)
8. 了解大数据相关内容吗(不了解)
结束反问:
1.使用语言?业务前景?服务对象?
2. 4000w的具体场景?
问实习时间实习时长等
发面经求好运
2. 项目介绍
3. 详细介绍一下抽奖项目的流程(穿插一些八股,分布式锁……定时任务……缓存数据库一致性……防止超卖……ThreadLocal如何从父线程传递到子线程……)(有些忘了)
共计十分钟
场景共计35分钟,基本都是连续追问问道无法回答为止,问答顺序记不清楚了
场景题1:
4.线程池的实现原理(八股)
5.有一千个任务在线程池内,任务的执行时间各不相同(大数据场景),我们希望同时解决多个问题包括
(1) 长任务超时会保留数据,不会重来,不能重新发任务
(2) 多个执行的任务中,有的时间长有的时间短,我们不希望长任务的长时间执行导致短任务的饥饿
(3) 短任务的结果能优先看到
场景题2:
6.看你是图数据的科研方向,如果一张日活用户图上有4000w个用户点,点赞/关注都可以都可以作为边,考虑如何评价前二十(top 20) 的高质量用户并予以奖励?以什么作为评价指标?如何计算?如何让偏差率收敛到1-5%之内?
7.单机无法计算的情况下,如何拆分?拆分原则是什么?如果分多台机器,那些会被分到哪些机器上?如何判定边界?如果判定了边界导致南北方人,或者不同文化背景的人所处的图不同,违反了b站的原则(不分具体的人只看质量,不能用相似类型评判质量)怎么办?你的划分还有效吗?(最后提示去看google的pagerank论文)
8. 了解大数据相关内容吗(不了解)
结束反问:
1.使用语言?业务前景?服务对象?
2. 4000w的具体场景?
问实习时间实习时长等
发面经求好运
全部评论
这场景题2有点阴间啊
佬 请问面试前有笔试吗 你投递到约面大概过了多久呀
相关推荐
02-25 16:29
齐鲁工业大学 golang
找工作勤劳小蜜蜂:自我描述部分太差,完全看不出想从事什么行业什么岗位,也看不出想在哪个地区发展,这样 会让HR很犹豫,从而把你简历否决掉。现在企业都很注重员工稳定性和专注性,特别对于热爱本行业的员工。
你实习的工作又太传统的it开发(老旧),这部分公司已经趋于被淘汰,新兴的互联网服务业,比如物流,电商,新传媒,游戏开发和传统的It开发有天然区别。不是说传统It开发不行,而是就业岗位太少,基本趋于饱和,很多老骨头还能坚持,不需要新血液。
工作区域(比如长三角,珠三角,成渝)等也是HR考虑的因素之一,也是要你有个坚定的决心。否则去几天,人跑了,HR会被用人单位骂死。 点赞 评论 收藏
分享
