首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客8028856号
2017-08-13 20:01
北京理工大学
关注
已关注
取消关注
找到100亿个URL中重复的URL?求最优解
1、给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL?
2、
找到100亿个URL中重复的URL?
提示
全部评论
推荐
最新
楼层
带着小板凳写代码
合肥工业大学 Java
第一题:50亿*64B约320g,内存限制4g,所以,用一个hash函数把A文件中的url分到1000个小文件中去,把url通过hash后的值当做文件名,然后B文件也用同样的hash函数去分到1000个小文件中,这样寻找的时候,按照同名的文件从AB两个文件中去找重复(相同的url肯定分在相同文件名的小文件找那个),这样的话内存肯定能满足。 第二题,类似也是用hash去处理,重复的url肯定会分到同一个文件中去,接下来就是找重复的就是了
12
回复
分享
发布于 2017-08-13 20:29
baby_lorin
电子科技大学 Java
布隆过滤
点赞
回复
分享
发布于 2017-08-14 08:41
已删除
hash过滤掉重复的,然后比对
点赞
回复
分享
发布于 2017-08-13 21:41
=..=
腾讯_天美_研发工程师(准入职)
我觉得应该是用布隆过滤器,不过缺点是存在一定错误率
点赞
回复
分享
发布于 2017-08-13 20:39
swananan
南京航空航天大学 C++
B文件哈希成300个小文件,这个过程中去重,只保留不同的url。 然后流式读入A文件的url,根据之前哈希函数来比对,是重复的就保留结果。 差不多就这个套路吧,至于哈希函数可以md5之类的,然后再用普通的字符串哈希函数来计算出个数字来除余?? 我对这个全靠yy,根本没有做过
点赞
回复
分享
发布于 2017-08-13 20:06
阿哈哈
西南财经大学
hssh分片?
点赞
回复
分享
发布于 2017-08-13 20:06
暂无评论,快来抢首评~
相关推荐
02-10 10:08
海康威视_技术支持部_云存储开发工程师(准入职员工)
网易游戏内推
幸福三要素:吃、累、全 关于吃 网易作为互联网行业出名的猪厂,真的是有原因的!作为曾经的员工,不得不夸夸网易,第一个优点是有饭堂,第二个优点是饭堂真的太多好吃的,单单自选菜式,每顿就有十几种不同的菜可选,还有粥粉面、麻辣烫、汉堡薯条、铁板饭、健康餐……近乎完美地覆盖到不同口味的同事需求!此外,早餐和宵夜都是免费的!早餐样式也很多,好喜欢吃蜂蜜蛋糕、蛋挞和肠粉!!宵夜的话也有几种选择,但是得加班到点才能领取,一般是面包+水果+牛奶,也还阔以! 所以,如果入职网易一点也不用担心每天吃啥! 关于累 感到累才会有所获,个人感觉工作强度还是相对较大的,而且非常卷。除了刚入职的一段时间,后面基本上每天都要...
网易游戏公司福利 637人发布
点赞
评论
收藏
分享
02-15 21:39
阿里巴巴_ai infra
牛友的春节生活
❓你最怕被问到什么问题?如何应对? “你那个大数据是干啥的?能查到我话费账单吗?” 👉我的魔法防御: 最怕:“有对象没?”“啥时候买房?”“你们公司裁员吗?” 我的策略:三段式防御 先夸人:“姨你气色真好!”,再转移:“来来来,我给你倒点热茶。”,最后用“开放式结论”:“这事儿我正在推进,属于长期迭代。”❓你如何跟家人亲戚介绍你的职业? 坐办公室玩电脑的。“我在互联网工地当包工头,手下管着几百台服务器,它们天天996搬砖,我负责给它们画饼和灌红牛。”❓亲戚问你挣多少钱,该怎么答?经典场景:饭桌上突然安静,七大姑举着筷子凝视你。“哈哈,我的工资和我家里的年货一样多,都是很丰厚的!”。然后迅速反...
牛友的春节生活
点赞
评论
收藏
分享
01-08 09:52
门头沟学院 Java
招笑公司
给不懂的朋友说一下,实习转正一般是实习几个月,然后在毕业前就开始转正答辩流程,在毕业前就能知道是否转正,毕竟得知自己不能转正之后,还能够参加春招,而如果毕业之后才开始转正答辩,那么万一在你毕业之后转正不通过,那就直接寄了,直接错过春招,相当于直接全部押注在实习转正上面了,不过楼主说话也有点问题,应届身份一般保留两年
christina2...:
楼主你应该问毕业前什么时候能签三方,签三方就代表着给你预留了这个岗位,毕业后直接正式入职。转正答辩拿到正式offer一般都是会签三方的,图片这个HR好像没有三方的概念。
你不能接受的企业文化有哪...
点赞
评论
收藏
分享
01-13 12:25
河南工业大学 财务
好冷漠的话。
哞客37422655...:
这就是真实社会,没有花里胡哨的安慰,让你感受到阶级分明,不浪费彼此时间。虽然露骨但是唉
点赞
评论
收藏
分享
02-11 03:21
山东大学 C++
腾讯提前批软开-测开二面面经
腾子二面面经1h 1.231.自我介绍2.实习经历拷打深究25min3.项目经历拷打15min4.手撕代码,找到所有出现两次的元素(不消耗额外空间,时间复杂度O(n))面完当天下午显示通过1.28约1.29三面
查看4道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
35
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
非嫡系实在是太难
0
2
...
新年新气象,一路向前
0
3
...
来查看你的新年运势!
0
4
...
2026年事业运夯爆了
0
5
...
华为OD前端面经
0
6
...
终于红名了,纪念一下
0
7
...
简历、手撕、实习项目与自信
0
8
...
实习求助!
0
9
...
牛客测运,我接接接
0
10
...
新年必须顺
0
创作者周榜
更多
正在热议
更多
#
牛客新年AI问运
#
4015次浏览
85人参与
#
秋招吐槽大会
#
303663次浏览
1520人参与
#
牛客AI体验站
#
15824次浏览
278人参与
#
找工作八股要背到什么程度?
#
58489次浏览
734人参与
#
秋招踩过的“雷”,希望你别再踩
#
185848次浏览
1686人参与
#
我们是不是被“优绩主义”绑架了?
#
32158次浏览
484人参与
#
工作中的卑微时刻
#
33216次浏览
197人参与
#
如何提高实习转正率?
#
86015次浏览
504人参与
#
不考虑薪资和职业,你最想做什么工作呢?
#
144953次浏览
878人参与
#
牛友的春节生活
#
13289次浏览
232人参与
#
备战春招/暑实,现在应该做什么?
#
8591次浏览
209人参与
#
材料专业哪个方向更好找工作?
#
37693次浏览
118人参与
#
多益网络工作体验
#
62983次浏览
304人参与
#
工作压力大怎么缓解
#
146138次浏览
1327人参与
#
找工作中的意难平
#
984256次浏览
6424人参与
#
反问环节如何提问
#
131299次浏览
2699人参与
#
从夯到拉,锐评职场mentor
#
8290次浏览
114人参与
#
实习到现在,你最困惑的一个问题
#
7555次浏览
170人参与
#
为了找工作你投递了多少公司?
#
103406次浏览
687人参与
#
什么是优秀的实习经历
#
36287次浏览
388人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务