大文件统计字符串问题

在面试的时候被问到一道题目:
一个2g的文件,每行都有一个大数字(max_value这种)如:
3123183193891
21313123131313
32
1231343123131 1231231223131231
统计所有相同数字出现的次数并返回?
楼主第一思路是:Hashmap-》但是爆了怎么办?
第二思路:分治,但是读文件是bufferReader,怎么分治?
第三思路:多线程,同样是遇到流的问题,怎么划分?
各位大佬有什么思路吗?
如果想要排序输出?思路:大数组快排

#笔试题目##阿里巴巴#
全部评论
哈希
点赞 回复 分享
发布于 2018-05-22 19:25
hash到不同文件,不同文件分别统计,最后归并就行了
点赞 回复 分享
发布于 2018-05-22 18:20
没有大老了?都秀offer去了嘛
点赞 回复 分享
发布于 2018-05-22 18:09

相关推荐

mjasjon:这种trash中厂 简历过筛概率比大厂还低(除阿里系)
投递哔哩哔哩等公司7个岗位
点赞 评论 收藏
分享
野猪不是猪🐗:我assume that你must技术aspect是solid的,temperament也挺good的,however面试不太serious,generally会feel style上不够sharp
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务