大数据之排序问题求解

一个4T的存放url的文件,机器内存4G,怎么对url按字典序排序
全部评论
4T = 4 * 1024G 计算url的hash值,然后将hash值对1024取模,也就是把4T的文件划分为1024个大小为1g左右的文件。 内存有4g,所有可以对1g的小文件全部放入内存进行排序,待1024个文件都排完序之后,多路归并。
点赞 回复 分享
发布于 2017-09-19 17:22
归并排序
点赞 回复 分享
发布于 2017-09-19 17:15
基数排序?
点赞 回复 分享
发布于 2017-09-19 16:40

相关推荐

这一集 硕士输的很惨
HoePointer:普通硕士的悲哀,高的进不去,低的要不起
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务