1.一个文件中去重后的ip地址数目? 如果问的是linux命令:就(sort后uniq -c,前提是内容只有ip,否则要先grep -oE筛选出ip) ------------------------- ~/Desktop  cat ip.txt 127.0.0.1 128.0.0.1 128.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 126.0.0.1 ~/Desktop  sort ip.txt | uniq -c 1 126.0.0.1 1 127.0.0.1 2 128.0.0.1 4 129.0.0.1 ----------------------- 如果问的是大文件统计ip次数,那就要考虑内存 分而治之一开始各位1000个文件,然后用hash去统计子文件里的 ip=>次数(如果重复率低,所有内容的hash可能也会塞满内存,然后hash内容写入到新的文件里)。最后合并子文件(记得合并相同ip)

相关推荐

程序员小白条:你是沟通了900个,不是投了900份简历,你能投900份,意味着对面都要回复你900次,你早就找到实习了,没亮点就是这样的,别局限地区,时间投的也要早,现在都要7月了
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务