1.为什么要用MapReduce MapReduce的流行是有理由的。它非常简单、易于实现且扩展性强。大家可以通过它轻易地编写出同时在多台主机上运行的程序,也可以使用Ruby、Python、 PHP和C++等非Java类语言编写Map或Reduce程序,还可以在任何安装Hadoop的集群中运行同样的程序,不论这个集群有多少台主机。MapReduce适合处理海量数据,因为它会被多台主机同时处理,这样通常会有较快的速度。 2 MapReduce计算模型 要了解MapReduce,首先需要了解MapReduce的载体是什么。 在Hadoop中,用于执行MapReduce任务的机器...