作者 Lenovo
创建于2016-05-02 03:25:00
修改者Senio Lee
修改于2016-12-27 00:39:00
字数6975
文档摘要:实验3 MapReduce编程初级实践1. 实验目的1.通过实验掌握基本的MapReduce编程方法;2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。2. 实验平台已经配置完成的Hadoop伪分布式环境。3. 实验内容和要求1.编程实现文件合并和去重操作对于两个输入文件,即文件A和文件B,请编写MapReduce程序,对两个文件进行合并
实验3 MapReduce编程初级实践
1 实验目
1通实验掌握基MapReduce编程方法
2掌握MapReduce解决常见数处理问题包括数重数排序数挖掘等
2 实验台
已配置完成Hadoop伪分布式环境
3 实验容求
1编程实现文件合重操作
两输入文件文件A文件B请编写MapReduce程序两文件进行合剔中重复容新输出文件C面输入文件输出文件样例供参考
实验终结果(合文件):
代码:
package comMerge
import javaioIOException
import orgapachehadoopconfConfiguration
import orgapachehadoopfsPath
import orgapachehadoopioText
import orgapachehadoopmapreduceJob
import orgapachehadoopmapreduceMapper
import orgapachehadoopmapreduceReducer
import orgapachehadoopmapreducelibinputFileInputFormat
import orgapachehadoopmapreduceliboutputFileOutputFormat
public class Merge {
public static class Map extends Mapper