千家信息网

Mapreduce程序中reduce的Iterable参数问题怎么解决

发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,这篇文章主要讲解了"Mapreduce程序中reduce的Iterable参数问题怎么解决",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Mapredu
千家信息网最后更新 2025年01月24日Mapreduce程序中reduce的Iterable参数问题怎么解决

这篇文章主要讲解了"Mapreduce程序中reduce的Iterable参数问题怎么解决",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Mapreduce程序中reduce的Iterable参数问题怎么解决"吧!

今天在对reduce的参数Iterable进行迭代时,发现一个问题,即Iterator的next()方法每次返回的是同一个对象,next()只是修改了Writable对象的值,而不是重新返回一个新的Writable对象。

使用wordcount来验证:

我的代码如下:

protected void reduce(Text key, Iterable values,        Reducer.Context context)        throws IOException, InterruptedException {    int sum = 0;    // 保存每个IntWritable到list    List intWritables = new ArrayList();    for (IntWritableval : values) {        intWritables.add(val);        sum += val.get();    }    if(intWritables.size() > 1) {        // 当list size大于1时,验证第一个元素和第二个元素是否是同一个对象        System.out.println("objects is same -> "                + (intWritables.get(0) == intWritables.get(1)));    }    result.set(sum);    context.write(key, result);}

日志输出:

objects is same -> true

这个Iterable的实现是org.apache.hadoop.mapreduce.task.ReduceContextImpl.ValueIterable

Iterator实现是org.apache.hadoop.mapreduce.task.ReduceContextImpl.ValueIterator

其中next()实现时,调用的是org.apache.hadoop.io.serializer.WritableSerialization的deserialize(Writable w)方法,

Writable deserialize(Writable w) IOException {  Writable writable;  (w == ) {    writable       = (Writable) ReflectionUtils.(, getConf());  } {    writable = w;  }  writable.readFields();  writable;}

该方法只是调用了入参w的readFields方法,并没有创建新对象,除非w是null

感谢各位的阅读,以上就是"Mapreduce程序中reduce的Iterable参数问题怎么解决"的内容了,经过本文的学习后,相信大家对Mapreduce程序中reduce的Iterable参数问题怎么解决这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

0