导航：首页 > 服务器 >

mapreduce多文件输出新API怎么实现

发表于：2025-02-03 作者：千家信息网编辑

千家信息网最后更新 2025年02月03日，本篇内容介绍了"mapreduce多文件输出新API怎么实现"的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有

千家信息网最后更新 2025年02月03日mapreduce多文件输出新API怎么实现

本篇内容介绍了"mapreduce多文件输出新API怎么实现"的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

1、针对于代码中的 MultipleOutputs.addNamedOutput(job, "errorlog",
TextOutputFormat.class, Text.class, NullWritable.class); 方法，其实第二个参数并非是这么用的，下面看代码：

private MultipleOutputs multipleOutputs = null;        @Override        protected void reduce(IntWritable key, Iterable values,Context context)                        throws IOException, InterruptedException {                for(Text val:values){                        multipleOutputs.write("KeySplit", NullWritable.get(), val, key.toString()+"/");                        multipleOutputs.write("AllData", NullWritable.get(), val);                }        }

write函数很多重载方法，之前用的是三个参数的，这个方法其实是将所有的reduce输出都输出到一个文件夹中，

这时候我们在调用MultipleOutputs.addNamedOutput()函数的时候传递的第二个参数为多个，所以会导致

-rw-r--r-- 2 hadoop supergroup 10569073 2014-06-06 11:50 /test/aa/fileRequest-m-00063.lzo
-rw-r--r-- 2 hadoop supergroup 10512656 2014-06-06 11:50 /test/aa/fileRequest-m-00064.lzo
-rw-r--r-- 2 hadoop supergroup 68780 2014-06-06 11:51 /test/aa/firstIntoTime-m-00000.lzo
-rw-r--r-- 2 hadoop supergroup 67901 2014-06-06 11:51 /test/aa/firstIntoTime-m-00001.lzo

这样的现象，而且会多输出很多没有用的空文件

那么其实write方法有一个带有四个参数的方法，最后一个参数就恰巧是传递一个目录进去，目的是针对于不同的逻辑将reduce产生的数据输出到不同的文件夹目录下。如第一段代码中的multipleOutputs.write("KeySplit", NullWritable.get(), val, key.toString()+"/");语句，最后一个参数的作用就是相将key作为文件夹，将具有相同key 的数据输出到这个文件夹中，后面跟着一个"/" 代表是当前目录下，当前目录指的肯定不是项目的当前目录，他是在执行hadoop jar 时传递的输出目录的参数，如：hadoop jar test.jar com.TestJob /input /output

假设数据是这样的：
1 丽梅
1 小辉
2 小红
3 大华

那么将输出三个文件夹分别为
/output/1
/output/2
/output/3
其中/output/1这个文件夹中一个文件，内容为

1 丽梅
1 小辉

write函数还有其他方法，暂时还没有研究，而且针对于write方法的第一个函数也没有去研究，如果有时间，会把多文件输出详细总结一下

注：在配置job的时候

这句代码

MultipleOutputs.addNamedOutput(job, "errorlog",    TextOutputFormat.class, Text.class, NullWritable.class);

"mapreduce多文件输出新API怎么实现"的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站，小编将为大家输出更多高质量的实用文章！

很赞哦！

文件输出参数方法文件夹目录代码函数内容数据不同三个时候更多知识小辉研究实用相同学有所成数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全网络安全和网络道德主题班会教案勒索病毒网络安全性分部数据库备份共同筑起网络安全钢铁长城网络安全工程师中心网络安全等级保护分成几个等级剑网1服务器互通吗服务器存档失败错误码1250 英国皇家协会数据库网络安全存在问题整改方案软件开发专科文凭长乐服务器数据恢复江苏特色软件开发常见问题魔兽世界部落pve服务器服务器监听数据库连接主机总出现空白逆战末日数据库补丁服务器来宾账户密码怎么设置煤炭行业网络安全政策法规服务器怎么看有没有风扇 cas数据库列表是什么服务器的dhcp 世界投入产出表数据库官网没有添加到数据库 hp服务器管理工具下载不凡网络技术有限公司姑苏工厂erp生产管理软件开发北京网络营销网络技术排名靠前疾病预防控制中心软件开发给mysql数据库添加外键

千家信息网

千家信息网

mapreduce多文件输出新API怎么实现

CentOS6.9系统下部署Zabbix-server 3.0的步骤

ansible的主机清单，yml语法，playbook详解+

相关文章