千家信息网

hadoop中如何实现DBInputFormat

发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,这篇文章主要介绍了hadoop中如何实现DBInputFormat,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。代码未做测试,先做记录
千家信息网最后更新 2025年01月31日hadoop中如何实现DBInputFormat

这篇文章主要介绍了hadoop中如何实现DBInputFormat,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

代码未做测试,先做记录

package com.test;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import java.net.URI;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sql.SQLException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.io.Writable;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.lib.db.DBConfiguration;import org.apache.hadoop.mapreduce.lib.db.DBInputFormat;import org.apache.hadoop.mapreduce.lib.db.DBWritable;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;import org.apache.hadoop.util.Tool;import org.apache.hadoop.util.ToolRunner;/** * 要运行本示例 * 1、把mysql的jdbc驱动放到taskTracker的lib目录下,重启集群 * */public class WordCountDB extends Configured implements Tool {  private String OUT_PATH = "hdfs://grid131:9000/output";  public static class Map extends Mapper {  public void map(LongWritable key, MyUser value, Context context) throws IOException, InterruptedException {   context.write(key, new Text(value.toString()));  } }  public int run(String[] args) throws Exception {  Configuration conf = this.getConf();  DBConfiguration.configureDB(conf, "com.mysql.jdbc.Driver", "jdbc:mysql://grid131:3306/test", "root", "admin");    //输出路径如果存在,则删除  FileSystem fs = FileSystem.get(new URI(OUT_PATH), conf);  fs.delete(new Path(OUT_PATH), true);    Job job = new Job(conf, WordCountDB.class.getSimpleName());  job.setJarByClass(WordCountDB.class);    FileOutputFormat.setOutputPath(job, new Path(args[1]));    //指定不需要reduce,直接把map输出写入到hdfs中  job.setNumReduceTasks(0);  job.setInputFormatClass(DBInputFormat.class);    //指定表、字段  //DBInputFormat.setInput(job, inputClass, tableName, conditions, orderBy, fieldNames)  DBInputFormat.setInput(job, MyUser.class, "myuser", null, null, "id", "name");  job.setMapperClass(Map.class);    //当reduce输出类型与map输出类型一致时,map的输出类型可以不设置  job.setMapOutputKeyClass(LongWritable.class);  job.setMapOutputValueClass(Text.class);    job.waitForCompletion(true);    return job.isSuccessful()?0:1; }  public static void main(String[] args) throws Exception {  int exit = ToolRunner.run(new WordCount(), args);  System.exit(exit); }}class MyUser implements Writable, DBWritable { private Long id; private String name;  public Long getId() {  return id; } public void setId(Long id) {  this.id = id; } public String getName() {  return name; } public void setName(String name) {  this.name = name; }  @Override public void write(DataOutput out) throws IOException {  out.writeLong(this.id);  Text.writeString(out, this.name); }  @Override public void readFields(DataInput in) throws IOException {  this.id = in.readLong();  this.name = Text.readString(in); }  @Override public void write(PreparedStatement statement) throws SQLException {  statement.setLong(1, this.id);  statement.setString(2, this.name); }  @Override public void readFields(ResultSet resultSet) throws SQLException {  this.id = resultSet.getLong(1);  this.name = resultSet.getString(2); }  @Override public String toString() {  return this.id + "\t" + this.name; }}

感谢你能够认真阅读完这篇文章,希望小编分享的"hadoop中如何实现DBInputFormat"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!

输出 篇文章 类型 一致 代码 价值 兴趣 同时 字段 更多 朋友 目录 知识 示例 编带 行业 资讯 资讯频道 路径 集群 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 h1z1服务器怎么点 阿勒泰软件开发解决方案 网络安全问题考研雅思作文 app怎么跟其他数据库对接 txt下载找不到服务器 天津电子软件开发方案 杭州顽派网络技术有限公司 向日葵不能连接到服务器 新能源汽车网络安全股票 中华总工会网络安全工程师培训 服务器无法正常玩游戏 网络安全校园日课件 中央网络安全和信息化的关系 互联网黑科技的现状 湖北app软件开发大概多少钱 互联网金融科技公司名单 网络安全周活动进展情况总结 商机互通网络技术有限公司怎么样 北京美团软件开发招聘信息 蔚来数字座舱与软件开发 linux上方便连服务器的软件 使命召唤ol绑定大区服务器忙 浙江智能套料软件开发商 未来网络安全问题重点领域有哪些 新威网络安全等级 国外游戏软件开发 网络安全联防机制 天津教育系统网络安全平台 t天津服务器板卡研发公司 南昌公安局网络安全保卫支队
0