从ftp上传文件到hadoop的一个坑
发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,执行如下命令,发现报错[hdfs@cdhm1 ~]$ hadoop distcp ftp://ftp01:ftppasswd@132.110.64.186/test hdfs:///user/data
千家信息网最后更新 2025年01月31日从ftp上传文件到hadoop的一个坑
执行如下命令,发现报错
[hdfs@cdhm1 ~]$ hadoop distcp ftp://ftp01:ftppasswd@132.110.64.186/test hdfs:///user/dataError: java.net.SocketException: 网络不可达 at java.net.PlainSocketImpl.socketConnect(Native Method) at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:350) at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:206) at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:188) at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392) at java.net.Socket.connect(Socket.java:589) at org.apache.commons.net.SocketClient.connect(SocketClient.java:171) at org.apache.commons.net.SocketClient.connect(SocketClient.java:192) at org.apache.hadoop.fs.ftp.FTPFileSystem.connect(FTPFileSystem.java:133) at org.apache.hadoop.fs.ftp.FTPFileSystem.getFileStatus(FTPFileSystem.java:405) at org.apache.hadoop.tools.mapred.CopyMapper.map(CopyMapper.java:218) at org.apache.hadoop.tools.mapred.CopyMapper.map(CopyMapper.java:50) at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:145) at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:787) at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341) at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:163) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:422) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1671) at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:158)
这是为什么呢?命令应该的正确的。
查网络,正常,ftp也能正常传输。
防火墙,selinux都已经关闭,但就是执行报错。
百思不得其解。
查了好多资料,才发现:
原来,hadoop官方不提供ftp接口!
只有个人开发的工具,感觉安装挺麻烦,也许还会有bug,参考资料链接:
http://www.linuxidc.com/Linux/2013-01/78302.htm
我就没安装了,现在是先把文件从ftp下载到本地,在通过
[hdfs@cdhm1 ~]$ hadoop fs -put test /user/data
上传到hadoop中,虽然麻烦点,但胜在稳定,后期也可通过脚本来简化步骤。
命令
网络
资料
麻烦
文件
百思不得其解
个人
参考资料
只有
官方
就是
工具
感觉
接口
步骤
脚本
这是
链接
防火墙
可通
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
韵淘网络技术有限公司
软件开发两年要不要考研
华登区块狗抢狗软件开发
梦幻新诛仙开的服务器名称
中国网络安全事业
僵尸世界大战本地服务器联机
数据库中查询新字段
黄山视频点播软件开发费用
我国最大的软件开发公司
怀旧服什么服务器可以下载
魔兽世界服务器pve
海阳市网络安全等级培训会
怀旧服服务器配置参数
php查询数据库的语句
软件服务器要求
互联网科技手机数码
软件开发收入税会差异
软件开发成本度量方法有哪些
studio数据库怎么查询数据
数据库b站厉害的老师推荐
城关区软件开发app开发
世界互联网大会硬核科技
东城区信息化软件开发
网络安全基线配置指什么
网络技术创业行业论文
网络安全法从草案到出台
小学网络安全主题表演
世界全网络技术有限公司
网络技术是C语言吗
软件开发孵化中心服务