Hadoop回收站及fs.trash参数详解
发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,前言:Linux系统里,个人觉得最大的不方便之一就是没有回收站的概念。rm -rf很容易造成极大的损失。而在Hadoop或者说HDFS里面,有trash(回收站)的概念,可以使得数据被误删以后,还可以
千家信息网最后更新 2025年02月04日Hadoop回收站及fs.trash参数详解
前言:
- Linux系统里,个人觉得最大的不方便之一就是没有回收站的概念。rm -rf很容易造成极大的损失。而在Hadoop或者说HDFS里面,有trash(回收站)的概念,可以使得数据被误删以后,还可以找回来。
- Hadoop里的trash选项默认是关闭的,所以如果要生效,需要提前将trash选项打开,修改conf里的core-site.xml即可,下面我们测试下开启前后的区别:
1.不启用trash
[hadoop@hadoop000 ~]$ hdfs dfs -put test.log /[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:49 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user# 删除test.log 注意提示[hadoop@hadoop000 ~]$ hdfs dfs -rm -r /test.logDeleted /test.log# 重新查看 发现test.log被删除[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 2 itemsdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user
2.启用trash
[hadoop@hadoop000 hadoop]$ pwd/opt/software/hadoop-2.8.1/etc/hadoop# 增加fs.trash参数配置 开启trash(进程不需重启)[hadoop@hadoop000 hadoop]$ vi core-site.xml fs.trash.interval 1440 fs.trash.checkpoint.interval 1440 # fs.trash.interval是在指在这个回收周期之内,文件实际上是被移动到trash的这个目录下面,而不是马上把数据删除掉。等到回收周期真正到了以后,hdfs才会将数据真正删除。默认的单位是分钟,1440分钟=60*24,刚好是一天;fs.trash.checkpoint.interval则是指垃圾回收的检查间隔,应该是小于或者等于fs.trash.interval。# 参考官方文档:http://hadoop.apache.org/docs/r2.8.4/hadoop-project-dist/hadoop-common/core-default.xml [hadoop@hadoop000 ~]$ hdfs dfs -put test.log /[hadoop@hadoop000 ~]$ hdfs dfs -ls / Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user# 删除test.log 注意提示的不同[hadoop@hadoop000 ~]$ hdfs dfs -rm -r /test.log 18/05/23 16:54:55 INFO fs.TrashPolicyDefault: Moved: 'hdfs://192.168.6.217:9000/test.log' to trash at: hdfs://192.168.6.217:9000/user/hadoop/.Trash/Current/test.log# 发现删除的文件在回收站里[hadoop@hadoop000 ~]$ hdfs dfs -ls /user/hadoop/.Trash/CurrentFound 1 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /user/hadoop/.Trash/Current/test.log# 恢复误删除的文件[hadoop@hadoop000 ~]$ hdfs dfs -mv /user/hadoop/.Trash/Current/test.log /test.log[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user
回收站
数据
文件
周期
概念
提示
参数
不同
最大
个人
前言
单位
垃圾
官方
实际
实际上
就是
损失
文档
是在
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全年会举报
ios 创建数据库表
代理服务器 校园网
网络安全讲些什么
瑞庭网络技术周边房子
宁夏的网络安全公司
服务器防护能力
服务器空间阿里云
河北ipfs服务器云空间
数据库单价大于0的语句
房山旧服务器回收价格
虹口区工程软件开发代理品牌
数据库表中的基本运算
国家推进 网络安全认证
你对网络安全的看法
网络安全协议与标准
查看网络安全工程师证书
阿里云云服务器文件管理
重庆直播软件开发公司哪家强
铁路网络安全事件按级别
死亡骑士t11数据库
软件开发容易入手吗
网络安全四年级简单手抄报字少
dhcp服务器设置代理
杭州同欣网络技术有限公司能源
唯有魔力无法连接服务器
服务器管理记录怎么写
今天B站是不是服务器炸了
软件开发还是重装好
湖南环泰网络安全学院