ORACLE数据库文件丢失后的恢复测试
一、测试环境
数据库版本是11GR2,在做完一份完全备份之后,关机,做一份快照,每一次开机之后都执行数次alter system switch logfile以产生归档日志。
之后的测试都是基于这么一个完全备份来恢复。
CONFIGURE CONTROLFILE AUTOBACKUP FORMAT FOR DEVICE TYPE DISK TO '/backup/%F';
backup incremental level 0 format '/backup/%T_%f' database;
二、数据文件丢失的测试
2.1丢失所有数据文件的测试
1.启动数据库至mount状态
startup mount;
2.启动RMAN
[oracle@mycentos orcl]$ rman target /
3.还原数据库
RMAN>restore database;
4.恢复数据库
RMAN>recover database;
恢复完成之后,查看各个文件的状态是否正常。
select file_name,file_id,status from dba_data_files;
--查看临时表空间文件
select status,enabled, name, bytes/1024/1024 file_size
from v$tempfile;
select file_name from dba_temp_files;
2.2丢失单个数据文件的测试
2.2.1非关键数据文件丢失
以丢失数据文件'/u01/app/oracle/oradata/orcl/users01.dbf'为例,当数据库处于未崩溃状态时:
1)alter database datafile'/u01/app/oracle/oradata/orcl/users01.dbf' offline;
2)RMAN 模式下restore/recover数据文件
restore datafile '/u01/app/oracle/oradata/orcl/users01.dbf';
recover datafile '/u01/app/oracle/oradata/orcl/users01.dbf'
3)数据文件上线
alter database datafile'/u01/app/oracle/oradata/orcl/users01.dbf' online;
当数据库因意外而崩溃时:
[oracle@mycentos ~]$ sqlplus /nolog
SQL> conn /as sysdba
SQL> startup;
ORA-01157: cannot identify/lock data file 4 - see DBWR trace file
ORA-01110: data file 4: '/u01/app/oracle/oradata/orcl/users01.dbf'
--可以直接先启动至mount状态
启动RMAN:
restore datafile '/u01/app/oracle/oradata/orcl/users01.dbf';
recover datafile '/u01/app/oracle/oradata/orcl/users01.dbf'
alter database datafile'/u01/app/oracle/oradata/orcl/users01.dbf' online;
alter database open;
非关键数据文件丢失后,先使数据文件处于offline状态,在恢复数据文件之后,再将其转成online状态。
2.2.2关键数据文件丢失
[oracle@mycentos orcl]$ rm system01.dbf;
关闭数据库后,过程与崩溃后恢复数据非关键数据文件的过程一样。
三、日志文件丢失的测试
当前的配置是所有的group都只有一个成员,在group1中新增一个成员,使其变成2个成员,其他group仍然只有一个成员。
3.1丢失inactive日志文件的恢复测试
删除第二个日志组,并且模拟数据库崩溃
在未关机状态下,数据库能继续运行,但是日志文件中会有告警信息。
shutdown abort;
startup mount;
alter database clear unarchived logfile group 2; #此命令会重建第二组日志文件
alter database open;
删除第一组日志的一个成员:
rm redo01.log
shutdown abort;
startup;
数据库可以正常打开。redo01.log的状态变成了INVALID.
使用alter database clear unarchived logfile group 1;重建日志文件
3.2丢失CURRENT日志文件的恢复测试
当第一组为CURRENT或actives时,删除第一组日志的一个成员,数据库可以正常打开。
第三组为CURRENT,并且只有一个成员时,删除第三组的日志。
startup 命令报错,并且在执行clear unarchived logfile时会报
ORA-01624: log 3 needed for crash recovery of instance orcl (thread 1)的错误。
alter database open;#会报ORA-00313的错误
因此需要用其他方式来打开数据库:
方法一:使用不完全恢复:
RMAN>RESTORE DATABASE;
RMAN>RECOVER DATABASE UNTIL TIME 'SYSDATE-5/1440';#具体的时间可以看归档日志的生成时间
SQL>alter database open resetlogs;
方法二:直接使用不完全恢复,不用RMAN。
SQL>alter system set "_allow_resetlogs_corruption"=true scope=spfile;
SQL>shutdown abort;
SQL>startup mount;
SQL> recover database until cancel;
SQL> alter database open resetlogs;
3.3丢失归档日志文件,并且需要恢复数据库。
使用RMAN不完全恢复至某一个时间点。
3.4丢失所有联机重做日志文件的测试
参照丢3.2失CURRENT日志文件的恢复测试
四、丢失控制文件的测试
4.1当控制文件有多个副本时,删除其中一个控制文件,模拟数据库崩溃的情况。
在数据库关闭的情况下,将副本复制成已删除的控制文件的名字,能正常打开数据库。
4.2 控制文件所有成员丢失,模拟数据库崩溃
4.2.1 有备份控制文件的情况下,使用备份的控制文件恢复数据库。
SQL>startup nomount;
RMAN>set dbid 1443678834#可以查看备份的控制文件获得DBID
RMAN>restore controlfile from '/backup/c-1443678834-20160723-00';
SQL>alter system set "_allow_resetlogs_corruption"=true scope=spfile;
SQL>shutdown abort;
SQL>startup mount;
SQL> recover database using backup controlfile until cancel;
#输入AUTO,应用归档日志后,再输入一遍recover database .......,输入online redo的路径+名称
SQL> alter database open resetlogs;#数据不会丢失
#有需要的话要重建临时表空间
#ALTER TABLESPACE TEMP ADD TEMPFILE '/u01/app/oracle/oradata/orcl/temp01.dbf' SIZE 1G;
4.2.2 没有备份的控制文件,则需要重建控制文件。
在删除控制文件之前,获取控制文件的创建语句:
1)alter database backup controlfile to trace as '/home/oracle/crontol_trace.trc';
2)从/home/oracle/crontol_trace.trc文件中获得如下语句:
CREATE CONTROLFILE REUSE DATABASE "ORCL" RESETLOGS ARCHIVELOG
MAXLOGFILES 16
MAXLOGMEMBERS 3
MAXDATAFILES 100
MAXINSTANCES 8
MAXLOGHISTORY 292
LOGFILE
GROUP 1 '/u01/app/oracle/oradata/orcl/redo01.log' SIZE 50M BLOCKSIZE 512,
GROUP 2 '/u01/app/oracle/oradata/orcl/redo02.log' SIZE 50M BLOCKSIZE 512,
GROUP 3 '/u01/app/oracle/oradata/orcl/redo03.log' SIZE 50M BLOCKSIZE 512,
GROUP 4 '/u01/app/oracle/oradata/orcl/redo_04.log' SIZE 50M BLOCKSIZE 512
DATAFILE
'/u01/app/oracle/oradata/orcl/system01.dbf',
'/u01/app/oracle/oradata/orcl/sysaux01.dbf',
'/u01/app/oracle/oradata/orcl/undotbs01.dbf',
'/u01/app/oracle/oradata/orcl/users01.dbf',
'/u01/app/oracle/oradata/orcl/test_01.dbf',
'/u01/app/oracle/oradata/orcl/test_02.dbf'
CHARACTER SET ZHS16GBK;
如果没有使用1)中的语句获取创建语句,也可以根据实际情况重建控制文件。
删除所有的控制文件,并且模拟数据库崩溃。
恢复的过程如下:
1)startup nomount;
2)执行创建控制文件的语句,直接复制语句或放在脚本里均可。
3)之后执行:
SQL>alter system set "_allow_resetlogs_corruption"=true scope=spfile;
SQL>shutdown abort;
SQL>startup mount;
SQL> recover database using backup controlfile until cancel;
#输入AUTO,应用归档日志后,再输入一遍recover database .......,输入online redo的路径+名称
SQL> alter database open resetlogs;#数据不会丢失
重建临时表空间
ALTER TABLESPACE TEMP ADD TEMPFILE '/u01/app/oracle/oradata/orcl/temp01.dbf' SIZE 1G;
五、在只有一份备份的情况下,其余文件均丢失后,打开数据库
在数据库崩溃之后:
1)启动数据库至nomount,开启RMAN并设置dbid
SQL>startup nomount;
RMAN>set dbid 1443678834
2)还原控制文件
RMAN>restore controlfile from '/backup/c-1443678834-20160723-00';
SQL>alter database mount;
3)还原数据文件
RMAN>restore database;
4)执行不完全恢复:
SQL>alter system set "_allow_resetlogs_corruption"=true scope=spfile;
SQL>shutdown abort;
SQL>startup mount;
SQL> recover database using backup controlfile until cancel;
因为日志文件、归档日志文件都已经被删除,所以选择cancel不执行恢复。
SQL> alter database open resetlogs;
之后检查各文件是否正常。
六、总结
从模拟在线日志文件、控制文件丢失的过程中可以发现,当这些文件有副本时,可以很快地打开数据库,从而降低恢复数据库的难度。