初探MySQL数据备份及备份原理
相信通过上一篇文章《数据丢失如当头棒喝,数据备份重如山!》,很多人对于数据备份的重要性有了深刻的认识,本文将以MySQL为例带大家进一步了解数据备份的原理和初步实践。
根据需求的不同,数据备份的方式也不同,MySQL官方给定的备份方式有三种,分别是冷备、热备和温备;如果以备份的数据集为划分标准,那么可划分为完全备份和部分备份;如果是以备份时的接口为划分标准,那么可分为物理备份、逻辑备份、完全备份、增量备份和差异备份。
后面两种备份的分类方式比较容易理解,下面我们着重介绍一下冷备、热备和温备。
冷备:简单来说,就是数据必须下线后备份。在备份之前,停止MySQL实例的运行,并且在整个备份过程中,用户都无法访问数据库。
热备:简单来说,就是数据不离线,读写可以正常进行,MySQL实例始终处于运行状态。
温备:简单来说,就是全局施加共享锁,只能读,不能写。在备份过程中,MySQL实例虽然仍是运行的,但是不能进行更新或修改等操作。
数据、配置文件、代码(存储过程、存储函数、触发器)、os相关的配置文件、复制相关的配置以及二进制日志都是我们要备份的对象。那么问题来了,如何来备份上述这些呢?我们以文件系统快照(LVM)、逻辑备份工具Mysqldump、Mydumper以及物理备份工具Xtrabackup这四种方案为例,剖析一下MySQL数据备份的原理。
快照备份
快照备份是我们上文提到的热备份的一种,通过文件系统支持的快照功能对数据库进行备份。在MySQL中使用快照备份只需将数据文件、日志文件都放在一个逻辑卷中,并对该逻辑卷快照备份。快照备份倾向于防范误操作,一旦操作失误,就可以利用快照恢复到之前的时间点,不过,因为快照只能是在本地,如果磁盘损坏,那么快照也就损坏,备份也就消失了。
图源网络
Mysqldump
Mysqldump是MySQL自带的备份工具,通过create table、drop table和insert into 等SQL语句,将数据库中的数据导出成.sql文件。由于Mysqldump依赖数据库层的转换,并不关心底层的存储引擎,所以适用范围更广泛,并且可以在不同MySQL版本之间切换。也同样是因为此,Mysqldump生成的备份文件很大、速度较慢,且在备份过程中对数据库的访问有较大的影响,不适用于数据量大、业务压力高的实例。
Mydumper
Mydumper与Mysqldump的原理类似,但其有一个特点就是可以采用多线程并行备份,大大提高了数据导出的速度。该工具由MySQL、Facebook、skysql公司的开发人员一起开发维护,由轻量级C语言开发。据说,执行速度比mysqldump快10倍,支持事务和非事务表的一致性备份、导出binlog、多线程备份、以守护进程的形式工作,定时备份等等。
图源网络
XtraBackup
XtraBackup可能是现在最为广泛的备份方式,它是 Percona 公司开发的一个用于 MySQL 数据库物理热备的备份工具,支持 MySQl(Oracle)、Percona Server 和 MariaDB,并且全部开源。因为XtraBackup是物理备份,所以其是靠拷贝数据库文件和日志来完成备份,速度更快,其中最主要的工具集是 innobackupex(备份InnoDB表) 和 xtrabackup(备份非InnoDB表),前者是一个 perl 脚本,后者是 C/C++ 编译的二进制。
图源网络