千家信息网

PostgreSQL备份和恢复自动化的方法

发表于:2025-01-17 作者:千家信息网编辑
千家信息网最后更新 2025年01月17日,这篇"PostgreSQL备份和恢复自动化的方法"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来
千家信息网最后更新 2025年01月17日PostgreSQL备份和恢复自动化的方法

这篇"PostgreSQL备份和恢复自动化的方法"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇"PostgreSQL备份和恢复自动化的方法"文章吧。

SQL 转储

这种转储方法背后的想法是使用 SQL 命令从 DataCenter1 生成一个文本文件,当反馈到 DataCenter2 服务器时,将重新创建与转储时相同状态的数据库。在这种情况下,如果客户端无法访问主服务器,他们可以访问 BCP 服务器。PostgreSQL 为此提供了实用程序 pg_dump。该命令的基本用法是: pg_dump dbname >backupoutputfile.db。

如您所见,pg_dump 将其结果写入标准输出。下面,我们将看到这如何有用。

pg_dump 是一个常规的 PostgreSQL 客户端应用程序。这意味着您可以从任何有权访问数据库的远程主机执行此备份过程。pg_dump 不以特殊权限运行。特别是,它必须对您要备份的所有表具有读访问权限,因此在实践中,您几乎总是必须以数据库超级用户身份运行它。

pg_dump 创建的转储在内部是一致的,也就是说,转储代表 pg_dump 开始运行时数据库的快照。pg_dump 在工作时不会阻止对数据库的其他操作。(具有排他锁的例外,例如大多数形式的 ALTER TABLE。)

重要提示:如果您的数据库模式依赖于 OID(例如作为外键),您必须指示 pg_dump 也转储 OID。为此,请使用 -o 命令行选项。

SQL 转储自动化

  • 首先,创建剧本 pgbackup.yml

  • 创建角色 pgbackup,它将从 pgbackup.yml 中调用

Pgbackup.yml

---- hosts: database_prim:database_replica  gather_facts: true  vars_files:    - mysecret_vars/{{ environ }}.yml# This is to Identify if DB is Primary and replicating data to secondary  tasks:  - name: select pg status    command: psql -c "SELECT pg_is_in_recovery();"    register: IsPromoted    changed_when: False    environment:      PGDATABASE: "{{ pg_database }}"      PGUSER : "{{ pg_username }}"      PGPASSWORD : "{{ pg_password }}"#Get the DB parameter from run time on Client application, Not required if you have parameters  - block:    - name: Get client database settings      shell: "awx-manage print_settings | grep '^DATABASES'"      register: results      changed_when: False      delegate_to: "{{ groups['client'][0] }}"    - name: Ingest client database settings      set_fact:        client_db_settings: "{{ results.stdout | regex_replace('DATABASES\\s+= ', '') }}"      delegate_to: "{{ groups['client'][0] }}"     - include_role:        name: pgbackup    when: "'f' in IsPromoted.stdout"  tags: pgbackup
  • pgbackup 角色

---- name: Determine the timestamp for the backup.  set_fact:    now: '{{ lookup("pipe", "date +%F-%T") }}'- name: Create a directory for a backup to live.  file:    path: '{{ backup_dir.rstrip("/") }}/{{ now }}/'    mode: 0775    owner: root    state: directory- name: Create a directory for non-instance specific backups  file:    path: '{{ backup_dir.rstrip("/") }}/common/'    mode: 0775    owner: root    state: directory# create dump, Here adding runtime param. You can add param whatever ways- name: Perform a PostgreSQL dump.  shell: "pg_dump --clean --create --host='{{ client_db_settings.default.HOST }}' --port={{ client_db_settings.default.PORT }} --username='{{ tower_db_settings.default.USER  }}' --dbname='{{ tower_db_settings.default.NAME }}' > pgbackup.db"  args:    chdir: '{{ backup_dir.rstrip("/") }}/common/'  environment:    PGPASSWORD: "{{ client_db_settings.default.PASSWORD }}"- name: Copy file with owner and permissions  copy:    src: '{{ backup_dir.rstrip("/") }}/common/pgbackup.db'    dest: '{{ backup_dir.rstrip("/") }}/{{ now }}/'    remote_src: yes
  • 库存文件

  • [all:vars]# database settings.linux.us.ams1907.com[client]linuxclient.us.com[database_prim]linuxmas.us.com[database_replica]linuxreplica.us.com
  • 秘密变量存储:如果要存储任何加密数据,请创建此文件


  • mysecret_vars/{{ environ }}.yml              ansible-vault encrypt mysecretvar.yml

    存储此类参数:pg_password、pg_username 和 pg_database

    恢复转储

    pg_dump 创建的文本文件旨在由 psql 程序读取。恢复转储的一般命令形式是 psql dbname < infile

    在数据中心 2 中恢复


    Infile 是您用作 pg_dump 命令的备份输出文件的文件。该命令不会创建数据库 dbname,因此您必须在执行 psql 之前从 template0 自己创建它(例如,使用 createdb -T template0 dbname)。psql 支持类似于 pg_dump 的选项,用于指定要连接的数据库服务器和要使用的用户名。有关更多信息,请参阅 psql 参考页。

    在还原 SQL 转储之前,拥有对象或被授予转储数据库中对象权限的所有用户必须已经存在。如果不这样做,则还原将无法重新创建具有原始所有权和/或权限的对象。

    无论哪种方式,您都将拥有一个仅部分恢复的数据库。或者,您可以指定整个转储应作为单个事务恢复,以便完全完成或完全回滚恢复。这种模式可以通过将 -1 或 --single-transaction 命令行选项传递给 psql 来指定。使用此模式时,请注意,即使是最小的错误也可能回滚已运行数小时的还原。但是,这可能仍然比在部分还原转储后手动清理复杂数据库更可取。

    数据库恢复

  • 创建 pgrecover.yml

  • 为 pgrecover 创建角色

  • pgrecover.yml


  • - hosts: database_prim[0]   tasks:         - name: Get client database settings      shell: "awx-manage print_settings | grep '^DATABASES'"      register: results      changed_when: False      delegate_to: "{{ groups['client'][0] }}"    - name: Ingest client database settings      set_fact:        tower_db_settings: "{{ results.stdout | regex_replace('DATABASES\\s+= ', '') }}"      delegate_to: "{{ groups['client'][0] }}"# Create User    - name: PostgreSQL | Create test user if its not there      postgresql_user:        name: "test"        password: "{{ client_db_settings.default.PASSWORD }}"        port: "5432"        state: present        login_user: "postgres"        no_password_changes: no      become: yes      become_user: "postgres"      become_method: su     # Create Database    - name: PostgreSQL | Create test Database if its not there      postgresql_db:        name: "test"        owner: "test"        encoding: "UTF-8"        lc_collate: "en_US.UTF-8"        lc_ctype: "en_US.UTF-8"        port: "5432"        template: "template0"        state: present        login_user: "postgres"      become: yes      become_user: "postgres"      become_method: su      - include_role:        name: pgrecover
  • 现在 pgreceover 角色


  • ---- name: Create a directory for non-instance specific backups  file:    path: '{{ backup_dir.rstrip("/") }}/restore/'    mode: 0775    owner: root    state: directory- name: Copy file for restore  copy:    src: '{{ backup_dir.rstrip("/") }}/common/client.db'    dest: '{{ backup_dir.rstrip("/") }}/restore/'    remote_src: yes- name: Perform a PostgreSQL restore  shell: "psql --host='{{ client_db_settings.default.HOST }}' --port={{ client_db_settings.default.PORT }} --username='{{ client_db_settings.default.USER }}' --dbname='test' < ./client.db"  args:    chdir: '{{ backup_dir.rstrip("/") }}/restore/'  environment:    PGPASSWORD: "{{ client_db_settings.default.PASSWORD }}"
  • 库存和秘密变量文件将与我们在 pgbackup 流程中的相同。

  • 使用 pg_dumpall

    pg_dump 一次只转储一个数据库,它不会转储有关角色或表空间的信息(因为它们是集群范围的而不是每个数据库的)。为了支持方便地转储数据库集群的全部内容,提供了 pg_dumpall 程序。pg_dumpall 备份给定集群中的每个数据库,还保留集群范围的数据,例如角色和表空间定义。该命令的基本用法是:

    pg_dumpall > 输出文件

    可以使用 psql 恢复生成的转储: psql -f infile Postgres。

    (实际上,您可以指定任何现有的数据库名称作为开始,但是如果您要重新加载到一个空集群中,那么通常应该使用 Postgres。)在恢复 pg_dumpall 转储时始终需要具有数据库超级用户访问权限,因为那是需要恢复角色和表空间信息。如果您使用表空间,请注意转储中的表空间路径是否适合新安装。

    pg_dumpall 通过发出命令来重新创建角色、表空间和空数据库,然后为每个数据库调用 pg_dump。这意味着虽然每个数据库将在内部保持一致,但不同数据库的快照可能不会完全同步。

    通过在自动化脚本中实现微小的更改,您可以将其更改为 pg_dumpall。

以上就是关于"PostgreSQL备份和恢复自动化的方法"这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注行业资讯频道。

0