您可以使用 pgsql-pitr.yml 剧本执行 PITR，但在某些情况下，您可能希望手动执行 PITR，直接使用 pgbackrest 原语实现精细的控制。我们将使用带有 MinIO 备份仓库的 四节点沙箱 集群来演示该过程。

pigsty-sandbox

初始化沙箱

使用 vagrant 或 terraform 准备四节点沙箱环境，然后：

bash

curl https://repo.pigsty.io/get | bash; cd ~/pigsty/
./configure -c full
./install

现在以管理节点上的管理员用户（或 dbsu）身份操作。

检查备份

要检查备份状态，您需要切换到 postgres 用户并使用 pb 命令：

bash

sudo su - postgres    # 切换到 dbsu: postgres 用户
pb info               # 打印 pgbackrest 备份信息

pb 是 pgbackrest 的别名，会自动从 pgbackrest 配置中获取 stanza 名称。

bash

function pb() {
    local stanza=$(grep -o '\[[^][]*]' /etc/pgbackrest/pgbackrest.conf | head -n1 | sed 's/.*\[\([^]]*\)].*/\1/')
    pgbackrest --stanza=$stanza $@
}

您可以看到初始备份信息，这是一个全量备份：

root@pg-meta-1:~# pb info
stanza: pg-meta
    status: ok
    cipher: aes-256-cbc

    db (current)
        wal archive min/max (17): 000000010000000000000001/000000010000000000000007

        full backup: 20250713-022731F
            timestamp start/stop: 2025-07-13 02:27:31+00 / 2025-07-13 02:27:33+00
            wal start/stop: 000000010000000000000004 / 000000010000000000000004
            database size: 44MB, database backup size: 44MB
            repo1: backup size: 8.4MB

备份完成于 2025-07-13 02:27:33+00，这是您可以恢复到的最早时间。由于 WAL 归档处于活动状态，您可以恢复到备份之后的任何时间点，直到 WAL 结束（即现在）。

生成心跳

您可以生成一些心跳来模拟工作负载。/pg-bin/pg-heartbeat 就是用于此目的的，它每秒向 monitor.heartbeat 表写入一个心跳时间戳。

make rh # 运行心跳：ssh 10.10.10.10 'sudo -iu postgres /pg/bin/pg-heartbeat'

ssh 10.10.10.10 'sudo -iu postgres /pg/bin/pg-heartbeat'

cls | ts | lsn | lsn_int | txid | status | now | elapse ---------+-------------------------------+------------+-----------+------+---------+-----------------+---------- pg-meta | 2025-07-13 03:01:20.318234+00 | 0/115BF5C0 | 291239360 | 4812 | leading | 03:01:20.318234 | 00:00:00

您甚至可以向集群添加更多工作负载，让我们使用 pgbench 生成一些随机写入：

make ri # 初始化 pgbench make rw # 运行 pgbench 读写工作负载

pgbench -is10 postgres://dbuser_meta:DBUser.Meta@10.10.10.10:5433/meta while true; do pgbench -nv -P1 -c4 --rate=64 -T10 postgres://dbuser_meta:DBUser.Meta@10.10.10.10:5433/meta; done

while true; do pgbench -nv -P1 -c4 --rate=64 -T10 postgres://dbuser_meta:DBUser.Meta@10.10.10.10:5433/meta; done pgbench (17.5 (Homebrew), server 17.4 (Ubuntu 17.4-1.pgdg24.04+2)) progress: 1.0 s, 60.9 tps, lat 7.295 ms stddev 4.219, 0 failed, lag 1.818 ms progress: 2.0 s, 69.1 tps, lat 6.296 ms stddev 1.983, 0 failed, lag 1.397 ms ...

PITR 手册

现在让我们选择一个恢复时间点，比如 2025-07-13 03:03:03+00，这是初始备份（和心跳）之后的一个时间点。要执行手动 PITR，使用 pg-pitr 工具：

bash

$ pg-pitr -t "2025-07-13 03:03:00+00"

它会为您生成执行恢复的指令，通常需要四个步骤：

bash

Perform time PITR on pg-meta
[1. Stop PostgreSQL] ===========================================
   1.1 Pause Patroni (if there are any replicas)
$ pg pause <cls>  # 暂停 patroni 自动故障切换
   1.2 Shutdown Patroni
$ pt-stop         # sudo systemctl stop patroni
   1.3 Shutdown Postgres
$ pg-stop         # pg_ctl -D /pg/data stop -m fast

[2. Perform PITR] ===========================================
   2.1 Restore Backup
$ pgbackrest --stanza=pg-meta --type=time --target='2025-07-13 03:03:00+00' restore
   2.2 Start PG to Replay WAL
$ pg-start        # pg_ctl -D /pg/data start
   2.3 Validate and Promote
     - If database content is ok, promote it to finish recovery, otherwise goto 2.1
$ pg-promote      # pg_ctl -D /pg/data promote

bash

[3. Restore Primary] ===========================================
   3.1 Enable Archive Mode (Restart Required)
$ psql -c 'ALTER SYSTEM SET archive_mode = on;'
   3.1 Restart Postgres to Apply Changes
$ pg-restart      # pg_ctl -D /pg/data restart
   3.3 Restart Patroni
$ pt-restart      # sudo systemctl restart patroni

[4. Restore Cluster] ===========================================
   4.1 Re-Init All [**REPLICAS**] (if any)
       - 4.1.1 option 1: restore replicas with same pgbackrest cmd (require central backup repo)
$ pgbackrest --stanza=pg-meta --type=time --target='2025-07-13 03:03:00+00' restore
       - 4.1.2 option 2: nuke the replica data dir and restart patroni (may take long time to restore)
$ rm -rf /pg/data/*; pt-restart
       - 4.1.3 option 3: reinit with patroni, which may fail if primary lsn < replica lsn
$ pg reinit pg-meta
   4.2 Resume Patroni
$ pg resume pg-meta
   4.3 Full Backup (optional)
$ pg-backup full      # 建议在 PITR 后执行新的全量备份

单节点示例

让我们从简单的单节点 pg-meta 集群开始，作为一个更简单的示例。

关闭数据库

pt-stop # sudo systemctl stop patroni，关闭 patroni（和 postgres）

可选，因为如果 patroni 未暂停，postgres 会被 patroni 关闭

$ pg_stop # pg_ctl -D /pg/data stop -m fast，关闭 postgres

pg_ctl: PID file "/pg/data/postmaster.pid" does not exist Is server running?

$ pg-ps # 打印 postgres 相关进程

UID PID PPID C STIME TTY STAT TIME CMD postgres 31048 1 0 02:27 ? Ssl 0:19 /usr/sbin/pgbouncer /etc/pgbouncer/pgbouncer.ini postgres 32026 1 0 02:28 ? Ssl 0:03 /usr/bin/pg_exporter ... postgres 35510 35480 0 03:01 pts/2 S+ 0:00 /bin/bash /pg/bin/pg-heartbeat

确保本地 postgres 没有运行，然后执行手册中给出的恢复命令：

恢复备份

pgbackrest --stanza=pg-meta --type=time --target='2025-07-13 03:03:00+00' restore

postgres@pg-meta-1:~$ pgbackrest --stanza=pg-meta --type=time --target='2025-07-13 03:03:00+00' restore 2025-07-13 03:17:07.443 P00 INFO: restore command begin 2.54.2: ... 2025-07-13 03:17:07.470 P00 INFO: repo1: restore backup set 20250713-022731F, recovery will start at 2025-07-13 02:27:31 2025-07-13 03:17:07.471 P00 INFO: remove invalid files/links/paths from '/pg/data' 2025-07-13 03:17:08.523 P00 INFO: write updated /pg/data/postgresql.auto.conf 2025-07-13 03:17:08.527 P00 INFO: restore size = 44MB, file total = 1436 2025-07-13 03:17:08.527 P00 INFO: restore command end: completed successfully (1087ms)

验证数据

我们不希望 patroni HA 接管，直到确定数据正确，所以手动启动 postgres：

pg-start

waiting for server to start....2025-07-13 03:19:33.133 UTC [39294] LOG: redirecting log output to logging collector process 2025-07-13 03:19:33.133 UTC [39294] HINT: Future log output will appear in directory "/pg/log/postgres". done server started

现在您可以检查数据，看看是否处于您想要的时间点。您可以通过检查业务表中的最新时间戳来验证，或者在本例中通过心跳表检查。

bash

postgres@pg-meta-1:~$ psql -c 'table monitor.heartbeat'
   id    |              ts               |    lsn    | txid
---------+-------------------------------+-----------+------
 pg-meta | 2025-07-13 03:02:59.214104+00 | 302005504 | 4912

时间戳正好在我们指定的时间点之前！（2025-07-13 03:03:00+00）。如果这不是您想要的时间点，可以使用不同的时间点重复恢复。由于恢复是以增量和并行方式执行的，速度非常快。可以重试直到找到正确的时间点。

提升主库

恢复后的 postgres 集群处于 recovery 模式，因此在提升为主库之前会拒绝任何写操作。这些恢复参数是由 pgBackRest 在配置文件中生成的。

ini

postgres@pg-meta-1:~$ cat /pg/data/postgresql.auto.conf
# Do not edit this file or use ALTER SYSTEM manually!
# It is managed by Pigsty & Ansible automatically!

# Recovery settings generated by pgBackRest restore on 2025-07-13 03:17:08
archive_mode = 'off'
restore_command = 'pgbackrest --stanza=pg-meta archive-get %f "%p"'
recovery_target_time = '2025-07-13 03:03:00+00'

如果数据正确，您可以提升它为主库，将其标记为新的领导者并准备接受写入。

pg-promote waiting for server to promote.... done server promoted

psql -c 'SELECT pg_is_in_recovery()' # 'f' 表示已提升为主库 pg_is_in_recovery

f (1 row)

一旦提升，数据库集群将进入新的时间线（领导者纪元）。如果有任何写流量，将写入新的时间线。

恢复集群

最后，不仅需要恢复数据，还需要恢复集群状态，例如：

patroni 接管
归档模式
备份集
从库

Patroni 接管

您的 postgres 是直接启动的，要恢复 HA 接管，您需要启动 patroni 服务：

pt-start # sudo systemctl start patroni

pg resume pg-meta # 恢复 patroni 自动故障切换（如果之前暂停过）

归档模式

archive_mode 在恢复期间被 pgbackrest 禁用。如果您希望新领导者的写入归档到备份仓库，还需要启用 archive_mode 配置。

psql -c 'show archive_mode'

archive_mode

off

psql -c 'ALTER SYSTEM RESET archive_mode;' psql -c 'SELECT pg_reload_conf();' psql -c 'show archive_mode'

您也可以直接编辑 postgresql.auto.conf 并使用 pg_ctl 重载

sed -i '/archive_mode/d' /pg/data/postgresql.auto.conf pg_ctl -D /pg/data reload

备份集

通常建议在 PITR 后执行新的全量备份，但这是可选的。

从库

如果您的 postgres 集群有从库，您也需要在每个从库上执行 PITR。或者，更简单的方法是删除从库数据目录并重启 patroni，这将从主库重新初始化从库。我们将在下一个多节点集群示例中介绍这种情况。

多节点示例

现在让我们以三节点 pg-test 集群作为 PITR 示例。

PGSQL

Patroni

pgBouncer

pgBackRest

pg_exporter

INFRA

NODE

ETCD

MINIO

DOCKER

REDIS

FERRET

JUICE

pig

piglet

vibe

pilot

应用模板

初始化沙箱

检查备份

生成心跳

PITR 手册

单节点示例

关闭数据库

可选，因为如果 patroni 未暂停，postgres 会被 patroni 关闭

恢复备份

验证数据

提升主库

psql -c 'SELECT pg_is_in_recovery()' # 'f' 表示已提升为主库 pg_is_in_recovery

恢复集群

Patroni 接管

归档模式

archive_mode

您也可以直接编辑 postgresql.auto.conf 并使用 pg_ctl 重载

备份集

从库

多节点示例

初始化沙箱 ​

检查备份 ​

生成心跳 ​

PITR 手册 ​

单节点示例 ​

关闭数据库 ​

可选，因为如果 patroni 未暂停，postgres 会被 patroni 关闭 ​

恢复备份 ​

验证数据 ​

提升主库 ​

psql -c 'SELECT pg_is_in_recovery()' # 'f' 表示已提升为主库 pg_is_in_recovery ​

恢复集群 ​

Patroni 接管 ​

归档模式 ​

archive_mode ​

您也可以直接编辑 postgresql.auto.conf 并使用 pg_ctl 重载 ​

备份集 ​

从库 ​

多节点示例 ​

初始化沙箱

检查备份

生成心跳

PITR 手册

单节点示例

关闭数据库

可选，因为如果 patroni 未暂停，postgres 会被 patroni 关闭

恢复备份

验证数据

提升主库

psql -c 'SELECT pg_is_in_recovery()' # 'f' 表示已提升为主库 pg_is_in_recovery

恢复集群

Patroni 接管

归档模式

archive_mode

您也可以直接编辑 postgresql.auto.conf 并使用 pg_ctl 重载

备份集

从库

多节点示例