Support clean switchover.
authorFujii Masao <[email protected]>
Tue, 25 Jun 2013 17:18:26 +0000 (02:18 +0900)
committerFujii Masao <[email protected]>
Tue, 25 Jun 2013 17:18:26 +0000 (02:18 +0900)
commit0b958f3efcfcc3d9b0e39d550b705a28763bc9e2
treea6c15ac7ae7e69d2a976686628f6dff709b416ab
parent09bd2acbe5ac866ce93d7c0e6ed90b426a576f1b
Support clean switchover.

In replication, when we shutdown the master, walsender tries to send
all the outstanding WAL records to the standby, and then to exit. This
basically means that all the WAL records are fully synced between
two servers after the clean shutdown of the master. So, after
promoting the standby to new master, we can restart the stopped
master as new standby without the need for a fresh backup from
new master.

But there was one problem so far: though walsender tries to send all
the outstanding WAL records, it doesn't wait for them to be replicated
to the standby. Then, before receiving all the WAL records,
walreceiver can detect the closure of connection and exit. We cannot
guarantee that there is no missing WAL in the standby after clean
shutdown of the master. In this case, backup from new master is
required when restarting the stopped master as new standby.

This patch fixes this problem. It just changes walsender so that it
waits for all the outstanding WAL records to be replicated to the
standby before closing the replication connection.

Per discussion, this is a fix that needs to get backpatched rather than
new feature. So, back-patch to 9.1 where enough infrastructure for
this exists.

Patch by me, reviewed by Andres Freund.
src/backend/replication/walsender.c