Make pg_dump emit more accurate dependency information.
authorTom Lane <[email protected]>
Tue, 26 Jun 2012 01:20:24 +0000 (21:20 -0400)
committerTom Lane <[email protected]>
Tue, 26 Jun 2012 01:21:18 +0000 (21:21 -0400)
commit8a504a363925fc5c7af48cd723da3f7e4d7ba9e2
tree0fde32c3abc9dce10314d14b0c19b6f540b6d59d
parenta1ef01fe163b304760088e3e30eb22036910a495
Make pg_dump emit more accurate dependency information.

While pg_dump has included dependency information in archive-format output
ever since 7.3, it never made any large effort to ensure that that
information was actually useful.  In particular, in common situations where
dependency chains include objects that aren't separately emitted in the
dump, the dependencies shown for objects that were emitted would reference
the dump IDs of these un-dumped objects, leaving no clue about which other
objects the visible objects indirectly depend on.  So far, parallel
pg_restore has managed to avoid tripping over this misfeature, but only
by dint of some crude hacks like not trusting dependency information in
the pre-data section of the archive.

It seems prudent to do something about this before it rises up to bite us,
so instead of emitting the "raw" dependencies of each dumped object,
recursively search for its actual dependencies among the subset of objects
that are being dumped.

Back-patch to 9.2, since that code hasn't yet diverged materially from
HEAD.  At some point we might need to back-patch further, but right now
there are no known cases where this is actively necessary.  (The one known
case, bug #6699, is fixed in a different way by my previous patch.)  Since
this patch depends on 9.2 changes that made TOC entries be marked before
output commences as to whether they'll be dumped, back-patching further
would require additional surgery; and as of now there's no evidence that
it's worth the risk.
src/bin/pg_dump/pg_backup_archiver.c
src/bin/pg_dump/pg_dump.c