postgresql.git
11 years agoImprove regression tests for uuid-ossp.
Tom Lane [Wed, 28 May 2014 18:21:17 +0000 (14:21 -0400)]
Improve regression tests for uuid-ossp.

On reflection, the timestamp-advances test might fail if we're unlucky
enough for the time_mid field to change between two calls, since uuid_cmp
is just bytewise comparison and the field ordering has more significant
fields later.  Build some field extraction functions so we can do a more
honest test of that.  Also check that the version and reserved fields
contain what they should.

11 years agoFix stack clobber in new uuid-ossp code.
Tom Lane [Wed, 28 May 2014 15:50:41 +0000 (11:50 -0400)]
Fix stack clobber in new uuid-ossp code.

The V5 (SHA1 hashing) code wrote 20 bytes into a 16-byte local variable.
This had accidentally failed to fail in my testing and Matteo's, but
buildfarm results exposed the problem.

11 years agoEnsure cleanup in case of early errors in streaming base backups
Magnus Hagander [Wed, 28 May 2014 10:40:45 +0000 (12:40 +0200)]
Ensure cleanup in case of early errors in streaming base backups

Move the code that sends the initial status information as well as the
calculation of paths inside the ENSURE_ERROR_CLEANUP block. If this code
failed, we would "leak" a counter of number of concurrent backups, thereby
making the system always believe it was in backup mode. This could happen
if the sending failed (which it probably never did given that the small
amount of data to send would never cause a flush) or if the psprintf calls
ran out of memory. Both are very low risk, but all operations after
do_pg_start_backup should be protected.

11 years agodoc: improve markup of ssl_ecdh_curve commit
Bruce Momjian [Wed, 28 May 2014 10:27:01 +0000 (06:27 -0400)]
doc:  improve markup of ssl_ecdh_curve commit

11 years agopg_lsn should not be marked typispreferred.
Tom Lane [Wed, 28 May 2014 04:26:46 +0000 (00:26 -0400)]
pg_lsn should not be marked typispreferred.

In general it's not a good idea for built-in types in the 'U' category
to be marked preferred; they could draw behavior away from user-defined
types with similarly-named operators.  pg_lsn is probably at low risk
of that right now given the lack of casts between it and other types,
but that doesn't make this marking OK.

Ordinarily we'd bump catversion when changing any predefined catalog
contents like this, but since we're past beta1, the costs of a forced
initdb seem to outweigh the benefits of guaranteed behavioral consistency.
There's not any known behavioral impact today anyway --- this is more
in the nature of being sure there's not problems in future.

Per an off-list complaint from Thomas Fanghaenel.

11 years agoFix obsolete config-module-exclusion logic in vcregress.pl.
Tom Lane [Wed, 28 May 2014 02:31:21 +0000 (22:31 -0400)]
Fix obsolete config-module-exclusion logic in vcregress.pl.

The recent addition of regression tests to uuid-ossp exposed the fact
that the MSVC build system wasn't being consistent about whether it was
building/testing that contrib module, ie, it would try to test the module
even when it hadn't built it.  The same hazard was latent for sslinfo.

For the moment I just copied the more up-to-date logic from point A to
point B, but this is screaming for refactoring.

Per buildfarm results.

11 years agoPropagate system identifier generation improvement into pg_resetxlog.
Tom Lane [Wed, 28 May 2014 02:01:13 +0000 (22:01 -0400)]
Propagate system identifier generation improvement into pg_resetxlog.

Commit 5035701e07e8bd395aa878465a102afd7b74e8c3 improved xlog.c's method
for creating a database system identifier, but I neglected to fix the
copy of that code appearing in pg_resetxlog.c.  Spotted by Andres Freund.

11 years agodoc: improve ssl_ecdh_curve descriptions
Bruce Momjian [Wed, 28 May 2014 01:30:20 +0000 (21:30 -0400)]
doc:  improve ssl_ecdh_curve descriptions

Patch by Marko Kreen

11 years agoSupport BSD and e2fsprogs UUID libraries alongside OSSP UUID library.
Tom Lane [Tue, 27 May 2014 23:42:08 +0000 (19:42 -0400)]
Support BSD and e2fsprogs UUID libraries alongside OSSP UUID library.

Allow the contrib/uuid-ossp extension to be built atop any one of these
three popular UUID libraries.  (The extension's name is now arguably a
misnomer, but we'll keep it the same so as not to cause unnecessary
compatibility issues for users.)

We would not normally consider a change like this post-beta1, but the issue
has been forced by our upgrade to autoconf 2.69, whose more rigorous header
checks are causing OSSP's header files to be rejected on some platforms.
It's been foreseen for some time that we'd have to move away from depending
on OSSP UUID due to lack of upstream maintenance, so this is a down payment
on that problem.

While at it, add some simple regression tests, in hopes of catching any
major incompatibilities between the three implementations.

Matteo Beccati, with some further hacking by me

11 years agoworker_spi: Initialize bgw_notify_pid in all cases.
Robert Haas [Tue, 27 May 2014 02:56:28 +0000 (22:56 -0400)]
worker_spi: Initialize bgw_notify_pid in all cases.

Commit 090d0f2050647958865cb495dff74af7257d2bb4 added new code showing
how it can be useful to set bgw_notify_pid to a non-zero value, but it
failed to make sure that the existing call to RegisterBackgroundWorker
initialized the new field at all.

Report and patch by Shigeru Hanada.

11 years agoAvoid unportable usage of sscanf(UINT64_FORMAT).
Tom Lane [Tue, 27 May 2014 02:23:29 +0000 (22:23 -0400)]
Avoid unportable usage of sscanf(UINT64_FORMAT).

On Mingw, it seems that scanf() doesn't necessarily accept the same format
codes that printf() does, and in particular it may fail to recognize %llu
even though printf() does.  Since configure only probes printf() behavior
while setting up the INT64_FORMAT macros, this means it's unsafe to use
those macros with scanf().  We had only one instance of such a coding
pattern, in contrib/pg_stat_statements, so change that code to avoid
the problem.

Per buildfarm warnings.  Back-patch to 9.0 where the troublesome code
was introduced.

Michael Paquier

11 years agoFix pg_recvlogical to accept the documented -I instead only --startpos.
Andres Freund [Sun, 25 May 2014 16:47:05 +0000 (18:47 +0200)]
Fix pg_recvlogical to accept the documented -I instead only --startpos.

The bug was caused by omitting 'I:' from the short argument list to
getopt_long(). To make similar bugs in the future less likely reorder
options in --help, long and short option lists to be in the same,
alphabetical within groups, order.

Report and fix by Michael Paquier, some additional reordering by me.

11 years agoSmall typo and formatting fixes in postgresql.conf.sample
Peter Eisentraut [Mon, 26 May 2014 03:20:15 +0000 (23:20 -0400)]
Small typo and formatting fixes in postgresql.conf.sample

11 years agoFix error when trying to delete page with half-dead left sibling.
Heikki Linnakangas [Sun, 25 May 2014 22:15:04 +0000 (18:15 -0400)]
Fix error when trying to delete page with half-dead left sibling.

The new page deletion code didn't cope with the case the target page's
right sibling was marked half-dead. It failed a sanity check which checked
that the downlinks in the parent page match the lower level, because a
half-dead page has no downlink. To cope, check for that condition, and
just give up on the deletion if it happens. The vacuum will finish the
deletion of the half-dead page when it gets there, and on the next vacuum
after that the empty can be deleted.

Reported by Jeff Janes.

11 years agoAllow total number of transactions in pgbench to exceed INT_MAX.
Tom Lane [Sun, 25 May 2014 20:33:29 +0000 (16:33 -0400)]
Allow total number of transactions in pgbench to exceed INT_MAX.

Change the total-transactions counters from int32 to int64 to accommodate
cases where we do more than 2^31 transactions during a run.  This patch
does not change the INT_MAX limit on explicit "-t" parameters, but it
does allow the product of the -t and -c parameters to exceed INT_MAX, or
allow a -T limit that is large enough that more than 2^31 transactions
can be completed.  While pgbench did not actually fail in such cases,
it did print an incorrect total-transactions count, and some of the
derived numbers such as TPS would have been wrong as well.

Tomas Vondra

11 years agoDon't allocate memory inside an Assert() iff in a critical section.
Andres Freund [Sat, 24 May 2014 23:37:52 +0000 (01:37 +0200)]
Don't allocate memory inside an Assert() iff in a critical section.

HeapTupleHeaderGetCmax() asserts that it is only used if the tuple has
been updated by the current transaction. That check is correct and
sensible but requires allocating memory if xmax is a multixact. When
wal_level is set to logical cmax needs to be included in a wal record
, generated inside a critical section, which can trigger the assertion
added in 4a170ee9e.

Reported-By: Steve Singer
11 years agoSilence a couple of spurious valgrind warnings in inval.c.
Andres Freund [Wed, 7 May 2014 20:30:05 +0000 (22:30 +0200)]
Silence a couple of spurious valgrind warnings in inval.c.

Define padding bytes in SharedInvalidationMessage structs to be
defined. Otherwise the sinvaladt.c ringbuffer, which is accessed by
multiple processes, will cause spurious valgrind warnings about
undefined memory being used. That's because valgrind remembers the
undefined bytes from the last local process's store, not realizing
that another process has written since, filling the previously
uninitialized bytes.

11 years agodoc: link/caps fixes for 9.4 release notes
Bruce Momjian [Fri, 23 May 2014 19:05:31 +0000 (15:05 -0400)]
doc:  link/caps fixes for 9.4 release notes

Report by Tomonari Katsumata

11 years agoFix misc typos in comments.
Heikki Linnakangas [Fri, 23 May 2014 12:16:09 +0000 (08:16 -0400)]
Fix misc typos in comments.

11 years agoRemove unnecessary cleanup code.
Robert Haas [Thu, 22 May 2014 14:40:00 +0000 (10:40 -0400)]
Remove unnecessary cleanup code.

This is all inside a block guarded by op == DSM_OP_ATTACH, so it can
never be the case that op == DSM_OP_CREATE.

Reported by Coverity.

11 years agoFix typo in comment.
Fujii Masao [Thu, 22 May 2014 07:31:55 +0000 (16:31 +0900)]
Fix typo in comment.

Erik Rijkers

11 years agoFix typos in comments.
Fujii Masao [Thu, 22 May 2014 03:43:50 +0000 (12:43 +0900)]
Fix typos in comments.

11 years agoFix typos in comments.
Heikki Linnakangas [Thu, 22 May 2014 03:18:38 +0000 (23:18 -0400)]
Fix typos in comments.

11 years agodoc: add ALTER TABLE lock level item as major 9.4 item
Bruce Momjian [Wed, 21 May 2014 19:49:44 +0000 (15:49 -0400)]
doc:  add ALTER TABLE lock level item as major 9.4 item

Report by Simon Riggs

11 years agoFix spurious tab character
Peter Eisentraut [Wed, 21 May 2014 12:00:39 +0000 (08:00 -0400)]
Fix spurious tab character

11 years agodoc: 9.4 release notes update for pg_bench line limit item
Bruce Momjian [Tue, 20 May 2014 18:10:09 +0000 (14:10 -0400)]
doc:  9.4 release notes update for pg_bench line limit item

Report by David Johnston

11 years agoPrevent auto_explain from changing the output of a user's EXPLAIN.
Tom Lane [Tue, 20 May 2014 16:20:47 +0000 (12:20 -0400)]
Prevent auto_explain from changing the output of a user's EXPLAIN.

Commit af7914c6627bcf0b0ca614e9ce95d3f8056602bf, which introduced the
EXPLAIN (TIMING) option, for some reason coded explain.c to look at
planstate->instrument->need_timer rather than es->timing to decide
whether to print timing info.  However, the former flag might get set
as a result of contrib/auto_explain wanting timing information.  We
certainly don't want activation of auto_explain to change user-visible
statement behavior, so fix that.

Also fix an independent bug introduced in the same patch: in the code
path for a never-executed node with a machine-friendly output format,
if timing was selected, it would fail to print the Actual Rows and Actual
Loops items.

Per bug #10404 from Tomonari Katsumata.  Back-patch to 9.2 where the
faulty code was introduced.

11 years agoUpdate obsolete comment.
Tom Lane [Mon, 19 May 2014 20:38:49 +0000 (16:38 -0400)]
Update obsolete comment.

Peter Geoghegan

11 years agoFix typo in JSON function document.
Fujii Masao [Mon, 19 May 2014 11:41:41 +0000 (20:41 +0900)]
Fix typo in JSON function document.

11 years agoMessage style fixes to pg_recvlogical
Heikki Linnakangas [Mon, 19 May 2014 11:15:21 +0000 (14:15 +0300)]
Message style fixes to pg_recvlogical

Lowercase help statements. Use an existing message to reduce the number
of strings to be translated.

Euler Taveira

11 years agoFix backup-block numbering in redo of b-tree split.
Heikki Linnakangas [Mon, 19 May 2014 10:16:24 +0000 (13:16 +0300)]
Fix backup-block numbering in redo of b-tree split.

I got the backup block numbers off-by-one in the commit that changed the
way incomplete-splits are handled. I blame the comments, which said
"backup block 1" and "backup block 2", even though the backup blocks
are numbered starting from 0, in the macros and functions used in replay.
Fix the comments and the code.

Per Jeff Janes' bug report about corruption caused by torn page writes.
The incorrect code is new in git master, but backpatch the comment change
down to 9.0, where the numbering in the redo-side macros  was changed.

11 years agoFix incorrect column name in pg_stat_replication document.
Fujii Masao [Mon, 19 May 2014 08:03:30 +0000 (17:03 +0900)]
Fix incorrect column name in pg_stat_replication document.

Fabrízio de Royes Mello

11 years agodoc: adjust JSONB 9.4 release note item
Bruce Momjian [Mon, 19 May 2014 04:47:45 +0000 (00:47 -0400)]
doc:  adjust JSONB 9.4 release note item

Report by Andrew Dunstan

11 years agodoc: 9.4 release note adjustements
Bruce Momjian [Mon, 19 May 2014 04:35:02 +0000 (00:35 -0400)]
doc:  9.4 release note adjustements

Text from David G Johnston

11 years agoFix non-C89-compatible coding in pgbench.
Tom Lane [Mon, 19 May 2014 04:06:26 +0000 (00:06 -0400)]
Fix non-C89-compatible coding in pgbench.

C89 says that compound initializers may only contain constant expressions;
a restriction violated by commit 89d00cbe.  While we've had no actual field
complaints about this, C89 is still the project standard, and it's not
saving all that much code to break compatibility here.  So let's adhere to
the old restriction.

In passing, replace a bunch of hardwired constants "256" with
sizeof(target-variable), just because the latter is more readable and
less breakable.  And const-ify where possible.

Back-patch to 9.3 where the nonportable code was added.

Andres Freund and Tom Lane

11 years agodoc: improve 9.4 release notes
Bruce Momjian [Mon, 19 May 2014 03:59:23 +0000 (23:59 -0400)]
doc:  improve 9.4 release notes

Patch by Andres Freund

11 years agoOoops, I broke initdb with that last patch.
Tom Lane [Sun, 18 May 2014 22:17:55 +0000 (18:17 -0400)]
Ooops, I broke initdb with that last patch.

That's what I get for not fully retesting the final version of the patch.
The replace_allowed cross-check needs an additional special case for
bootstrapping.

11 years agoFix two ancient memory-leak bugs in relcache.c.
Tom Lane [Sun, 18 May 2014 20:51:46 +0000 (16:51 -0400)]
Fix two ancient memory-leak bugs in relcache.c.

RelationCacheInsert() ignored the possibility that hash_search(HASH_ENTER)
might find a hashtable entry already present for the same OID.  However,
that can in fact occur during recursive relcache load scenarios.  When it
did happen, we overwrote the pointer to the pre-existing Relation, causing
a session-lifespan leakage of that entire structure.  As far as is known,
the pre-existing Relation would always have reference count zero by the
time we arrive back at the outer insertion, so add code that deletes the
pre-existing Relation if so.  If by some chance its refcount is positive,
elog a WARNING and allow the pre-existing Relation to be leaked as before.

Also, AttrDefaultFetch() was sloppy about leaking the cstring form of the
pg_attrdef.adbin value it's copying into the relcache structure.  This is
only a query-lifespan leakage, and normally not very significant, but it
adds up during CLOBBER_CACHE testing.

These bugs are of very ancient vintage, but I'll refrain from back-patching
since there's no evidence that these leaks amount to anything in ordinary
usage.

11 years agoMake fallback implementation of pg_memory_barrier() work.
Tom Lane [Sat, 17 May 2014 22:29:46 +0000 (18:29 -0400)]
Make fallback implementation of pg_memory_barrier() work.

The fallback implementation involves acquiring and releasing a spinlock
variable that is otherwise unreferenced --- not even to the extent of
initializing it.  This accidentally fails to fail on platforms where
spinlocks should be initialized to zeroes, but elsewhere it results in
a "stuck spinlock" failure during startup.

I griped about this last July, and put in a hack that worked for gcc
on HPPA, but didn't get around to fixing the general case.  Per the
discussion back then, the best thing to do seems to be to initialize
dummy_spinlock in main.c.

11 years agoFix a bunch of functions that were declared static then defined not-static.
Tom Lane [Sat, 17 May 2014 21:57:53 +0000 (17:57 -0400)]
Fix a bunch of functions that were declared static then defined not-static.

Per testing with a compiler that whines about this.

11 years agoFix unaligned accesses in DecodeUpdate().
Tom Lane [Sat, 17 May 2014 19:53:21 +0000 (15:53 -0400)]
Fix unaligned accesses in DecodeUpdate().

The xl_heap_header_len structures in an XLOG_HEAP_UPDATE record aren't
necessarily aligned adequately.  The regular replay function for these
records is aware of that, but decode.c didn't get the memo.  I'm not
sure why the buildfarm failed to catch this; the test_decoding test
certainly blows up real good on my old HPPA box.

Also, I'm pretty sure that the address arithmetic was wrong for the
case of XLOG_HEAP_CONTAINS_OLD and not XLOG_HEAP_CONTAINS_NEW_TUPLE,
though this apparently can't happen when logical decoding is active.

11 years agoUpdate README, we don't do post-recovery cleanup actions anymore.
Heikki Linnakangas [Sat, 17 May 2014 10:48:52 +0000 (13:48 +0300)]
Update README, we don't do post-recovery cleanup actions anymore.

transam/README explained how B-tree incomplete splits were tracked and
fixed after recovery, as an example of handling complex actions that need
multiple WAL records, but that's not how it works anymore. Explain the new
paradigm.

11 years agoMake sure chr(int) can't create invalid UTF8 sequences.
Tom Lane [Fri, 16 May 2014 20:51:28 +0000 (16:51 -0400)]
Make sure chr(int) can't create invalid UTF8 sequences.

Several years ago we changed chr(int) so that if the database encoding is
UTF8, it would interpret its argument as a Unicode code point and expand it
into the appropriate multibyte sequence.  However, we weren't sufficiently
careful about checking validity of the input.  According to RFC3629, UTF8
disallows code points above U+10FFFF (note that the predecessor standard
RFC2279 was more liberal).  Also, both versions of the UTF8 spec agree
that Unicode surrogate-pair codes should never appear in UTF8.  Because
our encoding validity checks follow RFC3629, our failure to enforce these
restrictions in chr() means it could be used to produce text strings that
will be rejected when the database is dumped and reloaded.  To ensure
consistency with the input functions, let's actually apply
pg_utf8_islegal() to the proposed output of chr().

Per discussion, this seems like too much of a behavioral change to
back-patch, but it's not too late to squeeze it into 9.4.

11 years agoSuppress some more valgrind whining about btree_gist.
Tom Lane [Fri, 16 May 2014 19:29:02 +0000 (15:29 -0400)]
Suppress some more valgrind whining about btree_gist.

A couple of functions didn't bother to zero out pad bytes in datums that
would ultimately go to disk.  Harmless, but valgrind doesn't know that.

11 years agoFix a second cause of undersized pallocs for btree_gist indexes on macaddr.
Tom Lane [Fri, 16 May 2014 19:18:09 +0000 (15:18 -0400)]
Fix a second cause of undersized pallocs for btree_gist indexes on macaddr.

gbt_macad_union also allocated 12-byte structs where we really need 16.

Per report from Andres Freund.  No back-patch since there's no current
risk of a real problem.

11 years agoFix valgrind warning for btree_gist indexes on macaddr.
Tom Lane [Fri, 16 May 2014 19:11:51 +0000 (15:11 -0400)]
Fix valgrind warning for btree_gist indexes on macaddr.

The macaddr opclass stores two macaddr structs (each of size 6) in an
index column that's declared as being of type gbtreekey16, ie 16 bytes.
In the original coding this led to passing a palloc'd value of size 12
to the index insertion code, so that data would be fetched past the
end of the allocated value during index tuple construction.  This makes
valgrind unhappy.  In principle it could result in a SIGSEGV, though
with the current implementation of palloc there's no risk since
the 12-byte request size would be rounded up to 16 bytes anyway.

To fix, add a field to struct gbtree_ninfo showing the declared size of
the index datums, and use that in the palloc requests; and use palloc0
to be sure that any wasted bytes are cleanly initialized.

Per report from Andres Freund.  No back-patch since there's no current
risk of a real problem.

11 years agoAdd test case for logical decoding of prepared transactions.
Heikki Linnakangas [Fri, 16 May 2014 08:33:49 +0000 (11:33 +0300)]
Add test case for logical decoding of prepared transactions.

Andres Freund

11 years agoFix test_decoding test case's check that slot has been dropped.
Heikki Linnakangas [Fri, 16 May 2014 08:23:17 +0000 (11:23 +0300)]
Fix test_decoding test case's check that slot has been dropped.

pg_stat_replication shows connected replication clients. The ddl test case
never has any replication clients connected, so querying pg_stat_replication
is pointless. To check that a slot has been dropped correctly, query
pg_replication_slots instead.

Andres Freund

11 years agoFix thinko in logical decoding of commit-prepared records.
Heikki Linnakangas [Fri, 16 May 2014 07:53:10 +0000 (10:53 +0300)]
Fix thinko in logical decoding of commit-prepared records.

The decoding of prepared transaction commits accidentally used the XID of
the transaction performing the COMMIT PREPARED, not the XID of the prepared
transaction. Before bb38fb0d43c8d that lead to those transactions not being
decoded, afterwards to a assertion failure.

11 years agoOpen output file before sleeping in pg_recvlogical.
Heikki Linnakangas [Fri, 16 May 2014 07:10:45 +0000 (10:10 +0300)]
Open output file before sleeping in pg_recvlogical.

Let's complain about e.g an invalid path or permission problem sooner rather
than later. Before this patch, we would only try to open the output file
after receiving the first decoded message from the server.

11 years agoInitialize tsId and dbId fields in WAL record of COMMIT PREPARED.
Heikki Linnakangas [Fri, 16 May 2014 06:47:50 +0000 (09:47 +0300)]
Initialize tsId and dbId fields in WAL record of COMMIT PREPARED.

Commit dd428c79 added dbId and tsId to the xl_xact_commit struct but missed
that prepared transaction commits reuse that struct. Fix that.

Because those fields were left unitialized, replaying a commit prepared WAL
record in a hot standby node would fail to remove the relcache init file.
That can lead to "could not open file" errors on the standby. Relcache init
file only needs to be removed when a system table/index is rewritten in the
transaction using two phase commit, so that should be rare in practice. In
HEAD, the incorrect dbId/tsId values are also used for filtering in logical
replication code, causing the transaction to always be filtered out.

Analysis and fix by Andres Freund. Backpatch to 9.0 where hot standby was
introduced.

11 years agoFix unportable setvbuf() usage in initdb.
Tom Lane [Thu, 15 May 2014 19:57:54 +0000 (15:57 -0400)]
Fix unportable setvbuf() usage in initdb.

In yesterday's commit 2dc4f011fd61501cce507be78c39a2677690d44b, I tried
to force buffering of stdout/stderr in initdb to be what it is by
default when the program is run interactively on Unix (since that's how
most manual testing is done).  This tripped over the fact that Windows
doesn't support _IOLBF mode.  We dealt with that a long time ago in
syslogger.c by falling back to unbuffered mode on Windows.  Export that
solution in port.h and use it in initdb.

Back-patch to 8.4, like the previous commit.

11 years agoFix whitespace
Peter Eisentraut [Thu, 15 May 2014 17:23:31 +0000 (13:23 -0400)]
Fix whitespace

11 years agoFix a couple of bugs in pg_recvlogical output to stdout.
Heikki Linnakangas [Thu, 15 May 2014 16:43:37 +0000 (19:43 +0300)]
Fix a couple of bugs in pg_recvlogical output to stdout.

Don't close stdout on SIGHUP. Also, when a SIGHUP is received, close the
file immediately, rather than only after receiving some more data from
the server. Rename a variable, to avoid mentally dealing with double
negatives (not unsynced means synced).

11 years agoHandle duplicate XIDs in txid_snapshot.
Heikki Linnakangas [Thu, 15 May 2014 15:29:20 +0000 (18:29 +0300)]
Handle duplicate XIDs in txid_snapshot.

The proc array can contain duplicate XIDs, when a transaction is just being
prepared for two-phase commit. To cope, remove any duplicates in
txid_current_snapshot(). Also ignore duplicates in the input functions, so
that if e.g. you have an old pg_dump file that already contains duplicates,
it will be accepted.

Report and fix by Jan Wieck. Backpatch to all supported versions.

11 years agoFix race condition in preparing a transaction for two-phase commit.
Heikki Linnakangas [Thu, 15 May 2014 13:37:50 +0000 (16:37 +0300)]
Fix race condition in preparing a transaction for two-phase commit.

To lock a prepared transaction's shared memory entry, we used to mark it
with the XID of the backend. When the XID was no longer active according
to the proc array, the entry was implicitly considered as not locked
anymore. However, when preparing a transaction, the backend's proc array
entry was cleared before transfering the locks (and some other state) to
the prepared transaction's dummy PGPROC entry, so there was a window where
another backend could finish the transaction before it was in fact fully
prepared.

To fix, rewrite the locking mechanism of global transaction entries. Instead
of an XID, just have simple locked-or-not flag in each entry (we store the
locking backend's backend id rather than a simple boolean, but that's just
for debugging purposes). The backend is responsible for explicitly unlocking
the entry, and to make sure that that happens, install a callback to unlock
it on abort or process exit.

Backpatch to all supported versions.

11 years agoMisc message style and doc fixes.
Heikki Linnakangas [Thu, 15 May 2014 11:49:11 +0000 (14:49 +0300)]
Misc message style and doc fixes.

Euler Taveira

11 years agoSilence warnings about redefining popen on Mingw-w64.
Heikki Linnakangas [Thu, 15 May 2014 09:18:49 +0000 (12:18 +0300)]
Silence warnings about redefining popen on Mingw-w64.

Mingw-w64 headers map popen/pclose to _popen and _pclose, but we want to use
our popen wrapper rather than the Mingw-w64. #undef the Mingw's version.

11 years agodoc: Clarify what files pg_basebackup omits from data directory
Peter Eisentraut [Thu, 15 May 2014 02:26:49 +0000 (22:26 -0400)]
doc: Clarify what files pg_basebackup omits from data directory

11 years agopg_ctl: Write error messages to stderr
Peter Eisentraut [Thu, 15 May 2014 02:19:18 +0000 (22:19 -0400)]
pg_ctl: Write error messages to stderr

11 years agoIn initdb, ensure stdout/stderr buffering behavior is what we expect.
Tom Lane [Thu, 15 May 2014 01:13:54 +0000 (21:13 -0400)]
In initdb, ensure stdout/stderr buffering behavior is what we expect.

Since this program may print to either stdout or stderr, the relative
ordering of its messages depends on the buffering behavior of those files.
Force stdout to be line-buffered and stderr to be unbuffered, ensuring
that the behavior will match standard Unix interactive behavior, even
when stdout and stderr are rerouted to a file.

Per complaint from Tomas Vondra.  The particular case he pointed out is
new in HEAD, but issues of the same sort could arise in any branch with
other error messages, so back-patch to all branches.

I'm unsure whether we might not want to do this in other client programs
as well.  For the moment, just fix initdb.

11 years agopg_update: slight major version adjustment
Bruce Momjian [Thu, 15 May 2014 01:13:59 +0000 (21:13 -0400)]
pg_update:  slight major version adjustment

11 years agoFix version check for pg_upgrade line type crosscheck.
Tom Lane [Thu, 15 May 2014 00:23:32 +0000 (20:23 -0400)]
Fix version check for pg_upgrade line type crosscheck.

Per buildfarm.

11 years agopg_upgrade: error out on 'line' data type usage
Bruce Momjian [Wed, 14 May 2014 20:26:06 +0000 (16:26 -0400)]
pg_upgrade:  error out on 'line' data type usage

The data type internal format changed in 9.4.  Also mention this in the
9.4 release notes.

11 years agoCode review for recent changes in relcache.c.
Tom Lane [Wed, 14 May 2014 18:55:48 +0000 (14:55 -0400)]
Code review for recent changes in relcache.c.

rd_replidindex should be managed the same as rd_oidindex, and rd_keyattr
and rd_idattr should be managed like rd_indexattr.  Omissions in this area
meant that the bitmapsets computed for rd_keyattr and rd_idattr would be
leaked during any relcache flush, resulting in a slow but permanent leak in
CacheMemoryContext.  There was also a tiny probability of relcache entry
corruption if we ran out of memory at just the wrong point in
RelationGetIndexAttrBitmap.  Otherwise, the fields were not zeroed where
expected, which would not bother the code any AFAICS but could greatly
confuse anyone examining the relcache entry while debugging.

Also, create an API function RelationGetReplicaIndex rather than letting
non-relcache code be intimate with the mechanisms underlying caching of
that value (we won't even mention the memory leak there).

Also, fix a relcache flush hazard identified by Andres Freund:
RelationGetIndexAttrBitmap must not assume that rd_replidindex stays valid
across index_open.

The aspects of this involving rd_keyattr date back to 9.3, so back-patch
those changes.

11 years agodoc: fix 9.4 release notes typo
Bruce Momjian [Wed, 14 May 2014 18:13:19 +0000 (14:13 -0400)]
doc:  fix 9.4 release notes typo

Report by Dean Rasheed

11 years agodoc: fix typo in 9.4 release note comments
Bruce Momjian [Wed, 14 May 2014 16:21:03 +0000 (12:21 -0400)]
doc: fix typo in 9.4 release note comments

Patch by Sergey Muraviov

11 years agoMake initdb throw error for bad locale values.
Tom Lane [Wed, 14 May 2014 15:51:10 +0000 (11:51 -0400)]
Make initdb throw error for bad locale values.

Historically we've printed a complaint for a bad locale setting, but then
fallen back to the environment default.  Per discussion, this is not such
a great idea, because rectifying an erroneous locale choice post-initdb
(perhaps long after data has been loaded) could be enormously expensive.
Better to complain and give the user a chance to double-check things.

The behavior was particularly bad if the bad setting came from environment
variables rather than a bogus command-line switch: in that case not only
was there a fallback to C/SQL_ASCII, but the printed complaint was quite
unhelpful.  It's hard to be entirely sure what variables setlocale looked
at, but we can at least give a hint where the problem might be.

Per a complaint from Tomas Vondra.

11 years agodocs: mention windows quoting change in 9.4 release notes
Bruce Momjian [Wed, 14 May 2014 15:02:03 +0000 (11:02 -0400)]
docs:  mention windows quoting change in 9.4 release notes

Report by Heikki Linnakangas

11 years agodoc: auto-updatable view adjustments for 9.4 release notes
Bruce Momjian [Wed, 14 May 2014 14:07:24 +0000 (10:07 -0400)]
doc:  auto-updatable view adjustments for 9.4 release notes

Report by Dean Rasheed

11 years agodocs: 9.4 release notes adjustments
Bruce Momjian [Tue, 13 May 2014 19:12:54 +0000 (15:12 -0400)]
docs:  9.4 release notes adjustments

Patch by Andres Freund, slight adjustments by me

11 years agoFix harmless access to uninitialized memory.
Heikki Linnakangas [Tue, 13 May 2014 16:17:28 +0000 (19:17 +0300)]
Fix harmless access to uninitialized memory.

When cache invalidations arrive while ri_LoadConstraintInfo() is busy
filling a new cache entry, InvalidateConstraintCacheCallBack() compares
the - not yet initialized - oidHashValue field with the to-be-invalidated
hash value. To fix, check whether the entry is already marked as invalid.

Andres Freund

11 years agoInitialize padding bytes in btree_gist varbit support.
Heikki Linnakangas [Tue, 13 May 2014 11:16:28 +0000 (14:16 +0300)]
Initialize padding bytes in btree_gist varbit support.

The code expands a varbit gist leaf key to a node key by copying the bit
data twice in a varlen datum, as both the lower and upper key. The lower key
was expanded to INTALIGN size, but the padding bytes were not initialized.
That's a problem because when the lower/upper keys are compared, the padding
bytes are used compared too, when the values are otherwise equal. That could
lead to incorrect query results.

REINDEX is advised for any btree_gist indexes on bit or bit varying data
type, to fix any garbage padding bytes on disk.

Per Valgrind, reported by Andres Freund. Backpatch to all supported
versions.

11 years agoAdd Valgrind suppression for reorderbuffer padding bytes.
Noah Misch [Tue, 13 May 2014 03:03:49 +0000 (23:03 -0400)]
Add Valgrind suppression for reorderbuffer padding bytes.

Andres Freund

11 years agodocs: use structfield instead of structname in 9.4 release notes
Bruce Momjian [Tue, 13 May 2014 01:37:49 +0000 (21:37 -0400)]
docs:  use structfield instead of structname in 9.4 release notes

Where appropriate

11 years agodoc: 9.4 release note adjustments
Bruce Momjian [Tue, 13 May 2014 01:30:58 +0000 (21:30 -0400)]
doc: 9.4 release note adjustments

Report by Nicolas Barbier, Tatsuo Ishii, MauMau

11 years agoBe more wary in choice of timezone names to test make_timestamptz with.
Tom Lane [Tue, 13 May 2014 00:21:16 +0000 (20:21 -0400)]
Be more wary in choice of timezone names to test make_timestamptz with.

America/Metlakatla hasn't been in the IANA database all that long, so
some installations might not have it.  It does seem worthwhile to test
with a fractional-minute GMT offset, but we can get that from almost
any pre-1900 date; I chose Europe/Paris, whose LMT offset from Greenwich
should be pretty darn well established.

Also, assuming that Mars/Mons_Olympus will never be in the IANA database
seems less than future-proof, so let's use a more fanciful location for
the bad-zone-name check.

Per complaint from Christoph Berg.

11 years agoIgnore config.pl and buildenv.pl in src/tools/msvc.
Tom Lane [Mon, 12 May 2014 18:24:18 +0000 (14:24 -0400)]
Ignore config.pl and buildenv.pl in src/tools/msvc.

config.pl and buildenv.pl can be used to customize build settings when
using MSVC.  They should never get committed into the common source tree.

Back-patch to 9.0; it looks like the rules were different in 8.4.

Michael Paquier

11 years agoFix typo in test_shm_mq document.
Fujii Masao [Mon, 12 May 2014 16:41:54 +0000 (01:41 +0900)]
Fix typo in test_shm_mq document.

Amit Langote

11 years agoFree PQresult on error in pg_receivexlog.
Heikki Linnakangas [Mon, 12 May 2014 07:17:40 +0000 (10:17 +0300)]
Free PQresult on error in pg_receivexlog.

The leak is fairly small and rare, but a leak nevertheless.

Per Coverity report. Backpatch to 9.2, where pg_receivexlog was added.
pg_basebackup shares the code, but it always exits on error, so there is
no real leak.

11 years agoStamp 9.4beta1. REL9_4_BETA1
Tom Lane [Sun, 11 May 2014 21:16:48 +0000 (17:16 -0400)]
Stamp 9.4beta1.

11 years agoFind postgresql.auto.conf in PGDATA even when postgresql.conf is elsewhere.
Tom Lane [Sun, 11 May 2014 19:13:30 +0000 (15:13 -0400)]
Find postgresql.auto.conf in PGDATA even when postgresql.conf is elsewhere.

The original coding for ALTER SYSTEM made a fundamentally bogus assumption
that postgresql.auto.conf could be sought relative to the main config file
if we hadn't yet determined the value of data_directory.  This fails for
common arrangements with the config file elsewhere, as reported by
Christoph Berg.

The simplest fix is to not try to read postgresql.auto.conf until after
SelectConfigFiles has chosen (and locked down) the data_directory setting.

Because of the logic in ProcessConfigFile for handling resetting of GUCs
that've been removed from the config file, we cannot easily read the main
and auto config files separately; so this patch adopts a brute force
approach of reading the main config file twice during postmaster startup.
That's a tad ugly, but the actual time cost is likely to be negligible,
and there's no time for a more invasive redesign before beta.

With this patch, any attempt to set data_directory via ALTER SYSTEM
will be silently ignored.  It would probably be better to throw an
error, but that can be dealt with later.  This bug, however, would
prevent any testing of ALTER SYSTEM by a significant fraction of the
userbase, so it seems important to get it fixed before beta.

11 years agoRename jsonb_hash_ops to jsonb_path_ops.
Tom Lane [Sun, 11 May 2014 16:06:04 +0000 (12:06 -0400)]
Rename jsonb_hash_ops to jsonb_path_ops.

There's no longer much pressure to switch the default GIN opclass for
jsonb, but there was still some unhappiness with the name "jsonb_hash_ops",
since hashing is no longer a distinguishing property of that opclass,
and anyway it seems like a relatively minor detail.  At the suggestion of
Heikki Linnakangas, we'll use "jsonb_path_ops" instead; that captures the
important characteristic that each index entry depends on the entire path
from the document root to the indexed value.

Also add a user-facing explanation of the implementation properties of
these two opclasses.

11 years agoTranslation updates
Peter Eisentraut [Sun, 11 May 2014 01:53:11 +0000 (21:53 -0400)]
Translation updates

11 years agodocs: Mark 9.4 release notes as current as of today
Bruce Momjian [Sun, 11 May 2014 02:03:24 +0000 (22:03 -0400)]
docs:  Mark 9.4 release notes as current as of today

11 years agoRename min_recovery_apply_delay to recovery_min_apply_delay.
Tom Lane [Sat, 10 May 2014 23:46:19 +0000 (19:46 -0400)]
Rename min_recovery_apply_delay to recovery_min_apply_delay.

Per discussion, this seems like a more consistent choice of name.

Fabrízio de Royes Mello, after a suggestion by Peter Eisentraut;
some additional documentation wordsmithing by me

11 years agoMore work on the JSON/JSONB user documentation.
Tom Lane [Sat, 10 May 2014 22:56:52 +0000 (18:56 -0400)]
More work on the JSON/JSONB user documentation.

Document existence operator adequately; fix obsolete claim that no
Unicode-escape semantic checks happen on input (it's still true for
json, but not for jsonb); improve examples; assorted wordsmithing.

11 years agoFix bug in lossy-page handling in GIN
Heikki Linnakangas [Sat, 10 May 2014 20:24:23 +0000 (23:24 +0300)]
Fix bug in lossy-page handling in GIN

When returning rows from a bitmap, as done with partial match queries, we
would get stuck in an infinite loop if the bitmap contained a lossy page
reference.

This bug is new in master, it was introduced by the patch to allow skipping
items refuted by other entries in GIN scans.

Report and fix by Alexander Korotkov

11 years agoAccept tcl 8.6 in configure's probe for tclsh.
Tom Lane [Sat, 10 May 2014 14:48:01 +0000 (10:48 -0400)]
Accept tcl 8.6 in configure's probe for tclsh.

Usually the search would find plain "tclsh" without any trouble,
but some installations might only have the version-numbered flavor
of that program.

No compatibility problems have been reported with 8.6, so we might
as well back-patch this to all active branches.

Christoph Berg

11 years agoUpdate config.guess and config.sub
Tom Lane [Sat, 10 May 2014 14:33:34 +0000 (10:33 -0400)]
Update config.guess and config.sub

11 years agoFix bogus documentation of json_object_agg().
Tom Lane [Sat, 10 May 2014 00:25:42 +0000 (20:25 -0400)]
Fix bogus documentation of json_object_agg().

It takes two arguments, not one.

11 years agoFix broken allocation logic in recently-rewritten jsonb_util.c.
Tom Lane [Fri, 9 May 2014 22:24:17 +0000 (18:24 -0400)]
Fix broken allocation logic in recently-rewritten jsonb_util.c.

reserveFromBuffer() failed to consider the possibility that it needs to
more-than-double the current buffer size.  Beyond that, it seems likely
that we'd someday need to worry about integer overflow of the buffer
length variable.  Rather than reinvent the logic that's already been
debugged in stringinfo.c, let's go back to using that logic.  We can
still have the same targeted API, but we'll rely on stringinfo.c to
manage reallocation.

Per report from Alexander Korotkov.

11 years agoImprove user-facing JSON documentation.
Tom Lane [Fri, 9 May 2014 20:33:25 +0000 (16:33 -0400)]
Improve user-facing JSON documentation.

I started out with the intention of just fixing the info about the jsonb
operator classes, but soon found myself copy-editing most of the JSON
material.  Hopefully it's more readable now.

11 years agoGet rid of bogus dependency on typcategory in to_json() and friends.
Tom Lane [Fri, 9 May 2014 16:55:00 +0000 (12:55 -0400)]
Get rid of bogus dependency on typcategory in to_json() and friends.

These functions were relying on typcategory to identify arrays and
composites, which is not reliable and not the normal way to do it.
Using typcategory to identify boolean, numeric types, and json itself is
also pretty questionable, though the code in those cases didn't seem to be
at risk of anything worse than wrong output.  Instead, use the standard
lsyscache functions to identify arrays and composites, and rely on a direct
check of the type OID for the other cases.

In HEAD, also be sure to look through domains so that a domain is treated
the same as its base type for conversions to JSON.  However, this is a
small behavioral change; given the lack of field complaints, we won't
back-patch it.

In passing, refactor so that there's only one copy of the code that decides
which conversion strategy to apply, not multiple copies that could (and
have) gotten out of sync.

11 years agoCode review for logical decoding patch.
Robert Haas [Fri, 9 May 2014 14:44:04 +0000 (10:44 -0400)]
Code review for logical decoding patch.

Post-commit review identified a number of places where addition was
used instead of multiplication or memory wasn't zeroed where it should
have been.  This commit also fixes one case where a structure member
was mis-initialized, and moves another memory allocation closer to
the place where the allocated storage is used for clarity.

Andres Freund

11 years agoRemove overeager assertion in logical_heap_begin_rewrite.
Robert Haas [Fri, 9 May 2014 14:33:40 +0000 (10:33 -0400)]
Remove overeager assertion in logical_heap_begin_rewrite.

It's legal to configure wal_level=logical and max_replication_slots=0
simultaneously.

Andres Freund

11 years agoTeach add_json() that jsonb is of TYPCATEGORY_JSON.
Tom Lane [Fri, 9 May 2014 13:44:11 +0000 (09:44 -0400)]
Teach add_json() that jsonb is of TYPCATEGORY_JSON.

This code really needs to be refactored so that there aren't so many copies
that can diverge.  Not to mention that this whole approach is probably
wrong.  But for the moment I'll just stick my finger in the dike.
Per report from Michael Paquier.

11 years agoFix typcategory labeling of jsonb.
Tom Lane [Fri, 9 May 2014 13:25:58 +0000 (09:25 -0400)]
Fix typcategory labeling of jsonb.

Dunno who had the cute idea of labeling jsonb as typcategory 'C',
but it is not a composite type.  Label it 'U', since that's what
json is using.

11 years agoMore jsonb cleanup.
Heikki Linnakangas [Fri, 9 May 2014 12:55:56 +0000 (15:55 +0300)]
More jsonb cleanup.

Fix JSONB_MAX_ELEMS and JSONB_MAX_PAIRS macros to use CB_MASK in the
calculation. JENTRY_POSMASK happens to have the same value at the moment,
but that's just coincidental.

Refactor jsonb iterator functions, for readability.

Get rid of the JENTRY_ISFIRST flag. Whenever we handle JEntrys, we have
access to the whole array and have enough context information to know
which entry is the first. This frees up one bit in the JEntry header for
future use. While we're at it, shuffle the JEntry bits so that boolean
true and false go together, for aesthetic reasons.

Bump catalog version as this changes the on-disk format slightly.

11 years agoImprove key representation for GIN jsonb_ops, and fix existence-search bug.
Tom Lane [Fri, 9 May 2014 12:41:26 +0000 (08:41 -0400)]
Improve key representation for GIN jsonb_ops, and fix existence-search bug.

Change the key representation so that values that would exceed 127 bytes
are hashed into short strings, and so that the original JSON datatype of
each value is recorded in the index.  The hashing rule eliminates the major
objection to having this opclass be the default for jsonb, namely that it
could fail for plausible input data (due to GIN's restrictions on maximum
key length).  Preserving datatype information doesn't really buy us much
right now, but it requires no extra space compared to the previous way,
and it might be useful later.

Also, change the consistency-checking functions to request recheck for
exists (jsonb ? text) and related operators.  The original analysis that
this is an exactly checkable query was incorrect, since the index does
not preserve information about whether a key appears at top level in
the indexed JSON object.  Add a test case demonstrating the problem.

Make some other, mostly cosmetic improvements to the code in jsonb_gin.c
as well.

catversion bump due to on-disk data format change in jsonb_ops indexes.