Allow configurable LZ4 TOAST compression.
authorRobert Haas <[email protected]>
Fri, 19 Mar 2021 19:10:38 +0000 (15:10 -0400)
committerRobert Haas <[email protected]>
Fri, 19 Mar 2021 19:10:38 +0000 (15:10 -0400)
There is now a per-column COMPRESSION option which can be set to pglz
(the default, and the only option in up until now) or lz4. Or, if you
like, you can set the new default_toast_compression GUC to lz4, and
then that will be the default for new table columns for which no value
is specified. We don't have lz4 support in the PostgreSQL code, so
to use lz4 compression, PostgreSQL must be built --with-lz4.

In general, TOAST compression means compression of individual column
values, not the whole tuple, and those values can either be compressed
inline within the tuple or compressed and then stored externally in
the TOAST table, so those properties also apply to this feature.

Prior to this commit, a TOAST pointer has two unused bits as part of
the va_extsize field, and a compessed datum has two unused bits as
part of the va_rawsize field. These bits are unused because the length
of a varlena is limited to 1GB; we now use them to indicate the
compression type that was used. This means we only have bit space for
2 more built-in compresison types, but we could work around that
problem, if necessary, by introducing a new vartag_external value for
any further types we end up wanting to add. Hopefully, it won't be
too important to offer a wide selection of algorithms here, since
each one we add not only takes more coding but also adds a build
dependency for every packager. Nevertheless, it seems worth doing
at least this much, because LZ4 gets better compression than PGLZ
with less CPU usage.

It's possible for LZ4-compressed datums to leak into composite type
values stored on disk, just as it is for PGLZ. It's also possible for
LZ4-compressed attributes to be copied into a different table via SQL
commands such as CREATE TABLE AS or INSERT .. SELECT.  It would be
expensive to force such values to be decompressed, so PostgreSQL has
never done so. For the same reasons, we also don't force recompression
of already-compressed values even if the target table prefers a
different compression method than was used for the source data.  These
architectural decisions are perhaps arguable but revisiting them is
well beyond the scope of what seemed possible to do as part of this
project.  However, it's relatively cheap to recompress as part of
VACUUM FULL or CLUSTER, so this commit adjusts those commands to do
so, if the configured compression method of the table happens not to
match what was used for some column value stored therein.

Dilip Kumar. The original patches on which this work was based were
written by Ildus Kurbangaliev, and those were patches were based on
even earlier work by Nikita Glukhov, but the design has since changed
very substantially, since allow a potentially large number of
compression methods that could be added and dropped on a running
system proved too problematic given some of the architectural issues
mentioned above; the choice of which specific compression method to
add first is now different; and a lot of the code has been heavily
refactored.  More recently, Justin Przyby helped quite a bit with
testing and reviewing and this version also includes some code
contributions from him. Other design input and review from Tomas
Vondra, Álvaro Herrera, Andres Freund, Oleg Bartunov, Alexander
Korotkov, and me.

Discussion: http://postgr.es/m/20170907194236.4cefce96%40wp.localdomain
Discussion: http://postgr.es/m/CAFiTN-uUpX3ck%3DK0mLEk-G_kUQY%3DSNOTeqdaNRR9FMdQrHKebw%40mail.gmail.com

61 files changed:
configure
configure.ac
contrib/amcheck/verify_heapam.c
doc/src/sgml/catalogs.sgml
doc/src/sgml/func.sgml
doc/src/sgml/ref/alter_table.sgml
doc/src/sgml/ref/create_table.sgml
doc/src/sgml/ref/psql-ref.sgml
src/backend/access/brin/brin_tuple.c
src/backend/access/common/Makefile
src/backend/access/common/detoast.c
src/backend/access/common/indextuple.c
src/backend/access/common/toast_compression.c [new file with mode: 0644]
src/backend/access/common/toast_internals.c
src/backend/access/common/tupdesc.c
src/backend/access/heap/heapam_handler.c
src/backend/access/table/toast_helper.c
src/backend/bootstrap/bootstrap.c
src/backend/catalog/genbki.pl
src/backend/catalog/heap.c
src/backend/catalog/index.c
src/backend/catalog/toasting.c
src/backend/commands/tablecmds.c
src/backend/nodes/copyfuncs.c
src/backend/nodes/equalfuncs.c
src/backend/nodes/nodeFuncs.c
src/backend/nodes/outfuncs.c
src/backend/parser/gram.y
src/backend/parser/parse_utilcmd.c
src/backend/replication/logical/reorderbuffer.c
src/backend/utils/adt/varlena.c
src/backend/utils/misc/guc.c
src/backend/utils/misc/postgresql.conf.sample
src/bin/pg_amcheck/t/004_verify_heapam.pl
src/bin/pg_dump/pg_backup.h
src/bin/pg_dump/pg_dump.c
src/bin/pg_dump/pg_dump.h
src/bin/pg_dump/t/002_pg_dump.pl
src/bin/psql/describe.c
src/bin/psql/help.c
src/bin/psql/settings.h
src/bin/psql/startup.c
src/bin/psql/tab-complete.c
src/include/access/detoast.h
src/include/access/toast_compression.h [new file with mode: 0644]
src/include/access/toast_helper.h
src/include/access/toast_internals.h
src/include/catalog/catversion.h
src/include/catalog/pg_attribute.h
src/include/catalog/pg_proc.dat
src/include/nodes/parsenodes.h
src/include/parser/kwlist.h
src/include/pg_config.h.in
src/include/postgres.h
src/test/regress/expected/compression.out [new file with mode: 0644]
src/test/regress/expected/compression_1.out [new file with mode: 0644]
src/test/regress/parallel_schedule
src/test/regress/pg_regress_main.c
src/test/regress/serial_schedule
src/test/regress/sql/compression.sql [new file with mode: 0644]
src/tools/msvc/Solution.pm

index 3fd4cecbeb12e04d233276a3638bbbf4a14c06d1..8176e99756ffa62eee543cf464c7dd2d95577b64 100755 (executable)
--- a/configure
+++ b/configure
@@ -699,6 +699,9 @@ with_gnu_ld
 LD
 LDFLAGS_SL
 LDFLAGS_EX
+LZ4_LIBS
+LZ4_CFLAGS
+with_lz4
 with_zlib
 with_system_tzdata
 with_libxslt
@@ -864,6 +867,7 @@ with_libxml
 with_libxslt
 with_system_tzdata
 with_zlib
+with_lz4
 with_gnu_ld
 with_ssl
 with_openssl
@@ -891,6 +895,8 @@ ICU_LIBS
 XML2_CONFIG
 XML2_CFLAGS
 XML2_LIBS
+LZ4_CFLAGS
+LZ4_LIBS
 LDFLAGS_EX
 LDFLAGS_SL
 PERL
@@ -1569,6 +1575,7 @@ Optional Packages:
   --with-system-tzdata=DIR
                           use system time zone data in DIR
   --without-zlib          do not use Zlib
+  --with-lz4              build with LZ4 support
   --with-gnu-ld           assume the C compiler uses GNU ld [default=no]
   --with-ssl=LIB          use LIB for SSL/TLS support (openssl)
   --with-openssl          obsolete spelling of --with-ssl=openssl
@@ -1596,6 +1603,8 @@ Some influential environment variables:
   XML2_CONFIG path to xml2-config utility
   XML2_CFLAGS C compiler flags for XML2, overriding pkg-config
   XML2_LIBS   linker flags for XML2, overriding pkg-config
+  LZ4_CFLAGS  C compiler flags for LZ4, overriding pkg-config
+  LZ4_LIBS    linker flags for LZ4, overriding pkg-config
   LDFLAGS_EX  extra linker flags for linking executables only
   LDFLAGS_SL  extra linker flags for linking shared libraries only
   PERL        Perl program
@@ -8563,6 +8572,137 @@ fi
 
 
 
+#
+# LZ4
+#
+{ $as_echo "$as_me:${as_lineno-$LINENO}: checking whether to build with LZ4 support" >&5
+$as_echo_n "checking whether to build with LZ4 support... " >&6; }
+
+
+
+# Check whether --with-lz4 was given.
+if test "${with_lz4+set}" = set; then :
+  withval=$with_lz4;
+  case $withval in
+    yes)
+
+$as_echo "#define USE_LZ4 1" >>confdefs.h
+
+      ;;
+    no)
+      :
+      ;;
+    *)
+      as_fn_error $? "no argument expected for --with-lz4 option" "$LINENO" 5
+      ;;
+  esac
+
+else
+  with_lz4=no
+
+fi
+
+
+{ $as_echo "$as_me:${as_lineno-$LINENO}: result: $with_lz4" >&5
+$as_echo "$with_lz4" >&6; }
+
+
+if test "$with_lz4" = yes; then
+
+pkg_failed=no
+{ $as_echo "$as_me:${as_lineno-$LINENO}: checking for liblz4" >&5
+$as_echo_n "checking for liblz4... " >&6; }
+
+if test -n "$LZ4_CFLAGS"; then
+    pkg_cv_LZ4_CFLAGS="$LZ4_CFLAGS"
+ elif test -n "$PKG_CONFIG"; then
+    if test -n "$PKG_CONFIG" && \
+    { { $as_echo "$as_me:${as_lineno-$LINENO}: \$PKG_CONFIG --exists --print-errors \"liblz4\""; } >&5
+  ($PKG_CONFIG --exists --print-errors "liblz4") 2>&5
+  ac_status=$?
+  $as_echo "$as_me:${as_lineno-$LINENO}: \$? = $ac_status" >&5
+  test $ac_status = 0; }; then
+  pkg_cv_LZ4_CFLAGS=`$PKG_CONFIG --cflags "liblz4" 2>/dev/null`
+             test "x$?" != "x0" && pkg_failed=yes
+else
+  pkg_failed=yes
+fi
+ else
+    pkg_failed=untried
+fi
+if test -n "$LZ4_LIBS"; then
+    pkg_cv_LZ4_LIBS="$LZ4_LIBS"
+ elif test -n "$PKG_CONFIG"; then
+    if test -n "$PKG_CONFIG" && \
+    { { $as_echo "$as_me:${as_lineno-$LINENO}: \$PKG_CONFIG --exists --print-errors \"liblz4\""; } >&5
+  ($PKG_CONFIG --exists --print-errors "liblz4") 2>&5
+  ac_status=$?
+  $as_echo "$as_me:${as_lineno-$LINENO}: \$? = $ac_status" >&5
+  test $ac_status = 0; }; then
+  pkg_cv_LZ4_LIBS=`$PKG_CONFIG --libs "liblz4" 2>/dev/null`
+             test "x$?" != "x0" && pkg_failed=yes
+else
+  pkg_failed=yes
+fi
+ else
+    pkg_failed=untried
+fi
+
+
+
+if test $pkg_failed = yes; then
+        { $as_echo "$as_me:${as_lineno-$LINENO}: result: no" >&5
+$as_echo "no" >&6; }
+
+if $PKG_CONFIG --atleast-pkgconfig-version 0.20; then
+        _pkg_short_errors_supported=yes
+else
+        _pkg_short_errors_supported=no
+fi
+        if test $_pkg_short_errors_supported = yes; then
+           LZ4_PKG_ERRORS=`$PKG_CONFIG --short-errors --print-errors --cflags --libs "liblz4" 2>&1`
+        else
+           LZ4_PKG_ERRORS=`$PKG_CONFIG --print-errors --cflags --libs "liblz4" 2>&1`
+        fi
+   # Put the nasty error message in config.log where it belongs
+   echo "$LZ4_PKG_ERRORS" >&5
+
+   as_fn_error $? "Package requirements (liblz4) were not met:
+
+$LZ4_PKG_ERRORS
+
+Consider adjusting the PKG_CONFIG_PATH environment variable if you
+installed software in a non-standard prefix.
+
+Alternatively, you may set the environment variables LZ4_CFLAGS
+and LZ4_LIBS to avoid the need to call pkg-config.
+See the pkg-config man page for more details." "$LINENO" 5
+elif test $pkg_failed = untried; then
+        { $as_echo "$as_me:${as_lineno-$LINENO}: result: no" >&5
+$as_echo "no" >&6; }
+   { { $as_echo "$as_me:${as_lineno-$LINENO}: error: in \`$ac_pwd':" >&5
+$as_echo "$as_me: error: in \`$ac_pwd':" >&2;}
+as_fn_error $? "The pkg-config script could not be found or is too old.  Make sure it
+is in your PATH or set the PKG_CONFIG environment variable to the full
+path to pkg-config.
+
+Alternatively, you may set the environment variables LZ4_CFLAGS
+and LZ4_LIBS to avoid the need to call pkg-config.
+See the pkg-config man page for more details.
+
+To get pkg-config, see <http://pkg-config.freedesktop.org/>.
+See \`config.log' for more details" "$LINENO" 5; }
+else
+   LZ4_CFLAGS=$pkg_cv_LZ4_CFLAGS
+   LZ4_LIBS=$pkg_cv_LZ4_LIBS
+        { $as_echo "$as_me:${as_lineno-$LINENO}: result: yes" >&5
+$as_echo "yes" >&6; }
+
+fi
+  LIBS="$LZ4_LIBS $LIBS"
+  CFLAGS="$LZ4_CFLAGS $CFLAGS"
+fi
+
 #
 # Assignments
 #
@@ -13379,6 +13519,36 @@ Use --without-zlib to disable zlib support." "$LINENO" 5
 fi
 
 
+fi
+
+if test "$with_lz4" = yes; then
+  for ac_header in lz4/lz4.h
+do :
+  ac_fn_c_check_header_mongrel "$LINENO" "lz4/lz4.h" "ac_cv_header_lz4_lz4_h" "$ac_includes_default"
+if test "x$ac_cv_header_lz4_lz4_h" = xyes; then :
+  cat >>confdefs.h <<_ACEOF
+#define HAVE_LZ4_LZ4_H 1
+_ACEOF
+
+else
+  for ac_header in lz4.h
+do :
+  ac_fn_c_check_header_mongrel "$LINENO" "lz4.h" "ac_cv_header_lz4_h" "$ac_includes_default"
+if test "x$ac_cv_header_lz4_h" = xyes; then :
+  cat >>confdefs.h <<_ACEOF
+#define HAVE_LZ4_H 1
+_ACEOF
+
+else
+  as_fn_error $? "lz4.h header file is required for LZ4" "$LINENO" 5
+fi
+
+done
+
+fi
+
+done
+
 fi
 
 if test "$with_gssapi" = yes ; then
index 2f1585adc00803ecc4ba27afe4368986e6e34a04..54efbb22a31d8260ca755a98027e9658d3bf219b 100644 (file)
@@ -986,6 +986,21 @@ PGAC_ARG_BOOL(with, zlib, yes,
               [do not use Zlib])
 AC_SUBST(with_zlib)
 
+#
+# LZ4
+#
+AC_MSG_CHECKING([whether to build with LZ4 support])
+PGAC_ARG_BOOL(with, lz4, no, [build with LZ4 support],
+              [AC_DEFINE([USE_LZ4], 1, [Define to 1 to build with LZ4 support. (--with-lz4)])])
+AC_MSG_RESULT([$with_lz4])
+AC_SUBST(with_lz4)
+
+if test "$with_lz4" = yes; then
+  PKG_CHECK_MODULES(LZ4, liblz4)
+  LIBS="$LZ4_LIBS $LIBS"
+  CFLAGS="$LZ4_CFLAGS $CFLAGS"
+fi
+
 #
 # Assignments
 #
@@ -1410,6 +1425,11 @@ failure.  It is possible the compiler isn't looking in the proper directory.
 Use --without-zlib to disable zlib support.])])
 fi
 
+if test "$with_lz4" = yes; then
+  AC_CHECK_HEADERS(lz4/lz4.h, [],
+       [AC_CHECK_HEADERS(lz4.h, [], [AC_MSG_ERROR([lz4.h header file is required for LZ4])])])
+fi
+
 if test "$with_gssapi" = yes ; then
   AC_CHECK_HEADERS(gssapi/gssapi.h, [],
    [AC_CHECK_HEADERS(gssapi.h, [], [AC_MSG_ERROR([gssapi.h header file is required for GSSAPI])])])
index e614c12a14a5a3fdf75bfff004d40731179bcce2..6f972e630aee4fc01d7dc27afc9ce2ccac18a085 100644 (file)
@@ -1069,7 +1069,7 @@ check_tuple_attribute(HeapCheckContext *ctx)
     */
    VARATT_EXTERNAL_GET_POINTER(toast_pointer, attr);
 
-   ctx->attrsize = toast_pointer.va_extsize;
+   ctx->attrsize = VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer);
    ctx->endchunk = (ctx->attrsize - 1) / TOAST_MAX_CHUNK_SIZE;
    ctx->totalchunks = ctx->endchunk + 1;
 
index 5c9f4af1d5a4d091244b65bddc8a45c2d6161e7e..68d196069859bb40174598926447883490f0aa97 100644 (file)
       </para></entry>
      </row>
 
+     <row>
+      <entry role="catalog_table_entry"><para role="column_definition">
+       <structfield>attcompression</structfield> <type>char</type>
+      </para>
+      <para>
+       The current compression method of the column.  If it is an invalid
+       compression method (<literal>'\0'</literal>) then column data will not
+       be compressed.  Otherwise, <literal>'p'</literal> = pglz compression or
+       <literal>'l'</literal> = lz4 compression.
+      </para></entry>
+     </row>
+
      <row>
       <entry role="catalog_table_entry"><para role="column_definition">
        <structfield>attacl</structfield> <type>aclitem[]</type>
index 9492a3c6b924402ae6cf91b07b115dd89eb4bf8a..68fe6a95b494acf95acb66c321c13695f2b96c3a 100644 (file)
@@ -25992,8 +25992,8 @@ postgres=# SELECT * FROM pg_walfile_name_offset(pg_stop_backup());
    <para>
     The functions shown in <xref linkend="functions-admin-dbsize"/> calculate
     the disk space usage of database objects, or assist in presentation
-    of usage results.
-    All these functions return sizes measured in bytes.  If an OID that does
+    or understanding of usage results.  <literal>bigint</literal> results
+    are measured in bytes.  If an OID that does
     not represent an existing object is passed to one of these
     functions, <literal>NULL</literal> is returned.
    </para>
@@ -26028,6 +26028,20 @@ postgres=# SELECT * FROM pg_walfile_name_offset(pg_stop_backup());
        </para></entry>
       </row>
 
+      <row>
+       <entry role="func_table_entry"><para role="func_signature">
+        <indexterm>
+         <primary>pg_column_compression</primary>
+        </indexterm>
+        <function>pg_column_compression</function> ( <type>"any"</type> )
+        <returnvalue>integer</returnvalue>
+       </para>
+       <para>
+        Shows the compression algorithm that was used to compress a
+        an individual variable-length value.
+       </para></entry>
+      </row>
+
       <row>
        <entry role="func_table_entry"><para role="func_signature">
         <indexterm>
index 3c091b8041327097f462b7bd4a262383071e1674..80a8efaa27b4b79501e1daffb6f4b7af4994c450 100644 (file)
@@ -54,6 +54,7 @@ ALTER TABLE [ IF EXISTS ] <replaceable class="parameter">name</replaceable>
     ALTER [ COLUMN ] <replaceable class="parameter">column_name</replaceable> SET ( <replaceable class="parameter">attribute_option</replaceable> = <replaceable class="parameter">value</replaceable> [, ... ] )
     ALTER [ COLUMN ] <replaceable class="parameter">column_name</replaceable> RESET ( <replaceable class="parameter">attribute_option</replaceable> [, ... ] )
     ALTER [ COLUMN ] <replaceable class="parameter">column_name</replaceable> SET STORAGE { PLAIN | EXTERNAL | EXTENDED | MAIN }
+    ALTER [ COLUMN ] <replaceable class="parameter">column_name</replaceable> SET COMPRESSION <replaceable class="parameter">compression_method</replaceable>
     ADD <replaceable class="parameter">table_constraint</replaceable> [ NOT VALID ]
     ADD <replaceable class="parameter">table_constraint_using_index</replaceable>
     ALTER CONSTRAINT <replaceable class="parameter">constraint_name</replaceable> [ DEFERRABLE | NOT DEFERRABLE ] [ INITIALLY DEFERRED | INITIALLY IMMEDIATE ]
@@ -103,6 +104,7 @@ WITH ( MODULUS <replaceable class="parameter">numeric_literal</replaceable>, REM
   GENERATED { ALWAYS | BY DEFAULT } AS IDENTITY [ ( <replaceable>sequence_options</replaceable> ) ] |
   UNIQUE <replaceable class="parameter">index_parameters</replaceable> |
   PRIMARY KEY <replaceable class="parameter">index_parameters</replaceable> |
+  COMPRESSION <replaceable class="parameter">compression_method</replaceable> |
   REFERENCES <replaceable class="parameter">reftable</replaceable> [ ( <replaceable class="parameter">refcolumn</replaceable> ) ] [ MATCH FULL | MATCH PARTIAL | MATCH SIMPLE ]
     [ ON DELETE <replaceable class="parameter">referential_action</replaceable> ] [ ON UPDATE <replaceable class="parameter">referential_action</replaceable> ] }
 [ DEFERRABLE | NOT DEFERRABLE ] [ INITIALLY DEFERRED | INITIALLY IMMEDIATE ]
@@ -383,6 +385,20 @@ WITH ( MODULUS <replaceable class="parameter">numeric_literal</replaceable>, REM
     </listitem>
    </varlistentry>
 
+   <varlistentry>
+    <term>
+     <literal>SET COMPRESSION <replaceable class="parameter">compression_method</replaceable></literal>
+    </term>
+    <listitem>
+     <para>
+      This sets the compression method for a column.  The supported compression
+      methods are <literal>pglz</literal> and <literal>lz4</literal>.
+      <literal>lz4</literal> is available only if <literal>--with-lz4</literal>
+      was used when building <productname>PostgreSQL</productname>.
+     </para>
+    </listitem>
+   </varlistentry>
+
    <varlistentry>
     <term><literal>ADD <replaceable class="parameter">table_constraint</replaceable> [ NOT VALID ]</literal></term>
     <listitem>
index 1fe4fb6e36d2668a64d356b19aa38c6ad55c0b12..c6c248f1e9185200bda61d3929ad725bf0275153 100644 (file)
@@ -22,7 +22,7 @@ PostgreSQL documentation
  <refsynopsisdiv>
 <synopsis>
 CREATE [ [ GLOBAL | LOCAL ] { TEMPORARY | TEMP } | UNLOGGED ] TABLE [ IF NOT EXISTS ] <replaceable class="parameter">table_name</replaceable> ( [
-  { <replaceable class="parameter">column_name</replaceable> <replaceable class="parameter">data_type</replaceable> [ COLLATE <replaceable>collation</replaceable> ] [ <replaceable class="parameter">column_constraint</replaceable> [ ... ] ]
+  { <replaceable class="parameter">column_name</replaceable> <replaceable class="parameter">data_type</replaceable> [ COLLATE <replaceable>collation</replaceable> ] [ COMPRESSION <replaceable>compression_method</replaceable> ] [ <replaceable class="parameter">column_constraint</replaceable> [ ... ] ]
     | <replaceable>table_constraint</replaceable>
     | LIKE <replaceable>source_table</replaceable> [ <replaceable>like_option</replaceable> ... ] }
     [, ... ]
@@ -288,6 +288,26 @@ WITH ( MODULUS <replaceable class="parameter">numeric_literal</replaceable>, REM
     </listitem>
    </varlistentry>
 
+   <varlistentry>
+    <term><literal>COMPRESSION <replaceable class="parameter">compression_method</replaceable></literal></term>
+    <listitem>
+     <para>
+      The <literal>COMPRESSION</literal> clause sets the compression method
+      for a column.  Compression is supported only for variable-width data
+      types, and is used only for columns whose storage type is main or
+      extended. (See <xref linkend="sql-altertable"/> for information on
+      column storage types.) Setting this property for a partitioned table
+      has no direct effect, because such tables have no storage of their own,
+      but the configured value is inherited by newly-created partitions.
+      The supported compression methods are <literal>pglz</literal> and
+      <literal>lz4</literal>.  <literal>lz4</literal> is available only if
+      <literal>--with-lz4</literal> was used when building
+      <productname>PostgreSQL</productname>. The default
+      is <literal>pglz</literal>.
+     </para>
+    </listitem>
+   </varlistentry>
+
    <varlistentry>
     <term><literal>INHERITS ( <replaceable>parent_table</replaceable> [, ... ] )</literal></term>
     <listitem>
@@ -605,6 +625,17 @@ WITH ( MODULUS <replaceable class="parameter">numeric_literal</replaceable>, REM
         </listitem>
        </varlistentry>
 
+       <varlistentry>
+        <term><literal>INCLUDING COMPRESSION</literal></term>
+        <listitem>
+         <para>
+          Compression method of the columns will be copied.  The default
+          behavior is to exclude compression methods, resulting in columns
+          having the default compression method.
+         </para>
+        </listitem>
+       </varlistentry>
+
        <varlistentry>
         <term><literal>INCLUDING CONSTRAINTS</literal></term>
         <listitem>
index 13c1edfa4ddbbbe1aad5661bbe278d50dcb9d248..01ec9b8b0a65e873d3c20b599efb7231c424b5cd 100644 (file)
@@ -3863,6 +3863,17 @@ bar
         </listitem>
       </varlistentry>
 
+      <varlistentry>
+        <term><varname>HIDE_TOAST_COMPRESSION</varname></term>
+        <listitem>
+        <para>
+         If this variable is set to <literal>true</literal>, column
+         compression method details are not displayed. This is mainly
+         useful for regression tests.
+        </para>
+        </listitem>
+      </varlistentry>
+
       <varlistentry>
         <term><varname>HIDE_TABLEAM</varname></term>
         <listitem>
index a7eb1c9473af7c1ea2a19de856405471e135fff6..0ab5712c7106cbe876cd0d029bc4a068dead4f25 100644 (file)
@@ -213,7 +213,10 @@ brin_form_tuple(BrinDesc *brdesc, BlockNumber blkno, BrinMemTuple *tuple,
                (atttype->typstorage == TYPSTORAGE_EXTENDED ||
                 atttype->typstorage == TYPSTORAGE_MAIN))
            {
-               Datum       cvalue = toast_compress_datum(value);
+               Form_pg_attribute att = TupleDescAttr(brdesc->bd_tupdesc,
+                                                     keyno);
+               Datum       cvalue = toast_compress_datum(value,
+                                                         att->attcompression);
 
                if (DatumGetPointer(cvalue) != NULL)
                {
index 5a007d63f1a95d058526cf9175a7830138cc4f83..b9aff0ccfdc45741cb8a8a41f98a4ae0f80170d0 100644 (file)
@@ -25,6 +25,7 @@ OBJS = \
    scankey.o \
    session.o \
    syncscan.o \
+   toast_compression.o \
    toast_internals.o \
    tupconvert.o \
    tupdesc.o
index d1cdbaf6486149308a91e2875b71368a300c5f0b..2fef40c2e9a902a59ef30be003658d718b1fe958 100644 (file)
@@ -240,14 +240,20 @@ detoast_attr_slice(struct varlena *attr,
         */
        if (slicelimit >= 0)
        {
-           int32       max_size;
+           int32       max_size = VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer);
 
            /*
             * Determine maximum amount of compressed data needed for a prefix
             * of a given length (after decompression).
+            *
+            * At least for now, if it's LZ4 data, we'll have to fetch the
+            * whole thing, because there doesn't seem to be an API call to
+            * determine how much compressed data we need to be sure of being
+            * able to decompress the required slice.
             */
-           max_size = pglz_maximum_compressed_size(slicelimit,
-                                                   toast_pointer.va_extsize);
+           if (VARATT_EXTERNAL_GET_COMPRESSION(toast_pointer) ==
+               TOAST_PGLZ_COMPRESSION_ID)
+               max_size = pglz_maximum_compressed_size(slicelimit, max_size);
 
            /*
             * Fetch enough compressed slices (compressed marker will get set
@@ -347,7 +353,7 @@ toast_fetch_datum(struct varlena *attr)
    /* Must copy to access aligned fields */
    VARATT_EXTERNAL_GET_POINTER(toast_pointer, attr);
 
-   attrsize = toast_pointer.va_extsize;
+   attrsize = VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer);
 
    result = (struct varlena *) palloc(attrsize + VARHDRSZ);
 
@@ -408,7 +414,7 @@ toast_fetch_datum_slice(struct varlena *attr, int32 sliceoffset,
     */
    Assert(!VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer) || 0 == sliceoffset);
 
-   attrsize = toast_pointer.va_extsize;
+   attrsize = VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer);
 
    if (sliceoffset >= attrsize)
    {
@@ -418,8 +424,8 @@ toast_fetch_datum_slice(struct varlena *attr, int32 sliceoffset,
 
    /*
     * When fetching a prefix of a compressed external datum, account for the
-    * rawsize tracking amount of raw data, which is stored at the beginning
-    * as an int32 value).
+    * space required by va_tcinfo, which is stored at the beginning as an
+    * int32 value.
     */
    if (VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer) && slicelength > 0)
        slicelength = slicelength + sizeof(int32);
@@ -464,21 +470,24 @@ toast_fetch_datum_slice(struct varlena *attr, int32 sliceoffset,
 static struct varlena *
 toast_decompress_datum(struct varlena *attr)
 {
-   struct varlena *result;
+   ToastCompressionId cmid;
 
    Assert(VARATT_IS_COMPRESSED(attr));
 
-   result = (struct varlena *)
-       palloc(TOAST_COMPRESS_RAWSIZE(attr) + VARHDRSZ);
-   SET_VARSIZE(result, TOAST_COMPRESS_RAWSIZE(attr) + VARHDRSZ);
-
-   if (pglz_decompress(TOAST_COMPRESS_RAWDATA(attr),
-                       TOAST_COMPRESS_SIZE(attr),
-                       VARDATA(result),
-                       TOAST_COMPRESS_RAWSIZE(attr), true) < 0)
-       elog(ERROR, "compressed data is corrupted");
-
-   return result;
+   /*
+    * Fetch the compression method id stored in the compression header and
+    * decompress the data using the appropriate decompression routine.
+    */
+   cmid = TOAST_COMPRESS_METHOD(attr);
+   switch (cmid)
+   {
+       case TOAST_PGLZ_COMPRESSION_ID:
+           return pglz_decompress_datum(attr);
+       case TOAST_LZ4_COMPRESSION_ID:
+           return lz4_decompress_datum(attr);
+       default:
+           elog(ERROR, "invalid compression method id %d", cmid);
+   }
 }
 
 
@@ -492,22 +501,24 @@ toast_decompress_datum(struct varlena *attr)
 static struct varlena *
 toast_decompress_datum_slice(struct varlena *attr, int32 slicelength)
 {
-   struct varlena *result;
-   int32       rawsize;
+   ToastCompressionId cmid;
 
    Assert(VARATT_IS_COMPRESSED(attr));
 
-   result = (struct varlena *) palloc(slicelength + VARHDRSZ);
-
-   rawsize = pglz_decompress(TOAST_COMPRESS_RAWDATA(attr),
-                             VARSIZE(attr) - TOAST_COMPRESS_HDRSZ,
-                             VARDATA(result),
-                             slicelength, false);
-   if (rawsize < 0)
-       elog(ERROR, "compressed data is corrupted");
-
-   SET_VARSIZE(result, rawsize + VARHDRSZ);
-   return result;
+   /*
+    * Fetch the compression method id stored in the compression header and
+    * decompress the data slice using the appropriate decompression routine.
+    */
+   cmid = TOAST_COMPRESS_METHOD(attr);
+   switch (cmid)
+   {
+       case TOAST_PGLZ_COMPRESSION_ID:
+           return pglz_decompress_datum_slice(attr, slicelength);
+       case TOAST_LZ4_COMPRESSION_ID:
+           return lz4_decompress_datum_slice(attr, slicelength);
+       default:
+           elog(ERROR, "invalid compression method id %d", cmid);
+   }
 }
 
 /* ----------
@@ -589,7 +600,7 @@ toast_datum_size(Datum value)
        struct varatt_external toast_pointer;
 
        VARATT_EXTERNAL_GET_POINTER(toast_pointer, attr);
-       result = toast_pointer.va_extsize;
+       result = VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer);
    }
    else if (VARATT_IS_EXTERNAL_INDIRECT(attr))
    {
index b72a1384973d15ef3c3a16ebf5ad8abc036173a8..1f6b7b77d4e835564de0a5ad7fbf32fcd3046349 100644 (file)
@@ -103,7 +103,8 @@ index_form_tuple(TupleDesc tupleDescriptor,
            (att->attstorage == TYPSTORAGE_EXTENDED ||
             att->attstorage == TYPSTORAGE_MAIN))
        {
-           Datum       cvalue = toast_compress_datum(untoasted_values[i]);
+           Datum       cvalue = toast_compress_datum(untoasted_values[i],
+                                                     att->attcompression);
 
            if (DatumGetPointer(cvalue) != NULL)
            {
diff --git a/src/backend/access/common/toast_compression.c b/src/backend/access/common/toast_compression.c
new file mode 100644 (file)
index 0000000..a6f8b79
--- /dev/null
@@ -0,0 +1,313 @@
+/*-------------------------------------------------------------------------
+ *
+ * toast_compression.c
+ *   Functions for toast compression.
+ *
+ * Copyright (c) 2021, PostgreSQL Global Development Group
+ *
+ *
+ * IDENTIFICATION
+ *   src/backend/access/common/toast_compression.c
+ *
+ *-------------------------------------------------------------------------
+ */
+#include "postgres.h"
+
+#ifdef USE_LZ4
+#include <lz4.h>
+#endif
+
+#include "access/detoast.h"
+#include "access/toast_compression.h"
+#include "common/pg_lzcompress.h"
+#include "fmgr.h"
+#include "utils/builtins.h"
+
+/* Compile-time default */
+char      *default_toast_compression = DEFAULT_TOAST_COMPRESSION;
+
+/*
+ * Compress a varlena using PGLZ.
+ *
+ * Returns the compressed varlena, or NULL if compression fails.
+ */
+struct varlena *
+pglz_compress_datum(const struct varlena *value)
+{
+   int32       valsize,
+               len;
+   struct varlena *tmp = NULL;
+
+   valsize = VARSIZE_ANY_EXHDR(DatumGetPointer(value));
+
+   /*
+    * No point in wasting a palloc cycle if value size is outside the allowed
+    * range for compression.
+    */
+   if (valsize < PGLZ_strategy_default->min_input_size ||
+       valsize > PGLZ_strategy_default->max_input_size)
+       return NULL;
+
+   /*
+    * Figure out the maximum possible size of the pglz output, add the bytes
+    * that will be needed for varlena overhead, and allocate that amount.
+    */
+   tmp = (struct varlena *) palloc(PGLZ_MAX_OUTPUT(valsize) +
+                                   VARHDRSZ_COMPRESS);
+
+   len = pglz_compress(VARDATA_ANY(value),
+                       valsize,
+                       (char *) tmp + VARHDRSZ_COMPRESS,
+                       NULL);
+   if (len < 0)
+   {
+       pfree(tmp);
+       return NULL;
+   }
+
+   SET_VARSIZE_COMPRESSED(tmp, len + VARHDRSZ_COMPRESS);
+
+   return tmp;
+}
+
+/*
+ * Decompress a varlena that was compressed using PGLZ.
+ */
+struct varlena *
+pglz_decompress_datum(const struct varlena *value)
+{
+   struct varlena *result;
+   int32       rawsize;
+
+   /* allocate memory for the uncompressed data */
+   result = (struct varlena *) palloc(VARRAWSIZE_4B_C(value) + VARHDRSZ);
+
+   /* decompress the data */
+   rawsize = pglz_decompress((char *) value + VARHDRSZ_COMPRESS,
+                             VARSIZE(value) - VARHDRSZ_COMPRESS,
+                             VARDATA(result),
+                             VARRAWSIZE_4B_C(value), true);
+   if (rawsize < 0)
+       ereport(ERROR,
+               (errcode(ERRCODE_DATA_CORRUPTED),
+                errmsg_internal("compressed pglz data is corrupt")));
+
+   SET_VARSIZE(result, rawsize + VARHDRSZ);
+
+   return result;
+}
+
+/*
+ * Decompress part of a varlena that was compressed using PGLZ.
+ */
+struct varlena *
+pglz_decompress_datum_slice(const struct varlena *value,
+                       int32 slicelength)
+{
+   struct varlena *result;
+   int32       rawsize;
+
+   /* allocate memory for the uncompressed data */
+   result = (struct varlena *) palloc(slicelength + VARHDRSZ);
+
+   /* decompress the data */
+   rawsize = pglz_decompress((char *) value + VARHDRSZ_COMPRESS,
+                             VARSIZE(value) - VARHDRSZ_COMPRESS,
+                             VARDATA(result),
+                             slicelength, false);
+   if (rawsize < 0)
+       ereport(ERROR,
+               (errcode(ERRCODE_DATA_CORRUPTED),
+                errmsg_internal("compressed pglz data is corrupt")));
+
+   SET_VARSIZE(result, rawsize + VARHDRSZ);
+
+   return result;
+}
+
+/*
+ * Compress a varlena using LZ4.
+ *
+ * Returns the compressed varlena, or NULL if compression fails.
+ */
+struct varlena *
+lz4_compress_datum(const struct varlena *value)
+{
+#ifndef USE_LZ4
+   NO_LZ4_SUPPORT();
+#else
+   int32       valsize;
+   int32       len;
+   int32       max_size;
+   struct varlena *tmp = NULL;
+
+   valsize = VARSIZE_ANY_EXHDR(value);
+
+   /*
+    * Figure out the maximum possible size of the LZ4 output, add the bytes
+    * that will be needed for varlena overhead, and allocate that amount.
+    */
+   max_size = LZ4_compressBound(valsize);
+   tmp = (struct varlena *) palloc(max_size + VARHDRSZ_COMPRESS);
+
+   len = LZ4_compress_default(VARDATA_ANY(value),
+                              (char *) tmp + VARHDRSZ_COMPRESS,
+                              valsize, max_size);
+   if (len <= 0)
+       elog(ERROR, "lz4 compression failed");
+
+   /* data is incompressible so just free the memory and return NULL */
+   if (len > valsize)
+   {
+       pfree(tmp);
+       return NULL;
+   }
+
+   SET_VARSIZE_COMPRESSED(tmp, len + VARHDRSZ_COMPRESS);
+
+   return tmp;
+#endif
+}
+
+/*
+ * Decompress a varlena that was compressed using LZ4.
+ */
+struct varlena *
+lz4_decompress_datum(const struct varlena *value)
+{
+#ifndef USE_LZ4
+   NO_LZ4_SUPPORT();
+#else
+   int32       rawsize;
+   struct varlena *result;
+
+   /* allocate memory for the uncompressed data */
+   result = (struct varlena *) palloc(VARRAWSIZE_4B_C(value) + VARHDRSZ);
+
+   /* decompress the data */
+   rawsize = LZ4_decompress_safe((char *) value + VARHDRSZ_COMPRESS,
+                                 VARDATA(result),
+                                 VARSIZE(value) - VARHDRSZ_COMPRESS,
+                                 VARRAWSIZE_4B_C(value));
+   if (rawsize < 0)
+       ereport(ERROR,
+               (errcode(ERRCODE_DATA_CORRUPTED),
+                errmsg_internal("compressed lz4 data is corrupt")));
+
+
+   SET_VARSIZE(result, rawsize + VARHDRSZ);
+
+   return result;
+#endif
+}
+
+/*
+ * Decompress part of a varlena that was compressed using LZ4.
+ */
+struct varlena *
+lz4_decompress_datum_slice(const struct varlena *value, int32 slicelength)
+{
+#ifndef USE_LZ4
+   NO_LZ4_SUPPORT();
+#else
+   int32       rawsize;
+   struct varlena *result;
+
+   /* slice decompression not supported prior to 1.8.3 */
+   if (LZ4_versionNumber() < 10803)
+       return lz4_decompress_datum(value);
+
+   /* allocate memory for the uncompressed data */
+   result = (struct varlena *) palloc(slicelength + VARHDRSZ);
+
+   /* decompress the data */
+   rawsize = LZ4_decompress_safe_partial((char *) value + VARHDRSZ_COMPRESS,
+                                         VARDATA(result),
+                                         VARSIZE(value) - VARHDRSZ_COMPRESS,
+                                         slicelength,
+                                         slicelength);
+   if (rawsize < 0)
+       ereport(ERROR,
+               (errcode(ERRCODE_DATA_CORRUPTED),
+                errmsg_internal("compressed lz4 data is corrupt")));
+
+   SET_VARSIZE(result, rawsize + VARHDRSZ);
+
+   return result;
+#endif
+}
+
+/*
+ * Extract compression ID from a varlena.
+ *
+ * Returns TOAST_INVALID_COMPRESSION_ID if the varlena is not compressed.
+ */
+ToastCompressionId
+toast_get_compression_id(struct varlena *attr)
+{
+   ToastCompressionId  cmid = TOAST_INVALID_COMPRESSION_ID;
+
+   /*
+    * If it is stored externally then fetch the compression method id from the
+    * external toast pointer.  If compressed inline, fetch it from the toast
+    * compression header.
+    */
+   if (VARATT_IS_EXTERNAL_ONDISK(attr))
+   {
+       struct varatt_external toast_pointer;
+
+       VARATT_EXTERNAL_GET_POINTER(toast_pointer, attr);
+
+       if (VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer))
+           cmid = VARATT_EXTERNAL_GET_COMPRESSION(toast_pointer);
+   }
+   else if (VARATT_IS_COMPRESSED(attr))
+       cmid = VARCOMPRESS_4B_C(attr);
+
+   return cmid;
+}
+
+/*
+ * Validate a new value for the default_toast_compression GUC.
+ */
+bool
+check_default_toast_compression(char **newval, void **extra, GucSource source)
+{
+   if (**newval == '\0')
+   {
+       GUC_check_errdetail("%s cannot be empty.",
+                           "default_toast_compression");
+       return false;
+   }
+
+   if (strlen(*newval) >= NAMEDATALEN)
+   {
+       GUC_check_errdetail("%s is too long (maximum %d characters).",
+                           "default_toast_compression", NAMEDATALEN - 1);
+       return false;
+   }
+
+   if (!CompressionMethodIsValid(CompressionNameToMethod(*newval)))
+   {
+       /*
+        * When source == PGC_S_TEST, don't throw a hard error for a
+        * nonexistent compression method, only a NOTICE. See comments in
+        * guc.h.
+        */
+       if (source == PGC_S_TEST)
+       {
+           ereport(NOTICE,
+                   (errcode(ERRCODE_UNDEFINED_OBJECT),
+                    errmsg("compression method \"%s\" does not exist",
+                           *newval)));
+       }
+       else
+       {
+           GUC_check_errdetail("Compression method \"%s\" does not exist.",
+                               *newval);
+           return false;
+       }
+   }
+
+   return true;
+}
index 9b9da0f41bcd7bf18b9a226efa80b23b6fc4b0fe..c81ce17822186cfe9369ddbec72ddae7280b49ac 100644 (file)
@@ -44,46 +44,54 @@ static bool toastid_valueid_exists(Oid toastrelid, Oid valueid);
  * ----------
  */
 Datum
-toast_compress_datum(Datum value)
+toast_compress_datum(Datum value, char cmethod)
 {
-   struct varlena *tmp;
-   int32       valsize = VARSIZE_ANY_EXHDR(DatumGetPointer(value));
-   int32       len;
+   struct varlena *tmp = NULL;
+   int32       valsize;
+   ToastCompressionId  cmid = TOAST_INVALID_COMPRESSION_ID;
 
    Assert(!VARATT_IS_EXTERNAL(DatumGetPointer(value)));
    Assert(!VARATT_IS_COMPRESSED(DatumGetPointer(value)));
 
+   Assert(CompressionMethodIsValid(cmethod));
+
+   valsize = VARSIZE_ANY_EXHDR(DatumGetPointer(value));
+
    /*
-    * No point in wasting a palloc cycle if value size is out of the allowed
-    * range for compression
+    * Call appropriate compression routine for the compression method.
     */
-   if (valsize < PGLZ_strategy_default->min_input_size ||
-       valsize > PGLZ_strategy_default->max_input_size)
-       return PointerGetDatum(NULL);
+   switch (cmethod)
+   {
+       case TOAST_PGLZ_COMPRESSION:
+           tmp = pglz_compress_datum((const struct varlena *) value);
+           cmid = TOAST_PGLZ_COMPRESSION_ID;
+           break;
+       case TOAST_LZ4_COMPRESSION:
+           tmp = lz4_compress_datum((const struct varlena *) value);
+           cmid = TOAST_LZ4_COMPRESSION_ID;
+           break;
+       default:
+           elog(ERROR, "invalid compression method %c", cmethod);
+   }
 
-   tmp = (struct varlena *) palloc(PGLZ_MAX_OUTPUT(valsize) +
-                                   TOAST_COMPRESS_HDRSZ);
+   if (tmp == NULL)
+       return PointerGetDatum(NULL);
 
    /*
-    * We recheck the actual size even if pglz_compress() reports success,
-    * because it might be satisfied with having saved as little as one byte
-    * in the compressed data --- which could turn into a net loss once you
-    * consider header and alignment padding.  Worst case, the compressed
-    * format might require three padding bytes (plus header, which is
-    * included in VARSIZE(tmp)), whereas the uncompressed format would take
-    * only one header byte and no padding if the value is short enough.  So
-    * we insist on a savings of more than 2 bytes to ensure we have a gain.
+    * We recheck the actual size even if compression reports success, because
+    * it might be satisfied with having saved as little as one byte in the
+    * compressed data --- which could turn into a net loss once you consider
+    * header and alignment padding.  Worst case, the compressed format might
+    * require three padding bytes (plus header, which is included in
+    * VARSIZE(tmp)), whereas the uncompressed format would take only one
+    * header byte and no padding if the value is short enough.  So we insist
+    * on a savings of more than 2 bytes to ensure we have a gain.
     */
-   len = pglz_compress(VARDATA_ANY(DatumGetPointer(value)),
-                       valsize,
-                       TOAST_COMPRESS_RAWDATA(tmp),
-                       PGLZ_strategy_default);
-   if (len >= 0 &&
-       len + TOAST_COMPRESS_HDRSZ < valsize - 2)
+   if (VARSIZE(tmp) < valsize - 2)
    {
-       TOAST_COMPRESS_SET_RAWSIZE(tmp, valsize);
-       SET_VARSIZE_COMPRESSED(tmp, len + TOAST_COMPRESS_HDRSZ);
        /* successful compression */
+       Assert(cmid != TOAST_INVALID_COMPRESSION_ID);
+       TOAST_COMPRESS_SET_SIZE_AND_METHOD(tmp, valsize, cmid);
        return PointerGetDatum(tmp);
    }
    else
@@ -152,19 +160,21 @@ toast_save_datum(Relation rel, Datum value,
                                    &num_indexes);
 
    /*
-    * Get the data pointer and length, and compute va_rawsize and va_extsize.
+    * Get the data pointer and length, and compute va_rawsize and va_extinfo.
     *
     * va_rawsize is the size of the equivalent fully uncompressed datum, so
     * we have to adjust for short headers.
     *
-    * va_extsize is the actual size of the data payload in the toast records.
+    * va_extinfo stored the actual size of the data payload in the toast
+    * records and the compression method in first 2 bits if data is
+    * compressed.
     */
    if (VARATT_IS_SHORT(dval))
    {
        data_p = VARDATA_SHORT(dval);
        data_todo = VARSIZE_SHORT(dval) - VARHDRSZ_SHORT;
        toast_pointer.va_rawsize = data_todo + VARHDRSZ;    /* as if not short */
-       toast_pointer.va_extsize = data_todo;
+       toast_pointer.va_extinfo = data_todo;
    }
    else if (VARATT_IS_COMPRESSED(dval))
    {
@@ -172,7 +182,10 @@ toast_save_datum(Relation rel, Datum value,
        data_todo = VARSIZE(dval) - VARHDRSZ;
        /* rawsize in a compressed datum is just the size of the payload */
        toast_pointer.va_rawsize = VARRAWSIZE_4B_C(dval) + VARHDRSZ;
-       toast_pointer.va_extsize = data_todo;
+
+       /* set external size and compression method */
+       VARATT_EXTERNAL_SET_SIZE_AND_COMPRESSION(toast_pointer, data_todo,
+                                                VARCOMPRESS_4B_C(dval));
        /* Assert that the numbers look like it's compressed */
        Assert(VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer));
    }
@@ -181,7 +194,7 @@ toast_save_datum(Relation rel, Datum value,
        data_p = VARDATA(dval);
        data_todo = VARSIZE(dval) - VARHDRSZ;
        toast_pointer.va_rawsize = VARSIZE(dval);
-       toast_pointer.va_extsize = data_todo;
+       toast_pointer.va_extinfo = data_todo;
    }
 
    /*
index 902f59440cd0713341c3a41b1d4a77a47c697ca9..cb76465050b1ba400d18f0353ae8b896f84c9612 100644 (file)
@@ -20,6 +20,7 @@
 #include "postgres.h"
 
 #include "access/htup_details.h"
+#include "access/toast_compression.h"
 #include "access/tupdesc_details.h"
 #include "catalog/pg_collation.h"
 #include "catalog/pg_type.h"
@@ -664,6 +665,11 @@ TupleDescInitEntry(TupleDesc desc,
    att->attstorage = typeForm->typstorage;
    att->attcollation = typeForm->typcollation;
 
+   if (IsStorageCompressible(typeForm->typstorage))
+       att->attcompression = GetDefaultToastCompression();
+   else
+       att->attcompression = InvalidCompressionMethod;
+
    ReleaseSysCache(tuple);
 }
 
index bd5faf0c1fb493715b28a957501d916d929298c2..7b475f2950ce86d5a012f6a370f2469d3950735c 100644 (file)
@@ -19,6 +19,7 @@
  */
 #include "postgres.h"
 
+#include "access/detoast.h"
 #include "access/genam.h"
 #include "access/heapam.h"
 #include "access/heaptoast.h"
@@ -26,6 +27,7 @@
 #include "access/rewriteheap.h"
 #include "access/syncscan.h"
 #include "access/tableam.h"
+#include "access/toast_compression.h"
 #include "access/tsmapi.h"
 #include "access/xact.h"
 #include "catalog/catalog.h"
@@ -2469,6 +2471,44 @@ reform_and_rewrite_tuple(HeapTuple tuple,
    {
        if (TupleDescAttr(newTupDesc, i)->attisdropped)
            isnull[i] = true;
+
+       /*
+        * Use this opportunity to force recompression of any data that's
+        * compressed with some TOAST compression method other than the one
+        * configured for the column.  We don't actually need to perform the
+        * compression here; we just need to decompress. That will trigger
+        * recompression later on.
+        */
+       else if (!isnull[i] && TupleDescAttr(newTupDesc, i)->attlen == -1)
+       {
+           struct varlena *new_value;
+           ToastCompressionId  cmid;
+           char    cmethod;
+
+           new_value = (struct varlena *) DatumGetPointer(values[i]);
+           cmid = toast_get_compression_id(new_value);
+
+           /* nothing to be done for uncompressed data */
+           if (cmid == TOAST_INVALID_COMPRESSION_ID)
+               continue;
+
+           /* convert compression id to compression method */
+           switch (cmid)
+           {
+               case TOAST_PGLZ_COMPRESSION_ID:
+                   cmethod = TOAST_PGLZ_COMPRESSION;
+                   break;
+               case TOAST_LZ4_COMPRESSION_ID:
+                   cmethod = TOAST_LZ4_COMPRESSION;
+                   break;
+               default:
+                   elog(ERROR, "invalid compression method id %d", cmid);
+           }
+
+           /* if compression method doesn't match then detoast the value */
+           if (TupleDescAttr(newTupDesc, i)->attcompression != cmethod)
+               values[i] = PointerGetDatum(detoast_attr(new_value));
+       }
    }
 
    copiedTuple = heap_form_tuple(newTupDesc, values, isnull);
index fb36151ce55f2d43bd8e8f7d9e23acff2a9b500d..53f78f9c3efd170ff54db148a2d1f29fefcddff3 100644 (file)
@@ -54,6 +54,7 @@ toast_tuple_init(ToastTupleContext *ttc)
 
        ttc->ttc_attr[i].tai_colflags = 0;
        ttc->ttc_attr[i].tai_oldexternal = NULL;
+       ttc->ttc_attr[i].tai_compression = att->attcompression;
 
        if (ttc->ttc_oldvalues != NULL)
        {
@@ -226,9 +227,11 @@ void
 toast_tuple_try_compression(ToastTupleContext *ttc, int attribute)
 {
    Datum      *value = &ttc->ttc_values[attribute];
-   Datum       new_value = toast_compress_datum(*value);
+   Datum       new_value;
    ToastAttrInfo *attr = &ttc->ttc_attr[attribute];
 
+   new_value = toast_compress_datum(*value, attr->tai_compression);
+
    if (DatumGetPointer(new_value) != NULL)
    {
        /* successful compression */
index 41da0c50598c67352f7023c5c6882f425bb8d72d..99e5968ea4f23ac831da55f36eb8d0698f94a53a 100644 (file)
@@ -21,6 +21,7 @@
 #include "access/heapam.h"
 #include "access/htup_details.h"
 #include "access/tableam.h"
+#include "access/toast_compression.h"
 #include "access/xact.h"
 #include "access/xlog_internal.h"
 #include "bootstrap/bootstrap.h"
@@ -733,6 +734,10 @@ DefineAttr(char *name, char *type, int attnum, int nullness)
    attrtypes[attnum]->attcacheoff = -1;
    attrtypes[attnum]->atttypmod = -1;
    attrtypes[attnum]->attislocal = true;
+   if (IsStorageCompressible(attrtypes[attnum]->attstorage))
+       attrtypes[attnum]->attcompression = GetDefaultToastCompression();
+   else
+       attrtypes[attnum]->attcompression = InvalidCompressionMethod;
 
    if (nullness == BOOTCOL_NULL_FORCE_NOT_NULL)
    {
index b15995811234ada97db0c2dd492ff6ccf110b348..9586c29ad0680e1c64aa43ca21bcfdb6e8452833 100644 (file)
@@ -906,6 +906,9 @@ sub morph_row_for_pgattr
    $row->{attcollation} =
      $type->{typcollation} ne '0' ? $C_COLLATION_OID : 0;
 
+   $row->{attcompression} =
+     $type->{typstorage} ne 'p' && $type->{typstorage} ne 'e' ? 'p' : '\0';
+
    if (defined $attr->{forcenotnull})
    {
        $row->{attnotnull} = 't';
index 9abc4a1f5563d34b8e7ef3f9ebeabe344a78d10b..d0ec44bb40ebe53c96830ad2db86b4bf2e248c98 100644 (file)
@@ -36,6 +36,7 @@
 #include "access/sysattr.h"
 #include "access/table.h"
 #include "access/tableam.h"
+#include "access/toast_compression.h"
 #include "access/transam.h"
 #include "access/xact.h"
 #include "access/xlog.h"
@@ -789,6 +790,7 @@ InsertPgAttributeTuples(Relation pg_attribute_rel,
        slot[slotCount]->tts_values[Anum_pg_attribute_attislocal - 1] = BoolGetDatum(attrs->attislocal);
        slot[slotCount]->tts_values[Anum_pg_attribute_attinhcount - 1] = Int32GetDatum(attrs->attinhcount);
        slot[slotCount]->tts_values[Anum_pg_attribute_attcollation - 1] = ObjectIdGetDatum(attrs->attcollation);
+       slot[slotCount]->tts_values[Anum_pg_attribute_attcompression - 1] = CharGetDatum(attrs->attcompression);
        if (attoptions && attoptions[natts] != (Datum) 0)
            slot[slotCount]->tts_values[Anum_pg_attribute_attoptions - 1] = attoptions[natts];
        else
@@ -1715,6 +1717,8 @@ RemoveAttributeById(Oid relid, AttrNumber attnum)
        /* Unset this so no one tries to look up the generation expression */
        attStruct->attgenerated = '\0';
 
+       attStruct->attcompression = InvalidCompressionMethod;
+
        /*
         * Change the column name to something that isn't likely to conflict
         */
index 4ef61b5efd533d2b5cca66e8762f26a96013ab12..397d70d2269ff7929e30b42741f658461f3b3ae7 100644 (file)
@@ -348,6 +348,7 @@ ConstructTupleDescriptor(Relation heapRelation,
            to->attbyval = from->attbyval;
            to->attstorage = from->attstorage;
            to->attalign = from->attalign;
+           to->attcompression = from->attcompression;
        }
        else
        {
index d7b806020dd284c591d713927e9bf29f5fed85f9..933a0734d1a94e9d9791cd0791ca973a668e57ce 100644 (file)
@@ -15,6 +15,7 @@
 #include "postgres.h"
 
 #include "access/heapam.h"
+#include "access/toast_compression.h"
 #include "access/xact.h"
 #include "catalog/binary_upgrade.h"
 #include "catalog/catalog.h"
@@ -220,6 +221,11 @@ create_toast_table(Relation rel, Oid toastOid, Oid toastIndexOid,
    TupleDescAttr(tupdesc, 1)->attstorage = TYPSTORAGE_PLAIN;
    TupleDescAttr(tupdesc, 2)->attstorage = TYPSTORAGE_PLAIN;
 
+   /* Toast field should not be compressed */
+   TupleDescAttr(tupdesc, 0)->attcompression = InvalidCompressionMethod;
+   TupleDescAttr(tupdesc, 1)->attcompression = InvalidCompressionMethod;
+   TupleDescAttr(tupdesc, 2)->attcompression = InvalidCompressionMethod;
+
    /*
     * Toast tables for regular relations go in pg_toast; those for temp
     * relations go into the per-backend temp-toast-table namespace.
index ffb1308a0c064decc452282eb98b0cb16dbc15fc..ab89935ba73b73d0ca2985f2898386fe9085809a 100644 (file)
@@ -23,6 +23,7 @@
 #include "access/relscan.h"
 #include "access/sysattr.h"
 #include "access/tableam.h"
+#include "access/toast_compression.h"
 #include "access/xact.h"
 #include "access/xlog.h"
 #include "catalog/catalog.h"
@@ -527,6 +528,8 @@ static void ATExecReplicaIdentity(Relation rel, ReplicaIdentityStmt *stmt, LOCKM
 static void ATExecGenericOptions(Relation rel, List *options);
 static void ATExecSetRowSecurity(Relation rel, bool rls);
 static void ATExecForceNoForceRowSecurity(Relation rel, bool force_rls);
+static ObjectAddress ATExecSetCompression(AlteredTableInfo *tab, Relation rel,
+                    const char *column, Node *newValue, LOCKMODE lockmode);
 
 static void index_copy_data(Relation rel, RelFileNode newrnode);
 static const char *storage_name(char c);
@@ -558,6 +561,7 @@ static void refuseDupeIndexAttach(Relation parentIdx, Relation partIdx,
 static List *GetParentedForeignKeyRefs(Relation partition);
 static void ATDetachCheckNoForeignKeyRefs(Relation partition);
 static void ATExecAlterCollationRefreshVersion(Relation rel, List *coll);
+static char GetAttributeCompression(Form_pg_attribute att, char *compression);
 
 
 /* ----------------------------------------------------------------
@@ -852,6 +856,18 @@ DefineRelation(CreateStmt *stmt, char relkind, Oid ownerId,
 
        if (colDef->generated)
            attr->attgenerated = colDef->generated;
+
+       /*
+        * lookup attribute's compression method and store it in the
+        * attr->attcompression.
+        */
+       if (relkind == RELKIND_RELATION ||
+           relkind == RELKIND_PARTITIONED_TABLE ||
+           relkind == RELKIND_MATVIEW)
+           attr->attcompression =
+               GetAttributeCompression(attr, colDef->compression);
+       else
+           attr->attcompression = InvalidCompressionMethod;
    }
 
    /*
@@ -2396,6 +2412,22 @@ MergeAttributes(List *schema, List *supers, char relpersistence,
                                       storage_name(def->storage),
                                       storage_name(attribute->attstorage))));
 
+               /* Copy/check compression parameter */
+               if (CompressionMethodIsValid(attribute->attcompression))
+               {
+                   const char *compression =
+                       GetCompressionMethodName(attribute->attcompression);
+
+                   if (def->compression == NULL)
+                       def->compression = pstrdup(compression);
+                   else if (strcmp(def->compression, compression) != 0)
+                       ereport(ERROR,
+                               (errcode(ERRCODE_DATATYPE_MISMATCH),
+                                errmsg("column \"%s\" has a compression method conflict",
+                                       attributeName),
+                                errdetail("%s versus %s", def->compression, compression)));
+               }
+
                def->inhcount++;
                /* Merge of NOT NULL constraints = OR 'em together */
                def->is_not_null |= attribute->attnotnull;
@@ -2430,6 +2462,11 @@ MergeAttributes(List *schema, List *supers, char relpersistence,
                def->collOid = attribute->attcollation;
                def->constraints = NIL;
                def->location = -1;
+               if (CompressionMethodIsValid(attribute->attcompression))
+                   def->compression = pstrdup(GetCompressionMethodName(
+                                                   attribute->attcompression));
+               else
+                   def->compression = NULL;
                inhSchema = lappend(inhSchema, def);
                newattmap->attnums[parent_attno - 1] = ++child_attno;
            }
@@ -2675,6 +2712,19 @@ MergeAttributes(List *schema, List *supers, char relpersistence,
                                       storage_name(def->storage),
                                       storage_name(newdef->storage))));
 
+               /* Copy compression parameter */
+               if (def->compression == NULL)
+                   def->compression = newdef->compression;
+               else if (newdef->compression != NULL)
+               {
+                   if (strcmp(def->compression, newdef->compression) != 0)
+                       ereport(ERROR,
+                               (errcode(ERRCODE_DATATYPE_MISMATCH),
+                                errmsg("column \"%s\" has a compression method conflict",
+                                       attributeName),
+                                errdetail("%s versus %s", def->compression, newdef->compression)));
+               }
+
                /* Mark the column as locally defined */
                def->is_local = true;
                /* Merge of NOT NULL constraints = OR 'em together */
@@ -3961,6 +4011,7 @@ AlterTableGetLockLevel(List *cmds)
            case AT_DropIdentity:
            case AT_SetIdentity:
            case AT_DropExpression:
+           case AT_SetCompression:
                cmd_lockmode = AccessExclusiveLock;
                break;
 
@@ -4283,6 +4334,12 @@ ATPrepCmd(List **wqueue, Relation rel, AlterTableCmd *cmd,
            /* No command-specific prep needed */
            pass = AT_PASS_MISC;
            break;
+       case AT_SetCompression: /* ALTER COLUMN SET COMPRESSION */
+           ATSimplePermissions(rel, ATT_TABLE | ATT_MATVIEW);
+           /* This command never recurses */
+           /* No command-specific prep needed */
+           pass = AT_PASS_MISC;
+           break;
        case AT_DropColumn:     /* DROP COLUMN */
            ATSimplePermissions(rel,
                                ATT_TABLE | ATT_COMPOSITE_TYPE | ATT_FOREIGN_TABLE);
@@ -4626,6 +4683,10 @@ ATExecCmd(List **wqueue, AlteredTableInfo *tab, Relation rel,
        case AT_SetStorage:     /* ALTER COLUMN SET STORAGE */
            address = ATExecSetStorage(rel, cmd->name, cmd->def, lockmode);
            break;
+       case AT_SetCompression:
+           address = ATExecSetCompression(tab, rel, cmd->name, cmd->def,
+                                          lockmode);
+           break;
        case AT_DropColumn:     /* DROP COLUMN */
            address = ATExecDropColumn(wqueue, rel, cmd->name,
                                       cmd->behavior, false, false,
@@ -6340,6 +6401,18 @@ ATExecAddColumn(List **wqueue, AlteredTableInfo *tab, Relation rel,
    attribute.attislocal = colDef->is_local;
    attribute.attinhcount = colDef->inhcount;
    attribute.attcollation = collOid;
+
+   /*
+    * lookup attribute's compression method and store it in the
+    * attr->attcompression.
+    */
+   if (rel->rd_rel->relkind == RELKIND_RELATION ||
+       rel->rd_rel->relkind == RELKIND_PARTITIONED_TABLE)
+       attribute.attcompression = GetAttributeCompression(&attribute,
+                                                          colDef->compression);
+   else
+       attribute.attcompression = InvalidCompressionMethod;
+
    /* attribute.attacl is handled by InsertPgAttributeTuples() */
 
    ReleaseSysCache(typeTuple);
@@ -7712,6 +7785,68 @@ ATExecSetOptions(Relation rel, const char *colName, Node *options,
    return address;
 }
 
+/*
+ * Helper function for ATExecSetStorage and ATExecSetCompression
+ *
+ * Set the attcompression and/or attstorage for the respective index attribute
+ * if the respective input values are valid.
+ */
+static void
+SetIndexStorageProperties(Relation rel, Relation attrelation,
+                         AttrNumber attnum, char newcompression,
+                         char newstorage, LOCKMODE lockmode)
+{
+   HeapTuple   tuple;
+   ListCell   *lc;
+   Form_pg_attribute attrtuple;
+
+   foreach(lc, RelationGetIndexList(rel))
+   {
+       Oid         indexoid = lfirst_oid(lc);
+       Relation    indrel;
+       AttrNumber  indattnum = 0;
+
+       indrel = index_open(indexoid, lockmode);
+
+       for (int i = 0; i < indrel->rd_index->indnatts; i++)
+       {
+           if (indrel->rd_index->indkey.values[i] == attnum)
+           {
+               indattnum = i + 1;
+               break;
+           }
+       }
+
+       if (indattnum == 0)
+       {
+           index_close(indrel, lockmode);
+           continue;
+       }
+
+       tuple = SearchSysCacheCopyAttNum(RelationGetRelid(indrel), indattnum);
+
+       if (HeapTupleIsValid(tuple))
+       {
+           attrtuple = (Form_pg_attribute) GETSTRUCT(tuple);
+
+           if (CompressionMethodIsValid(newcompression))
+               attrtuple->attcompression = newcompression;
+
+           if (newstorage != '\0')
+               attrtuple->attstorage = newstorage;
+
+           CatalogTupleUpdate(attrelation, &tuple->t_self, tuple);
+
+           InvokeObjectPostAlterHook(RelationRelationId,
+                                     RelationGetRelid(rel),
+                                     attrtuple->attnum);
+
+           heap_freetuple(tuple);
+       }
+
+       index_close(indrel, lockmode);
+   }
+}
 /*
  * ALTER TABLE ALTER COLUMN SET STORAGE
  *
@@ -7727,7 +7862,6 @@ ATExecSetStorage(Relation rel, const char *colName, Node *newValue, LOCKMODE loc
    Form_pg_attribute attrtuple;
    AttrNumber  attnum;
    ObjectAddress address;
-   ListCell   *lc;
 
    Assert(IsA(newValue, String));
    storagemode = strVal(newValue);
@@ -7791,47 +7925,9 @@ ATExecSetStorage(Relation rel, const char *colName, Node *newValue, LOCKMODE loc
     * Apply the change to indexes as well (only for simple index columns,
     * matching behavior of index.c ConstructTupleDescriptor()).
     */
-   foreach(lc, RelationGetIndexList(rel))
-   {
-       Oid         indexoid = lfirst_oid(lc);
-       Relation    indrel;
-       AttrNumber  indattnum = 0;
-
-       indrel = index_open(indexoid, lockmode);
-
-       for (int i = 0; i < indrel->rd_index->indnatts; i++)
-       {
-           if (indrel->rd_index->indkey.values[i] == attnum)
-           {
-               indattnum = i + 1;
-               break;
-           }
-       }
-
-       if (indattnum == 0)
-       {
-           index_close(indrel, lockmode);
-           continue;
-       }
-
-       tuple = SearchSysCacheCopyAttNum(RelationGetRelid(indrel), indattnum);
-
-       if (HeapTupleIsValid(tuple))
-       {
-           attrtuple = (Form_pg_attribute) GETSTRUCT(tuple);
-           attrtuple->attstorage = newstorage;
-
-           CatalogTupleUpdate(attrelation, &tuple->t_self, tuple);
-
-           InvokeObjectPostAlterHook(RelationRelationId,
-                                     RelationGetRelid(rel),
-                                     attrtuple->attnum);
-
-           heap_freetuple(tuple);
-       }
-
-       index_close(indrel, lockmode);
-   }
+   SetIndexStorageProperties(rel, attrelation, attnum,
+                             InvalidCompressionMethod,
+                             newstorage, lockmode);
 
    table_close(attrelation, RowExclusiveLock);
 
@@ -11859,6 +11955,23 @@ ATExecAlterColumnType(AlteredTableInfo *tab, Relation rel,
 
    ReleaseSysCache(typeTuple);
 
+   /* Setup attribute compression */
+   if (rel->rd_rel->relkind == RELKIND_RELATION ||
+       rel->rd_rel->relkind == RELKIND_PARTITIONED_TABLE)
+   {
+       /*
+        * No compression for plain/external storage, otherwise, default
+        * compression method if it is not already set, refer comments atop
+        * attcompression parameter in pg_attribute.h.
+        */
+       if (!IsStorageCompressible(tform->typstorage))
+           attTup->attcompression = InvalidCompressionMethod;
+       else if (!CompressionMethodIsValid(attTup->attcompression))
+           attTup->attcompression = GetDefaultToastCompression();
+   }
+   else
+       attTup->attcompression = InvalidCompressionMethod;
+
    CatalogTupleUpdate(attrelation, &heapTup->t_self, heapTup);
 
    table_close(attrelation, RowExclusiveLock);
@@ -14939,6 +15052,89 @@ ATExecGenericOptions(Relation rel, List *options)
    heap_freetuple(tuple);
 }
 
+/*
+ * ALTER TABLE ALTER COLUMN SET COMPRESSION
+ *
+ * Return value is the address of the modified column
+ */
+static ObjectAddress
+ATExecSetCompression(AlteredTableInfo *tab,
+                    Relation rel,
+                    const char *column,
+                    Node *newValue,
+                    LOCKMODE lockmode)
+{
+   Relation    attrel;
+   HeapTuple   tuple;
+   Form_pg_attribute atttableform;
+   AttrNumber  attnum;
+   char       *compression;
+   char        typstorage;
+   Oid         cmoid;
+   Datum       values[Natts_pg_attribute];
+   bool        nulls[Natts_pg_attribute];
+   bool        replace[Natts_pg_attribute];
+   ObjectAddress address;
+
+   Assert(IsA(newValue, String));
+   compression = strVal(newValue);
+
+   attrel = table_open(AttributeRelationId, RowExclusiveLock);
+
+   tuple = SearchSysCacheAttName(RelationGetRelid(rel), column);
+   if (!HeapTupleIsValid(tuple))
+       ereport(ERROR,
+               (errcode(ERRCODE_UNDEFINED_COLUMN),
+                errmsg("column \"%s\" of relation \"%s\" does not exist",
+                       column, RelationGetRelationName(rel))));
+
+   /* prevent them from altering a system attribute */
+   atttableform = (Form_pg_attribute) GETSTRUCT(tuple);
+   attnum = atttableform->attnum;
+   if (attnum <= 0)
+       ereport(ERROR,
+               (errcode(ERRCODE_FEATURE_NOT_SUPPORTED),
+                errmsg("cannot alter system column \"%s\"", column)));
+
+   typstorage = get_typstorage(atttableform->atttypid);
+
+   /* prevent from setting compression methods for uncompressible type */
+   if (!IsStorageCompressible(typstorage))
+       ereport(ERROR,
+               (errcode(ERRCODE_FEATURE_NOT_SUPPORTED),
+                   errmsg("column data type %s does not support compression",
+                       format_type_be(atttableform->atttypid))));
+
+   /* initialize buffers for new tuple values */
+   memset(values, 0, sizeof(values));
+   memset(nulls, false, sizeof(nulls));
+   memset(replace, false, sizeof(replace));
+
+   /* get the attribute compression method. */
+   cmoid = GetAttributeCompression(atttableform, compression);
+
+   atttableform->attcompression = cmoid;
+   CatalogTupleUpdate(attrel, &tuple->t_self, tuple);
+
+   InvokeObjectPostAlterHook(RelationRelationId,
+                             RelationGetRelid(rel),
+                             atttableform->attnum);
+
+   ReleaseSysCache(tuple);
+
+   /* apply changes to the index column as well */
+   SetIndexStorageProperties(rel, attrel, attnum, cmoid, '\0', lockmode);
+   table_close(attrel, RowExclusiveLock);
+
+   /* make changes visible */
+   CommandCounterIncrement();
+
+   ObjectAddressSubSet(address, RelationRelationId,
+                       RelationGetRelid(rel), atttableform->attnum);
+   return address;
+}
+
+
 /*
  * Preparation phase for SET LOGGED/UNLOGGED
  *
@@ -17641,3 +17837,36 @@ ATExecAlterCollationRefreshVersion(Relation rel, List *coll)
    index_update_collation_versions(rel->rd_id, get_collation_oid(coll, false));
    CacheInvalidateRelcache(rel);
 }
+
+/*
+ * resolve column compression specification to compression method.
+ */
+static char
+GetAttributeCompression(Form_pg_attribute att, char *compression)
+{
+   char        typstorage = get_typstorage(att->atttypid);
+   char        cmethod;
+
+   /*
+    * No compression for plain/external storage, refer comments atop
+    * attcompression parameter in pg_attribute.h
+    */
+   if (!IsStorageCompressible(typstorage))
+   {
+       if (compression == NULL)
+           return InvalidCompressionMethod;
+
+       ereport(ERROR,
+               (errcode(ERRCODE_FEATURE_NOT_SUPPORTED),
+                errmsg("column data type %s does not support compression",
+                       format_type_be(att->atttypid))));
+   }
+
+   /* fallback to default compression if it's not specified */
+   if (compression == NULL)
+       cmethod = GetDefaultToastCompression();
+   else
+       cmethod = CompressionNameToMethod(compression);
+
+   return cmethod;
+}
index bda379ba91de4b289241fc2bae23c404425bd736..2c20541e92a13e152bca68afd81a0d6b4cfe3f97 100644 (file)
@@ -2988,6 +2988,7 @@ _copyColumnDef(const ColumnDef *from)
 
    COPY_STRING_FIELD(colname);
    COPY_NODE_FIELD(typeName);
+   COPY_STRING_FIELD(compression);
    COPY_SCALAR_FIELD(inhcount);
    COPY_SCALAR_FIELD(is_local);
    COPY_SCALAR_FIELD(is_not_null);
index bc5e9e52fe4267f6965d00f9ec679da1b2698337..3e980c457c58ac87b58415120c04d4b24621bb78 100644 (file)
@@ -2601,6 +2601,7 @@ _equalColumnDef(const ColumnDef *a, const ColumnDef *b)
 {
    COMPARE_STRING_FIELD(colname);
    COMPARE_NODE_FIELD(typeName);
+   COMPARE_STRING_FIELD(compression);
    COMPARE_SCALAR_FIELD(inhcount);
    COMPARE_SCALAR_FIELD(is_local);
    COMPARE_SCALAR_FIELD(is_not_null);
index 49357ac5c2da5798f86fb7c3009e626b8679f65e..38226530c6dee4cdeee50a37ecad841f52de63db 100644 (file)
@@ -3897,6 +3897,8 @@ raw_expression_tree_walker(Node *node,
 
                if (walker(coldef->typeName, context))
                    return true;
+               if (walker(coldef->compression, context))
+                   return true;
                if (walker(coldef->raw_default, context))
                    return true;
                if (walker(coldef->collClause, context))
index 5054490c58f18df008ff7c36c7bb86325f488339..305311d4a7a6169e48f1a037183ca0ad7ff2c1fd 100644 (file)
@@ -2877,6 +2877,7 @@ _outColumnDef(StringInfo str, const ColumnDef *node)
 
    WRITE_STRING_FIELD(colname);
    WRITE_NODE_FIELD(typeName);
+   WRITE_STRING_FIELD(compression);
    WRITE_INT_FIELD(inhcount);
    WRITE_BOOL_FIELD(is_local);
    WRITE_BOOL_FIELD(is_not_null);
index fd07e7107d8c8a73ea594b05dbd7c52da140e83c..bc43641ffe02f25b9e06020d522b472f046a8b77 100644 (file)
@@ -606,6 +606,8 @@ static Node *makeRecursiveViewSelect(char *relname, List *aliases, Node *query);
 %type <list>       hash_partbound
 %type <defelt>     hash_partbound_elem
 
+%type <str>    optColumnCompression
+
 /*
  * Non-keyword token types.  These are hard-wired into the "flex" lexer.
  * They must be listed first so that their numeric codes do not depend on
@@ -641,9 +643,9 @@ static Node *makeRecursiveViewSelect(char *relname, List *aliases, Node *query);
    CACHE CALL CALLED CASCADE CASCADED CASE CAST CATALOG_P CHAIN CHAR_P
    CHARACTER CHARACTERISTICS CHECK CHECKPOINT CLASS CLOSE
    CLUSTER COALESCE COLLATE COLLATION COLUMN COLUMNS COMMENT COMMENTS COMMIT
-   COMMITTED CONCURRENTLY CONFIGURATION CONFLICT CONNECTION CONSTRAINT
-   CONSTRAINTS CONTENT_P CONTINUE_P CONVERSION_P COPY COST CREATE
-   CROSS CSV CUBE CURRENT_P
+   COMMITTED COMPRESSION CONCURRENTLY CONFIGURATION CONFLICT
+   CONNECTION CONSTRAINT CONSTRAINTS CONTENT_P CONTINUE_P CONVERSION_P COPY
+   COST CREATE CROSS CSV CUBE CURRENT_P
    CURRENT_CATALOG CURRENT_DATE CURRENT_ROLE CURRENT_SCHEMA
    CURRENT_TIME CURRENT_TIMESTAMP CURRENT_USER CURSOR CYCLE
 
@@ -2316,6 +2318,15 @@ alter_table_cmd:
                    n->missing_ok = true;
                    $$ = (Node *)n;
                }
+           /* ALTER TABLE <name> ALTER [COLUMN] <colname> SET (COMPRESSION <cm>) */
+           | ALTER opt_column ColId SET optColumnCompression
+               {
+                   AlterTableCmd *n = makeNode(AlterTableCmd);
+                   n->subtype = AT_SetCompression;
+                   n->name = $3;
+                   n->def = (Node *) makeString($5);
+                   $$ = (Node *)n;
+               }
            /* ALTER TABLE <name> DROP [COLUMN] IF EXISTS <colname> [RESTRICT|CASCADE] */
            | DROP opt_column IF_P EXISTS ColId opt_drop_behavior
                {
@@ -3431,11 +3442,12 @@ TypedTableElement:
            | TableConstraint                   { $$ = $1; }
        ;
 
-columnDef: ColId Typename create_generic_options ColQualList
+columnDef: ColId Typename optColumnCompression create_generic_options ColQualList
                {
                    ColumnDef *n = makeNode(ColumnDef);
                    n->colname = $1;
                    n->typeName = $2;
+                   n->compression = $3;
                    n->inhcount = 0;
                    n->is_local = true;
                    n->is_not_null = false;
@@ -3444,8 +3456,8 @@ columnDef:    ColId Typename create_generic_options ColQualList
                    n->raw_default = NULL;
                    n->cooked_default = NULL;
                    n->collOid = InvalidOid;
-                   n->fdwoptions = $3;
-                   SplitColQualList($4, &n->constraints, &n->collClause,
+                   n->fdwoptions = $4;
+                   SplitColQualList($5, &n->constraints, &n->collClause,
                                     yyscanner);
                    n->location = @1;
                    $$ = (Node *)n;
@@ -3490,6 +3502,14 @@ columnOptions:   ColId ColQualList
                }
        ;
 
+optColumnCompression:
+                   COMPRESSION name
+                   {
+                       $$ = $2;
+                   }
+                   | /*EMPTY*/ { $$ = NULL; }
+               ;
+
 ColQualList:
            ColQualList ColConstraint               { $$ = lappend($1, $2); }
            | /*EMPTY*/                             { $$ = NIL; }
@@ -3720,6 +3740,7 @@ TableLikeOption:
                | INDEXES           { $$ = CREATE_TABLE_LIKE_INDEXES; }
                | STATISTICS        { $$ = CREATE_TABLE_LIKE_STATISTICS; }
                | STORAGE           { $$ = CREATE_TABLE_LIKE_STORAGE; }
+               | COMPRESSION       { $$ = CREATE_TABLE_LIKE_COMPRESSION; }
                | ALL               { $$ = CREATE_TABLE_LIKE_ALL; }
        ;
 
@@ -15321,6 +15342,7 @@ unreserved_keyword:
            | COMMENTS
            | COMMIT
            | COMMITTED
+           | COMPRESSION
            | CONFIGURATION
            | CONFLICT
            | CONNECTION
@@ -15841,6 +15863,7 @@ bare_label_keyword:
            | COMMENTS
            | COMMIT
            | COMMITTED
+           | COMPRESSION
            | CONCURRENTLY
            | CONFIGURATION
            | CONFLICT
index d56f81c79ff09ced9e11cfe26b6639b55ebaeab6..aa6c19adada7af8e1aeb592b890ff3f5a90c2add 100644 (file)
@@ -31,6 +31,7 @@
 #include "access/relation.h"
 #include "access/reloptions.h"
 #include "access/table.h"
+#include "access/toast_compression.h"
 #include "catalog/dependency.h"
 #include "catalog/heap.h"
 #include "catalog/index.h"
@@ -1092,6 +1093,14 @@ transformTableLikeClause(CreateStmtContext *cxt, TableLikeClause *table_like_cla
        else
            def->storage = 0;
 
+       /* Likewise, copy compression if requested */
+       if ((table_like_clause->options & CREATE_TABLE_LIKE_COMPRESSION) != 0
+           && CompressionMethodIsValid(attribute->attcompression))
+           def->compression =
+               pstrdup(GetCompressionMethodName(attribute->attcompression));
+       else
+           def->compression = NULL;
+
        /* Likewise, copy comment if requested */
        if ((table_like_clause->options & CREATE_TABLE_LIKE_COMMENTS) &&
            (comment = GetComment(attribute->attrelid,
index 91600ac56671b2644708f58cffea7d45d8c80cf1..c291b05a4239196251cf2d9d827794debb56d616 100644 (file)
@@ -4641,7 +4641,7 @@ ReorderBufferToastReplace(ReorderBuffer *rb, ReorderBufferTXN *txn,
                   VARSIZE(chunk) - VARHDRSZ);
            data_done += VARSIZE(chunk) - VARHDRSZ;
        }
-       Assert(data_done == toast_pointer.va_extsize);
+       Assert(data_done == VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer));
 
        /* make sure its marked as compressed or not */
        if (VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer))
index 479ed9ae54cd96c165398b7446d3aeed09b00abf..0bc345aa4d397e93666e95734a208479cdfa1927 100644 (file)
@@ -18,6 +18,7 @@
 #include <limits.h>
 
 #include "access/detoast.h"
+#include "access/toast_compression.h"
 #include "catalog/pg_collation.h"
 #include "catalog/pg_type.h"
 #include "common/hashfn.h"
@@ -5299,6 +5300,59 @@ pg_column_size(PG_FUNCTION_ARGS)
    PG_RETURN_INT32(result);
 }
 
+/*
+ * Return the compression method stored in the compressed attribute.  Return
+ * NULL for non varlena type or uncompressed data.
+ */
+Datum
+pg_column_compression(PG_FUNCTION_ARGS)
+{
+   int         typlen;
+   char       *result;
+   ToastCompressionId cmid;
+
+   /* On first call, get the input type's typlen, and save at *fn_extra */
+   if (fcinfo->flinfo->fn_extra == NULL)
+   {
+       /* Lookup the datatype of the supplied argument */
+       Oid         argtypeid = get_fn_expr_argtype(fcinfo->flinfo, 0);
+
+       typlen = get_typlen(argtypeid);
+       if (typlen == 0)        /* should not happen */
+           elog(ERROR, "cache lookup failed for type %u", argtypeid);
+
+       fcinfo->flinfo->fn_extra = MemoryContextAlloc(fcinfo->flinfo->fn_mcxt,
+                                                     sizeof(int));
+       *((int *) fcinfo->flinfo->fn_extra) = typlen;
+   }
+   else
+       typlen = *((int *) fcinfo->flinfo->fn_extra);
+
+   if (typlen != -1)
+       PG_RETURN_NULL();
+
+   /* get the compression method id stored in the compressed varlena */
+   cmid = toast_get_compression_id((struct varlena *)
+                                   DatumGetPointer(PG_GETARG_DATUM(0)));
+   if (cmid == TOAST_INVALID_COMPRESSION_ID)
+       PG_RETURN_NULL();
+
+   /* convert compression method id to compression method name */
+   switch (cmid)
+   {
+       case TOAST_PGLZ_COMPRESSION_ID:
+           result = "pglz";
+           break;
+       case TOAST_LZ4_COMPRESSION_ID:
+           result = "lz4";
+           break;
+       default:
+           elog(ERROR, "invalid compression method id %d", cmid);
+   }
+
+   PG_RETURN_TEXT_P(cstring_to_text(result));
+}
+
 /*
  * string_agg - Concatenates values and returns string.
  *
index 997b4b70ee2f419dce078c6f3d9f935b72d33cd6..f720b093fe3d6c4f47bd256c15f74e1bde696fe0 100644 (file)
@@ -33,6 +33,7 @@
 #include "access/gin.h"
 #include "access/rmgr.h"
 #include "access/tableam.h"
+#include "access/toast_compression.h"
 #include "access/transam.h"
 #include "access/twophase.h"
 #include "access/xact.h"
@@ -3934,6 +3935,17 @@ static struct config_string ConfigureNamesString[] =
        check_default_table_access_method, NULL, NULL
    },
 
+   {
+       {"default_toast_compression", PGC_USERSET, CLIENT_CONN_STATEMENT,
+           gettext_noop("Sets the default compression for new columns."),
+           NULL,
+           GUC_IS_NAME
+       },
+       &default_toast_compression,
+       DEFAULT_TOAST_COMPRESSION,
+       check_default_toast_compression, NULL, NULL
+   },
+
    {
        {"default_tablespace", PGC_USERSET, CLIENT_CONN_STATEMENT,
            gettext_noop("Sets the default tablespace to create tables and indexes in."),
index 3ff507d5f60c9c72a206589b1985d4a779c99fc0..b0b49b382337cd49cd5bd8a15a9b730470cd7baf 100644 (file)
 #temp_tablespaces = ''         # a list of tablespace names, '' uses
                    # only default tablespace
 #default_table_access_method = 'heap'
+#default_toast_compression = 'pglz'    # 'pglz' or 'lz4'
 #check_function_bodies = on
 #default_transaction_isolation = 'read committed'
 #default_transaction_read_only = off
index 16574cb1f8606951742e49552ffbd337f631f788..36607596b1bbc4985147583be3dc58b0c45d9f00 100644 (file)
@@ -124,7 +124,7 @@ sub read_tuple
            c_va_header => shift,
            c_va_vartag => shift,
            c_va_rawsize => shift,
-           c_va_extsize => shift,
+           c_va_extinfo => shift,
            c_va_valueid => shift,
            c_va_toastrelid => shift);
    # Stitch together the text for column 'b'
@@ -169,7 +169,7 @@ sub write_tuple
                    $tup->{c_va_header},
                    $tup->{c_va_vartag},
                    $tup->{c_va_rawsize},
-                   $tup->{c_va_extsize},
+                   $tup->{c_va_extinfo},
                    $tup->{c_va_valueid},
                    $tup->{c_va_toastrelid});
    seek($fh, $offset, 0)
index eea9f30a796e58d9173f92ee8a192daff770c024..0296b9bb5e2c2d468e3b79352d51e88edc2ac4ed 100644 (file)
@@ -160,6 +160,7 @@ typedef struct _dumpOptions
    int         no_subscriptions;
    int         no_synchronized_snapshots;
    int         no_unlogged_table_data;
+   int         no_toast_compression;
    int         serializable_deferrable;
    int         disable_triggers;
    int         outputNoTablespaces;
index eb988d7eb44afad87c7646c86a13e5801581c561..f8bec3ffcc8973d6b8534d658e687ed69b8862f8 100644 (file)
@@ -387,6 +387,7 @@ main(int argc, char **argv)
        {"no-synchronized-snapshots", no_argument, &dopt.no_synchronized_snapshots, 1},
        {"no-unlogged-table-data", no_argument, &dopt.no_unlogged_table_data, 1},
        {"no-subscriptions", no_argument, &dopt.no_subscriptions, 1},
+       {"no-toast-compression", no_argument, &dopt.no_toast_compression, 1},
        {"no-sync", no_argument, NULL, 7},
        {"on-conflict-do-nothing", no_argument, &dopt.do_nothing, 1},
        {"rows-per-insert", required_argument, NULL, 10},
@@ -1047,6 +1048,7 @@ help(const char *progname)
    printf(_("  --no-publications            do not dump publications\n"));
    printf(_("  --no-security-labels         do not dump security label assignments\n"));
    printf(_("  --no-subscriptions           do not dump subscriptions\n"));
+   printf(_("  --no-toast-compression      do not dump toast compression methods\n"));
    printf(_("  --no-synchronized-snapshots  do not use synchronized snapshots in parallel jobs\n"));
    printf(_("  --no-tablespaces             do not dump tablespace assignments\n"));
    printf(_("  --no-unlogged-table-data     do not dump unlogged table data\n"));
@@ -8617,6 +8619,7 @@ getTableAttrs(Archive *fout, TableInfo *tblinfo, int numTables)
 {
    DumpOptions *dopt = fout->dopt;
    PQExpBuffer q = createPQExpBuffer();
+   bool        createWithCompression;
 
    for (int i = 0; i < numTables; i++)
    {
@@ -8702,6 +8705,15 @@ getTableAttrs(Archive *fout, TableInfo *tblinfo, int numTables)
            appendPQExpBufferStr(q,
                                 "'' AS attidentity,\n");
 
+       createWithCompression = (fout->remoteVersion >= 140000);
+
+       if (createWithCompression)
+           appendPQExpBuffer(q,
+                             "a.attcompression AS attcompression,\n");
+       else
+           appendPQExpBuffer(q,
+                             "NULL AS attcompression,\n");
+
        if (fout->remoteVersion >= 110000)
            appendPQExpBufferStr(q,
                                 "CASE WHEN a.atthasmissing AND NOT a.attisdropped "
@@ -8747,6 +8759,7 @@ getTableAttrs(Archive *fout, TableInfo *tblinfo, int numTables)
        tbinfo->attcollation = (Oid *) pg_malloc(ntups * sizeof(Oid));
        tbinfo->attfdwoptions = (char **) pg_malloc(ntups * sizeof(char *));
        tbinfo->attmissingval = (char **) pg_malloc(ntups * sizeof(char *));
+       tbinfo->attcompression = (char *) pg_malloc(ntups * sizeof(char *));
        tbinfo->notnull = (bool *) pg_malloc(ntups * sizeof(bool));
        tbinfo->inhNotNull = (bool *) pg_malloc(ntups * sizeof(bool));
        tbinfo->attrdefs = (AttrDefInfo **) pg_malloc(ntups * sizeof(AttrDefInfo *));
@@ -8775,6 +8788,7 @@ getTableAttrs(Archive *fout, TableInfo *tblinfo, int numTables)
            tbinfo->attcollation[j] = atooid(PQgetvalue(res, j, PQfnumber(res, "attcollation")));
            tbinfo->attfdwoptions[j] = pg_strdup(PQgetvalue(res, j, PQfnumber(res, "attfdwoptions")));
            tbinfo->attmissingval[j] = pg_strdup(PQgetvalue(res, j, PQfnumber(res, "attmissingval")));
+           tbinfo->attcompression[j] = *(PQgetvalue(res, j, PQfnumber(res, "attcompression")));
            tbinfo->attrdefs[j] = NULL; /* fix below */
            if (PQgetvalue(res, j, PQfnumber(res, "atthasdef"))[0] == 't')
                hasdefaults = true;
@@ -15891,6 +15905,31 @@ dumpTableSchema(Archive *fout, const TableInfo *tbinfo)
                                          tbinfo->atttypnames[j]);
                    }
 
+                   /*
+                    * Attribute compression
+                    */
+                   if (!dopt->no_toast_compression &&
+                       tbinfo->attcompression != NULL)
+                   {
+                       char       *cmname;
+
+                       switch (tbinfo->attcompression[j])
+                       {
+                           case 'p':
+                               cmname = "pglz";
+                               break;
+                           case 'l':
+                               cmname = "lz4";
+                               break;
+                           default:
+                               cmname = NULL;
+                               break;
+                       }
+
+                       if (cmname != NULL)
+                           appendPQExpBuffer(q, " COMPRESSION %s", cmname);
+                   }
+
                    if (print_default)
                    {
                        if (tbinfo->attgenerated[j] == ATTRIBUTE_GENERATED_STORED)
index 0a2213fb06c1841c0b88a9434000fbbb58eeee35..453f9467c6ee2a572ae905ca02f853e1b9f23153 100644 (file)
@@ -326,6 +326,7 @@ typedef struct _tableInfo
    char       *partbound;      /* partition bound definition */
    bool        needs_override; /* has GENERATED ALWAYS AS IDENTITY */
    char       *amname;         /* relation access method */
+   char       *attcompression; /* per-attribute current compression method */
 
    /*
     * Stuff computed only for dumpable tables.
index 737e46464ab7ea3e917070fe0659a3ce0fd38db7..bc91bb12ac451856817a35e3bde9af7a86e14a5a 100644 (file)
@@ -2284,9 +2284,9 @@ my %tests = (
        regexp => qr/^
            \QCREATE TABLE dump_test.test_table (\E\n
            \s+\Qcol1 integer NOT NULL,\E\n
-           \s+\Qcol2 text,\E\n
-           \s+\Qcol3 text,\E\n
-           \s+\Qcol4 text,\E\n
+           \s+\Qcol2 text COMPRESSION\E\D*,\n
+           \s+\Qcol3 text COMPRESSION\E\D*,\n
+           \s+\Qcol4 text COMPRESSION\E\D*,\n
            \s+\QCONSTRAINT test_table_col1_check CHECK ((col1 <= 1000))\E\n
            \Q)\E\n
            \QWITH (autovacuum_enabled='false', fillfactor='80');\E\n/xm,
@@ -2326,7 +2326,7 @@ my %tests = (
        regexp => qr/^
            \QCREATE TABLE dump_test.test_second_table (\E
            \n\s+\Qcol1 integer,\E
-           \n\s+\Qcol2 text\E
+           \n\s+\Qcol2 text COMPRESSION\E\D*
            \n\);
            /xm,
        like =>
@@ -2441,7 +2441,7 @@ my %tests = (
            \n\s+\Qcol1 integer,\E
            \n\s+\Qcol2 boolean,\E
            \n\s+\Qcol3 boolean,\E
-           \n\s+\Qcol4 bit(5),\E
+           \n\s+\Qcol4 bit(5) COMPRESSION\E\D*,
            \n\s+\Qcol5 double precision\E
            \n\);
            /xm,
@@ -2459,7 +2459,7 @@ my %tests = (
        regexp => qr/^
            \QCREATE TABLE dump_test.test_table_identity (\E\n
            \s+\Qcol1 integer NOT NULL,\E\n
-           \s+\Qcol2 text\E\n
+           \s+\Qcol2 text COMPRESSION\E\D*\n
            \);
            .*
            \QALTER TABLE dump_test.test_table_identity ALTER COLUMN col1 ADD GENERATED ALWAYS AS IDENTITY (\E\n
index 20af5a92b4f41fdc38020908af6ce0b43e9f1e7f..eeac0efc4fdc8afca7779ac1b4bf83caa678701a 100644 (file)
@@ -1459,7 +1459,7 @@ describeOneTableDetails(const char *schemaname,
    bool        printTableInitialized = false;
    int         i;
    char       *view_def = NULL;
-   char       *headers[11];
+   char       *headers[12];
    PQExpBufferData title;
    PQExpBufferData tmpbuf;
    int         cols;
@@ -1475,7 +1475,8 @@ describeOneTableDetails(const char *schemaname,
                fdwopts_col = -1,
                attstorage_col = -1,
                attstattarget_col = -1,
-               attdescr_col = -1;
+               attdescr_col = -1,
+               attcompression_col = -1;
    int         numrows;
    struct
    {
@@ -1892,6 +1893,17 @@ describeOneTableDetails(const char *schemaname,
        appendPQExpBufferStr(&buf, ",\n  a.attstorage");
        attstorage_col = cols++;
 
+       /* compression info */
+       if (pset.sversion >= 140000 &&
+           !pset.hide_compression &&
+           (tableinfo.relkind == RELKIND_RELATION ||
+            tableinfo.relkind == RELKIND_PARTITIONED_TABLE ||
+            tableinfo.relkind == RELKIND_MATVIEW))
+       {
+           appendPQExpBufferStr(&buf, ",\n  a.attcompression AS attcompression");
+           attcompression_col = cols++;
+       }
+
        /* stats target, if relevant to relkind */
        if (tableinfo.relkind == RELKIND_RELATION ||
            tableinfo.relkind == RELKIND_INDEX ||
@@ -2018,6 +2030,8 @@ describeOneTableDetails(const char *schemaname,
        headers[cols++] = gettext_noop("FDW options");
    if (attstorage_col >= 0)
        headers[cols++] = gettext_noop("Storage");
+   if (attcompression_col >= 0)
+       headers[cols++] = gettext_noop("Compression");
    if (attstattarget_col >= 0)
        headers[cols++] = gettext_noop("Stats target");
    if (attdescr_col >= 0)
@@ -2097,6 +2111,19 @@ describeOneTableDetails(const char *schemaname,
                              false, false);
        }
 
+       /* Column compression. */
+       if (attcompression_col >= 0)
+       {
+           char       *compression = PQgetvalue(res, i, attcompression_col);
+
+           /* these strings are literal in our syntax, so not translated. */
+           printTableAddCell(&cont, (compression[0] == 'p' ? "pglz" :
+                                     (compression[0] == 'l' ? "lz4" :
+                                      (compression[0] == '\0' ? "" :
+                                       "???"))),
+                             false, false);
+       }
+
        /* Statistics target, if the relkind supports this feature */
        if (attstattarget_col >= 0)
            printTableAddCell(&cont, PQgetvalue(res, i, attstattarget_col),
index daa5081eac13b7824e1f28074f9646ea8d8ff7ab..99a59470c5dc86c1e8d0f2f883cb2b319daf6061 100644 (file)
@@ -372,6 +372,8 @@ helpVariables(unsigned short int pager)
                      "    true if last query failed, else false\n"));
    fprintf(output, _("  FETCH_COUNT\n"
                      "    the number of result rows to fetch and display at a time (0 = unlimited)\n"));
+   fprintf(output, _("  HIDE_TOAST_COMPRESSION\n"
+                     "    if set, compression methods are not displayed\n"));
    fprintf(output, _("  HIDE_TABLEAM\n"
                      "    if set, table access methods are not displayed\n"));
    fprintf(output, _("  HISTCONTROL\n"
index d65990059d9780b7954f339bf6a576462836ef17..83f2e6f254edd030ef7949df44eb031ff769fbc7 100644 (file)
@@ -134,6 +134,7 @@ typedef struct _psqlSettings
    bool        quiet;
    bool        singleline;
    bool        singlestep;
+   bool        hide_compression;
    bool        hide_tableam;
    int         fetch_count;
    int         histsize;
index 780479c8d7698bd00f27914e1d4e6539893cd58c..110906a4e959b46d4540f6c78580bdde77d3e950 100644 (file)
@@ -1159,6 +1159,13 @@ show_context_hook(const char *newval)
    return true;
 }
 
+static bool
+hide_compression_hook(const char *newval)
+{
+   return ParseVariableBool(newval, "HIDE_TOAST_COMPRESSION",
+                            &pset.hide_compression);
+}
+
 static bool
 hide_tableam_hook(const char *newval)
 {
@@ -1227,6 +1234,9 @@ EstablishVariableSpace(void)
    SetVariableHooks(pset.vars, "SHOW_CONTEXT",
                     show_context_substitute_hook,
                     show_context_hook);
+   SetVariableHooks(pset.vars, "HIDE_TOAST_COMPRESSION",
+                    bool_substitute_hook,
+                    hide_compression_hook);
    SetVariableHooks(pset.vars, "HIDE_TABLEAM",
                     bool_substitute_hook,
                     hide_tableam_hook);
index 316bec8b017fd0d444333bcd1bfa6cc94e630eba..b67f4ea609b5697a3c977c0cca6646a532619623 100644 (file)
@@ -2116,7 +2116,7 @@ psql_completion(const char *text, int start, int end)
    /* ALTER TABLE ALTER [COLUMN] <foo> SET */
    else if (Matches("ALTER", "TABLE", MatchAny, "ALTER", "COLUMN", MatchAny, "SET") ||
             Matches("ALTER", "TABLE", MatchAny, "ALTER", MatchAny, "SET"))
-       COMPLETE_WITH("(", "DEFAULT", "NOT NULL", "STATISTICS", "STORAGE");
+       COMPLETE_WITH("(", "COMPRESSION", "DEFAULT", "NOT NULL", "STATISTICS", "STORAGE");
    /* ALTER TABLE ALTER [COLUMN] <foo> SET ( */
    else if (Matches("ALTER", "TABLE", MatchAny, "ALTER", "COLUMN", MatchAny, "SET", "(") ||
             Matches("ALTER", "TABLE", MatchAny, "ALTER", MatchAny, "SET", "("))
index 0adf53c77bec0b5e31412d961802c2cf19ff364c..773a02f89ba102cfc42e25b0e30e4ddf75f20dcd 100644 (file)
 #ifndef DETOAST_H
 #define DETOAST_H
 
-/*
- * Testing whether an externally-stored value is compressed now requires
- * comparing extsize (the actual length of the external data) to rawsize
- * (the original uncompressed datum's size).  The latter includes VARHDRSZ
- * overhead, the former doesn't.  We never use compression unless it actually
- * saves space, so we expect either equality or less-than.
- */
-#define VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer) \
-   ((toast_pointer).va_extsize < (toast_pointer).va_rawsize - VARHDRSZ)
-
 /*
  * Macro to fetch the possibly-unaligned contents of an EXTERNAL datum
  * into a local "struct varatt_external" toast pointer.  This should be
diff --git a/src/include/access/toast_compression.h b/src/include/access/toast_compression.h
new file mode 100644 (file)
index 0000000..514df0b
--- /dev/null
@@ -0,0 +1,123 @@
+/*-------------------------------------------------------------------------
+ *
+ * toast_compression.h
+ *   Functions for toast compression.
+ *
+ * Copyright (c) 2021, PostgreSQL Global Development Group
+ *
+ * src/include/access/toast_compression.h
+ *
+ *-------------------------------------------------------------------------
+ */
+
+#ifndef TOAST_COMPRESSION_H
+#define TOAST_COMPRESSION_H
+
+#include "utils/guc.h"
+
+/* GUCs */
+extern char *default_toast_compression;
+
+/* default compression method if not specified. */
+#define DEFAULT_TOAST_COMPRESSION  "pglz"
+
+/*
+ * Built-in compression method-id.  The toast compression header will store
+ * this in the first 2 bits of the raw length.  These built-in compression
+ * method-id are directly mapped to the built-in compression methods.
+ */
+typedef enum ToastCompressionId
+{
+   TOAST_PGLZ_COMPRESSION_ID = 0,
+   TOAST_LZ4_COMPRESSION_ID = 1,
+   TOAST_INVALID_COMPRESSION_ID = 2
+} ToastCompressionId;
+
+/*
+ * Built-in compression methods.  pg_attribute will store this in the
+ * attcompression column.
+ */
+#define TOAST_PGLZ_COMPRESSION         'p'
+#define TOAST_LZ4_COMPRESSION          'l'
+
+#define InvalidCompressionMethod   '\0'
+#define CompressionMethodIsValid(cm)  ((bool) ((cm) != InvalidCompressionMethod))
+
+#define NO_LZ4_SUPPORT() \
+   ereport(ERROR, \
+           (errcode(ERRCODE_FEATURE_NOT_SUPPORTED), \
+            errmsg("unsupported LZ4 compression method"), \
+            errdetail("This functionality requires the server to be built with lz4 support."), \
+            errhint("You need to rebuild PostgreSQL using --with-lz4.")))
+
+#define IsValidCompression(cm)  ((cm) != InvalidCompressionMethod)
+
+#define IsStorageCompressible(storage) ((storage) != TYPSTORAGE_PLAIN && \
+                                       (storage) != TYPSTORAGE_EXTERNAL)
+
+/*
+ * GetCompressionMethodName - Get compression method name
+ */
+static inline const char *
+GetCompressionMethodName(char method)
+{
+   switch (method)
+   {
+       case TOAST_PGLZ_COMPRESSION:
+           return "pglz";
+       case TOAST_LZ4_COMPRESSION:
+           return "lz4";
+       default:
+           elog(ERROR, "invalid compression method %c", method);
+   }
+}
+
+/*
+ * CompressionNameToMethod - Get compression method from compression name
+ *
+ * Search in the available built-in methods.  If the compression not found
+ * in the built-in methods then return InvalidCompressionMethod.
+ */
+static inline char
+CompressionNameToMethod(char *compression)
+{
+   if (strcmp(compression, "pglz") == 0)
+       return TOAST_PGLZ_COMPRESSION;
+   else if (strcmp(compression, "lz4") == 0)
+   {
+#ifndef USE_LZ4
+       NO_LZ4_SUPPORT();
+#endif
+       return TOAST_LZ4_COMPRESSION;
+   }
+
+   return InvalidCompressionMethod;
+}
+
+/*
+ * GetDefaultToastCompression -- get the default toast compression method
+ *
+ * This exists to hide the use of the default_toast_compression GUC variable.
+ */
+static inline char
+GetDefaultToastCompression(void)
+{
+   return CompressionNameToMethod(default_toast_compression);
+}
+
+/* pglz compression/decompression routines */
+extern struct varlena *pglz_compress_datum(const struct varlena *value);
+extern struct varlena *pglz_decompress_datum(const struct varlena *value);
+extern struct varlena *pglz_decompress_datum_slice(const struct varlena *value,
+                                                  int32 slicelength);
+
+/* lz4 compression/decompression routines */
+extern struct varlena *lz4_compress_datum(const struct varlena *value);
+extern struct varlena *lz4_decompress_datum(const struct varlena *value);
+extern struct varlena *lz4_decompress_datum_slice(const struct varlena *value,
+                                                 int32 slicelength);
+extern ToastCompressionId toast_get_compression_id(struct varlena *attr);
+extern bool check_default_toast_compression(char **newval, void **extra,
+                                           GucSource source);
+
+#endif                         /* TOAST_COMPRESSION_H */
index a9a6d644bc3988515dfe7fbb8b26d84613b24471..05104ce23798a479e13dd9605a51bf7ebe6db93a 100644 (file)
@@ -32,6 +32,7 @@ typedef struct
    struct varlena *tai_oldexternal;
    int32       tai_size;
    uint8       tai_colflags;
+   char        tai_compression;
 } ToastAttrInfo;
 
 /*
index cedfb890d8e84dc1066312796d32217e6f14791f..b4d068459ac2d600e65eeb0682446489e6a6b564 100644 (file)
@@ -12,6 +12,7 @@
 #ifndef TOAST_INTERNALS_H
 #define TOAST_INTERNALS_H
 
+#include "access/toast_compression.h"
 #include "storage/lockdefs.h"
 #include "utils/relcache.h"
 #include "utils/snapshot.h"
 typedef struct toast_compress_header
 {
    int32       vl_len_;        /* varlena header (do not touch directly!) */
-   int32       rawsize;
+   uint32      tcinfo;         /* 2 bits for compression method and 30 bits
+                                * rawsize */
 } toast_compress_header;
 
 /*
  * Utilities for manipulation of header information for compressed
  * toast entries.
  */
-#define TOAST_COMPRESS_HDRSZ       ((int32) sizeof(toast_compress_header))
-#define TOAST_COMPRESS_RAWSIZE(ptr) (((toast_compress_header *) (ptr))->rawsize)
-#define TOAST_COMPRESS_SIZE(ptr)   ((int32) VARSIZE_ANY(ptr) - TOAST_COMPRESS_HDRSZ)
-#define TOAST_COMPRESS_RAWDATA(ptr) \
-   (((char *) (ptr)) + TOAST_COMPRESS_HDRSZ)
-#define TOAST_COMPRESS_SET_RAWSIZE(ptr, len) \
-   (((toast_compress_header *) (ptr))->rawsize = (len))
+#define TOAST_COMPRESS_METHOD(ptr) \
+       (((toast_compress_header *) (ptr))->tcinfo >> VARLENA_RAWSIZE_BITS)
+#define TOAST_COMPRESS_SET_SIZE_AND_METHOD(ptr, len, cm_method) \
+   do { \
+       Assert((len) > 0 && (len) <= VARLENA_RAWSIZE_MASK); \
+       Assert((cm_method) == TOAST_PGLZ_COMPRESSION_ID || \
+              (cm_method) == TOAST_LZ4_COMPRESSION_ID); \
+       ((toast_compress_header *) (ptr))->tcinfo = \
+              ((len) | (cm_method) << VARLENA_RAWSIZE_BITS); \
+   } while (0)
 
-extern Datum toast_compress_datum(Datum value);
+extern Datum toast_compress_datum(Datum value, char cmethod);
 extern Oid toast_get_valid_index(Oid toastoid, LOCKMODE lock);
 
 extern void toast_delete_datum(Relation rel, Datum value, bool is_speculative);
index 609d184e81267c22df099f0e56c9c49712f6e6c5..c831b55bf9e2fc2a62e688abdb720b1017ae340d 100644 (file)
@@ -53,6 +53,6 @@
  */
 
 /*                         yyyymmddN */
-#define CATALOG_VERSION_NO 202103131
+#define CATALOG_VERSION_NO 202103191
 
 #endif
index 3db42abf087453bcd71e0d0e8851dac87aad6dde..560f8f00bb37da569269a9dfb87dfe2e35139478 100644 (file)
@@ -160,6 +160,12 @@ CATALOG(pg_attribute,1249,AttributeRelationId) BKI_BOOTSTRAP BKI_ROWTYPE_OID(75,
    /* attribute's collation, if any */
    Oid         attcollation BKI_LOOKUP_OPT(pg_collation);
 
+   /*
+    * compression method.  Must be InvalidCompressionMethod if and only if
+    * typstorage is 'plain' or 'external'.
+    */
+   char        attcompression BKI_DEFAULT('\0');
+
 #ifdef CATALOG_VARLEN          /* variable-length fields start here */
    /* NOTE: The following fields are not present in tuple descriptors. */
 
@@ -187,7 +193,7 @@ CATALOG(pg_attribute,1249,AttributeRelationId) BKI_BOOTSTRAP BKI_ROWTYPE_OID(75,
  * can access fields beyond attcollation except in a real tuple!
  */
 #define ATTRIBUTE_FIXED_PART_SIZE \
-   (offsetof(FormData_pg_attribute,attcollation) + sizeof(Oid))
+   (offsetof(FormData_pg_attribute,attcompression) + sizeof(char))
 
 /* ----------------
  *     Form_pg_attribute corresponds to a pointer to a tuple with
index 93393fcfd4f314a6a20b4826f2d03e7f9a053e66..e259531f60bc93144136abd3f0fa791905d5cd56 100644 (file)
   descr => 'bytes required to store the value, perhaps with compression',
   proname => 'pg_column_size', provolatile => 's', prorettype => 'int4',
   proargtypes => 'any', prosrc => 'pg_column_size' },
+{ oid => '2121',
+  descr => 'compression method for the compressed datum',
+  proname => 'pg_column_compression', provolatile => 's', prorettype => 'text',
+  proargtypes => 'any', prosrc => 'pg_column_compression' },
 { oid => '2322',
   descr => 'total disk space usage for the specified tablespace',
   proname => 'pg_tablespace_size', provolatile => 'v', prorettype => 'int8',
index 3a81d4f2670515f1174749bb525fe14c5d667076..68425eb2c0402b742b13e6778bfeb6644ff76ab9 100644 (file)
@@ -655,6 +655,7 @@ typedef struct ColumnDef
    NodeTag     type;
    char       *colname;        /* name of column */
    TypeName   *typeName;       /* type of column */
+   char       *compression;    /* compression method for column */
    int         inhcount;       /* number of times column is inherited */
    bool        is_local;       /* column has local (non-inherited) def'n */
    bool        is_not_null;    /* NOT NULL constraint specified? */
@@ -694,6 +695,7 @@ typedef enum TableLikeOption
    CREATE_TABLE_LIKE_INDEXES = 1 << 5,
    CREATE_TABLE_LIKE_STATISTICS = 1 << 6,
    CREATE_TABLE_LIKE_STORAGE = 1 << 7,
+   CREATE_TABLE_LIKE_COMPRESSION = 1 << 8,
    CREATE_TABLE_LIKE_ALL = PG_INT32_MAX
 } TableLikeOption;
 
@@ -1855,6 +1857,7 @@ typedef enum AlterTableType
    AT_SetOptions,              /* alter column set ( options ) */
    AT_ResetOptions,            /* alter column reset ( options ) */
    AT_SetStorage,              /* alter column set storage */
+   AT_SetCompression,          /* alter column set compression */
    AT_DropColumn,              /* drop column */
    AT_DropColumnRecurse,       /* internal to commands/tablecmds.c */
    AT_AddIndex,                /* add index */
index 28083aaac9d7f097e44a5a6f82df24a1527b28da..ca1f950cbed44ac1a62e1d3d759b22aaddcef062 100644 (file)
@@ -88,6 +88,7 @@ PG_KEYWORD("comment", COMMENT, UNRESERVED_KEYWORD, BARE_LABEL)
 PG_KEYWORD("comments", COMMENTS, UNRESERVED_KEYWORD, BARE_LABEL)
 PG_KEYWORD("commit", COMMIT, UNRESERVED_KEYWORD, BARE_LABEL)
 PG_KEYWORD("committed", COMMITTED, UNRESERVED_KEYWORD, BARE_LABEL)
+PG_KEYWORD("compression", COMPRESSION, UNRESERVED_KEYWORD, BARE_LABEL)
 PG_KEYWORD("concurrently", CONCURRENTLY, TYPE_FUNC_NAME_KEYWORD, BARE_LABEL)
 PG_KEYWORD("configuration", CONFIGURATION, UNRESERVED_KEYWORD, BARE_LABEL)
 PG_KEYWORD("conflict", CONFLICT, UNRESERVED_KEYWORD, BARE_LABEL)
index 7a7cc21d8dc669ee99dd7931f97c9e904ca0f963..0a6422da4f3c168635b30a9b2da90c911990dcdc 100644 (file)
 /* Define to 1 to build with LLVM based JIT support. (--with-llvm) */
 #undef USE_LLVM
 
+/* Define to 1 to build with LZ4 support (--with-lz4) */
+#undef USE_LZ4
+
 /* Define to select named POSIX semaphores. */
 #undef USE_NAMED_POSIX_SEMAPHORES
 
index 2ed572004dd2832ca8870e64563d36ce5210fc80..2ccbea8e50220990226ed8ca72da3ee6e031c597 100644 (file)
@@ -55,7 +55,9 @@
 /*
  * struct varatt_external is a traditional "TOAST pointer", that is, the
  * information needed to fetch a Datum stored out-of-line in a TOAST table.
- * The data is compressed if and only if va_extsize < va_rawsize - VARHDRSZ.
+ * The data is compressed if and only if the size stored in va_extinfo <
+ * va_rawsize - VARHDRSZ.
+ *
  * This struct must not contain any padding, because we sometimes compare
  * these pointers using memcmp.
  *
@@ -67,7 +69,8 @@
 typedef struct varatt_external
 {
    int32       va_rawsize;     /* Original data size (includes header) */
-   int32       va_extsize;     /* External saved size (doesn't) */
+   uint32      va_extinfo;     /* External saved size (without header) and
+                                * compression method */
    Oid         va_valueid;     /* Unique ID of value within TOAST table */
    Oid         va_toastrelid;  /* RelID of TOAST table containing it */
 }          varatt_external;
@@ -145,7 +148,8 @@ typedef union
    struct                      /* Compressed-in-line format */
    {
        uint32      va_header;
-       uint32      va_rawsize; /* Original data size (excludes header) */
+       uint32      va_tcinfo;  /* Original data size (excludes header) and
+                                * compression method */
        char        va_data[FLEXIBLE_ARRAY_MEMBER]; /* Compressed data */
    }           va_compressed;
 } varattrib_4b;
@@ -274,14 +278,23 @@ typedef struct
    (VARSIZE(PTR) - VARHDRSZ + VARHDRSZ_SHORT)
 
 #define VARHDRSZ_EXTERNAL      offsetof(varattrib_1b_e, va_data)
+#define VARHDRSZ_COMPRESS      offsetof(varattrib_4b, va_compressed.va_data)
 
 #define VARDATA_4B(PTR)        (((varattrib_4b *) (PTR))->va_4byte.va_data)
 #define VARDATA_4B_C(PTR)  (((varattrib_4b *) (PTR))->va_compressed.va_data)
 #define VARDATA_1B(PTR)        (((varattrib_1b *) (PTR))->va_data)
 #define VARDATA_1B_E(PTR)  (((varattrib_1b_e *) (PTR))->va_data)
 
+#define VARLENA_RAWSIZE_BITS   30
+#define VARLENA_RAWSIZE_MASK   ((1U << VARLENA_RAWSIZE_BITS) - 1)
+
+/*
+ * va_tcinfo in va_compress contains raw size of datum and compression method.
+ */
 #define VARRAWSIZE_4B_C(PTR) \
-   (((varattrib_4b *) (PTR))->va_compressed.va_rawsize)
+   (((varattrib_4b *) (PTR))->va_compressed.va_tcinfo & VARLENA_RAWSIZE_MASK)
+#define VARCOMPRESS_4B_C(PTR) \
+   (((varattrib_4b *) (PTR))->va_compressed.va_tcinfo >> VARLENA_RAWSIZE_BITS)
 
 /* Externally visible macros */
 
@@ -323,6 +336,35 @@ typedef struct
    (VARATT_IS_EXTERNAL(PTR) && VARTAG_IS_EXPANDED(VARTAG_EXTERNAL(PTR)))
 #define VARATT_IS_EXTERNAL_NON_EXPANDED(PTR) \
    (VARATT_IS_EXTERNAL(PTR) && !VARTAG_IS_EXPANDED(VARTAG_EXTERNAL(PTR)))
+
+/*
+ * va_extinfo in varatt_external contains actual length of the external data
+ * and compression method if external data is compressed.
+ */
+#define VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer) \
+   ((toast_pointer).va_extinfo & VARLENA_RAWSIZE_MASK)
+
+#define VARATT_EXTERNAL_SET_SIZE_AND_COMPRESSION(toast_pointer, len, cm) \
+   do { \
+       Assert((cm) == TOAST_PGLZ_COMPRESSION_ID || \
+              (cm) == TOAST_LZ4_COMPRESSION_ID); \
+       ((toast_pointer).va_extinfo = (len) | (cm) << VARLENA_RAWSIZE_BITS); \
+   } while (0)
+
+#define VARATT_EXTERNAL_GET_COMPRESSION(PTR) \
+   ((toast_pointer).va_extinfo >> VARLENA_RAWSIZE_BITS)
+
+/*
+ * Testing whether an externally-stored value is compressed now requires
+ * comparing size stored in va_extinfo (the actual length of the external data)
+ * to rawsize (the original uncompressed datum's size).  The latter includes
+ * VARHDRSZ overhead, the former doesn't.  We never use compression unless it
+ * actually saves space, so we expect either equality or less-than.
+ */
+#define VARATT_EXTERNAL_IS_COMPRESSED(toast_pointer) \
+   (VARATT_EXTERNAL_GET_EXTSIZE(toast_pointer) < \
+       (toast_pointer).va_rawsize - VARHDRSZ)
+
 #define VARATT_IS_SHORT(PTR)               VARATT_IS_1B(PTR)
 #define VARATT_IS_EXTENDED(PTR)                (!VARATT_IS_4B_U(PTR))
 
diff --git a/src/test/regress/expected/compression.out b/src/test/regress/expected/compression.out
new file mode 100644 (file)
index 0000000..3de2886
--- /dev/null
@@ -0,0 +1,347 @@
+\set HIDE_TOAST_COMPRESSION false
+-- test creating table with compression method
+CREATE TABLE cmdata(f1 text COMPRESSION pglz);
+CREATE INDEX idx ON cmdata(f1);
+INSERT INTO cmdata VALUES(repeat('1234567890', 1000));
+\d+ cmdata
+                                        Table "public.cmdata"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+Indexes:
+    "idx" btree (f1)
+
+CREATE TABLE cmdata1(f1 TEXT COMPRESSION lz4);
+INSERT INTO cmdata1 VALUES(repeat('1234567890', 1004));
+\d+ cmdata1
+                                        Table "public.cmdata1"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | lz4         |              | 
+
+-- verify stored compression method in the data
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+SELECT pg_column_compression(f1) FROM cmdata1;
+ pg_column_compression 
+-----------------------
+ lz4
+(1 row)
+
+-- decompress data slice
+SELECT SUBSTR(f1, 200, 5) FROM cmdata;
+ substr 
+--------
+ 01234
+(1 row)
+
+SELECT SUBSTR(f1, 2000, 50) FROM cmdata1;
+                       substr                       
+----------------------------------------------------
+ 01234567890123456789012345678901234567890123456789
+(1 row)
+
+-- copy with table creation
+SELECT * INTO cmmove1 FROM cmdata;
+\d+ cmmove1
+                                        Table "public.cmmove1"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+
+SELECT pg_column_compression(f1) FROM cmmove1;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+-- copy to existing table
+CREATE TABLE cmmove3(f1 text COMPRESSION pglz);
+INSERT INTO cmmove3 SELECT * FROM cmdata;
+INSERT INTO cmmove3 SELECT * FROM cmdata1;
+SELECT pg_column_compression(f1) FROM cmmove3;
+ pg_column_compression 
+-----------------------
+ pglz
+ lz4
+(2 rows)
+
+-- test LIKE INCLUDING COMPRESSION
+CREATE TABLE cmdata2 (LIKE cmdata1 INCLUDING COMPRESSION);
+\d+ cmdata2
+                                        Table "public.cmdata2"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | lz4         |              | 
+
+DROP TABLE cmdata2;
+-- try setting compression for incompressible data type
+CREATE TABLE cmdata2 (f1 int COMPRESSION pglz);
+ERROR:  column data type integer does not support compression
+-- update using datum from different table
+CREATE TABLE cmmove2(f1 text COMPRESSION pglz);
+INSERT INTO cmmove2 VALUES (repeat('1234567890', 1004));
+SELECT pg_column_compression(f1) FROM cmmove2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+UPDATE cmmove2 SET f1 = cmdata1.f1 FROM cmdata1;
+SELECT pg_column_compression(f1) FROM cmmove2;
+ pg_column_compression 
+-----------------------
+ lz4
+(1 row)
+
+-- test externally stored compressed data
+CREATE OR REPLACE FUNCTION large_val() RETURNS TEXT LANGUAGE SQL AS
+'select array_agg(md5(g::text))::text from generate_series(1, 256) g';
+CREATE TABLE cmdata2 (f1 text COMPRESSION pglz);
+INSERT INTO cmdata2 SELECT large_val() || repeat('a', 4000);
+SELECT pg_column_compression(f1) FROM cmdata2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+INSERT INTO cmdata1 SELECT large_val() || repeat('a', 4000);
+SELECT pg_column_compression(f1) FROM cmdata1;
+ pg_column_compression 
+-----------------------
+ lz4
+ lz4
+(2 rows)
+
+SELECT SUBSTR(f1, 200, 5) FROM cmdata1;
+ substr 
+--------
+ 01234
+ 8f14e
+(2 rows)
+
+SELECT SUBSTR(f1, 200, 5) FROM cmdata2;
+ substr 
+--------
+ 8f14e
+(1 row)
+
+DROP TABLE cmdata2;
+--test column type update varlena/non-varlena
+CREATE TABLE cmdata2 (f1 int);
+\d+ cmdata2
+                                         Table "public.cmdata2"
+ Column |  Type   | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+---------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | integer |           |          |         | plain   |             |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | extended | pglz        |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE int USING f1::integer;
+\d+ cmdata2
+                                         Table "public.cmdata2"
+ Column |  Type   | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+---------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | integer |           |          |         | plain   |             |              | 
+
+--changing column storage should not impact the compression method
+--but the data should not be compressed
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | extended | pglz        |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 SET STORAGE plain;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | plain   | pglz        |              | 
+
+INSERT INTO cmdata2 VALUES (repeat('123456789', 800));
+SELECT pg_column_compression(f1) FROM cmdata2;
+ pg_column_compression 
+-----------------------
+(1 row)
+
+-- test compression with materialized view
+CREATE MATERIALIZED VIEW mv(x) AS SELECT * FROM cmdata1;
+\d+ mv
+                                    Materialized view "public.mv"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ x      | text |           |          |         | extended | pglz        |              | 
+View definition:
+ SELECT cmdata1.f1 AS x
+   FROM cmdata1;
+
+SELECT pg_column_compression(f1) FROM cmdata1;
+ pg_column_compression 
+-----------------------
+ lz4
+ lz4
+(2 rows)
+
+SELECT pg_column_compression(x) FROM mv;
+ pg_column_compression 
+-----------------------
+ lz4
+ lz4
+(2 rows)
+
+-- test compression with partition
+CREATE TABLE cmpart(f1 text COMPRESSION lz4) PARTITION BY HASH(f1);
+CREATE TABLE cmpart1 PARTITION OF cmpart FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE cmpart2(f1 text COMPRESSION pglz);
+ALTER TABLE cmpart ATTACH PARTITION cmpart2 FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+SELECT pg_column_compression(f1) FROM cmpart1;
+ pg_column_compression 
+-----------------------
+ lz4
+(1 row)
+
+SELECT pg_column_compression(f1) FROM cmpart2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+-- test compression with inheritence, error
+CREATE TABLE cminh() INHERITS(cmdata, cmdata1);
+NOTICE:  merging multiple inherited definitions of column "f1"
+ERROR:  column "f1" has a compression method conflict
+DETAIL:  pglz versus lz4
+CREATE TABLE cminh(f1 TEXT COMPRESSION lz4) INHERITS(cmdata);
+NOTICE:  merging column "f1" with inherited definition
+ERROR:  column "f1" has a compression method conflict
+DETAIL:  pglz versus lz4
+-- test default_toast_compression GUC
+SET default_toast_compression = '';
+ERROR:  invalid value for parameter "default_toast_compression": ""
+DETAIL:  default_toast_compression cannot be empty.
+SET default_toast_compression = 'I do not exist compression';
+ERROR:  invalid value for parameter "default_toast_compression": "I do not exist compression"
+DETAIL:  Compression method "I do not exist compression" does not exist.
+SET default_toast_compression = 'lz4';
+DROP TABLE cmdata2;
+CREATE TABLE cmdata2 (f1 text);
+\d+ cmdata2
+                                        Table "public.cmdata2"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | lz4         |              | 
+
+-- test alter compression method
+ALTER TABLE cmdata ALTER COLUMN f1 SET COMPRESSION lz4;
+INSERT INTO cmdata VALUES (repeat('123456789', 4004));
+\d+ cmdata
+                                        Table "public.cmdata"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | lz4         |              | 
+Indexes:
+    "idx" btree (f1)
+
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+ lz4
+(2 rows)
+
+-- test alter compression method for the materialized view
+ALTER MATERIALIZED VIEW mv ALTER COLUMN x SET COMPRESSION lz4;
+\d+ mv
+                                    Materialized view "public.mv"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ x      | text |           |          |         | extended | lz4         |              | 
+View definition:
+ SELECT cmdata1.f1 AS x
+   FROM cmdata1;
+
+-- test alter compression method for the partitioned table
+ALTER TABLE cmpart1 ALTER COLUMN f1 SET COMPRESSION pglz;
+ALTER TABLE cmpart2 ALTER COLUMN f1 SET COMPRESSION lz4;
+-- new data should be compressed with the current compression method
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+SELECT pg_column_compression(f1) FROM cmpart1;
+ pg_column_compression 
+-----------------------
+ lz4
+ pglz
+(2 rows)
+
+SELECT pg_column_compression(f1) FROM cmpart2;
+ pg_column_compression 
+-----------------------
+ pglz
+ lz4
+(2 rows)
+
+--vacuum full to recompress the data
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+ lz4
+(2 rows)
+
+VACUUM FULL cmdata;
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ lz4
+ lz4
+(2 rows)
+
+-- check data is ok
+SELECT length(f1) FROM cmdata;
+ length 
+--------
+  10000
+  36036
+(2 rows)
+
+SELECT length(f1) FROM cmdata1;
+ length 
+--------
+  10040
+  12449
+(2 rows)
+
+SELECT length(f1) FROM cmmove1;
+ length 
+--------
+  10000
+(1 row)
+
+SELECT length(f1) FROM cmmove2;
+ length 
+--------
+  10040
+(1 row)
+
+SELECT length(f1) FROM cmmove3;
+ length 
+--------
+  10000
+  10040
+(2 rows)
+
+\set HIDE_TOAST_COMPRESSION true
diff --git a/src/test/regress/expected/compression_1.out b/src/test/regress/expected/compression_1.out
new file mode 100644 (file)
index 0000000..40aad81
--- /dev/null
@@ -0,0 +1,340 @@
+\set HIDE_TOAST_COMPRESSION false
+-- test creating table with compression method
+CREATE TABLE cmdata(f1 text COMPRESSION pglz);
+CREATE INDEX idx ON cmdata(f1);
+INSERT INTO cmdata VALUES(repeat('1234567890', 1000));
+\d+ cmdata
+                                        Table "public.cmdata"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+Indexes:
+    "idx" btree (f1)
+
+CREATE TABLE cmdata1(f1 TEXT COMPRESSION lz4);
+ERROR:  unsupported LZ4 compression method
+DETAIL:  This functionality requires the server to be built with lz4 support.
+HINT:  You need to rebuild PostgreSQL using --with-lz4.
+INSERT INTO cmdata1 VALUES(repeat('1234567890', 1004));
+ERROR:  relation "cmdata1" does not exist
+LINE 1: INSERT INTO cmdata1 VALUES(repeat('1234567890', 1004));
+                    ^
+\d+ cmdata1
+-- verify stored compression method in the data
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+SELECT pg_column_compression(f1) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT pg_column_compression(f1) FROM cmdata1;
+                                              ^
+-- decompress data slice
+SELECT SUBSTR(f1, 200, 5) FROM cmdata;
+ substr 
+--------
+ 01234
+(1 row)
+
+SELECT SUBSTR(f1, 2000, 50) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT SUBSTR(f1, 2000, 50) FROM cmdata1;
+                                         ^
+-- copy with table creation
+SELECT * INTO cmmove1 FROM cmdata;
+\d+ cmmove1
+                                        Table "public.cmmove1"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+
+SELECT pg_column_compression(f1) FROM cmmove1;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+-- copy to existing table
+CREATE TABLE cmmove3(f1 text COMPRESSION pglz);
+INSERT INTO cmmove3 SELECT * FROM cmdata;
+INSERT INTO cmmove3 SELECT * FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: INSERT INTO cmmove3 SELECT * FROM cmdata1;
+                                          ^
+SELECT pg_column_compression(f1) FROM cmmove3;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+-- test LIKE INCLUDING COMPRESSION
+CREATE TABLE cmdata2 (LIKE cmdata1 INCLUDING COMPRESSION);
+ERROR:  relation "cmdata1" does not exist
+LINE 1: CREATE TABLE cmdata2 (LIKE cmdata1 INCLUDING COMPRESSION);
+                                   ^
+\d+ cmdata2
+DROP TABLE cmdata2;
+ERROR:  table "cmdata2" does not exist
+-- try setting compression for incompressible data type
+CREATE TABLE cmdata2 (f1 int COMPRESSION pglz);
+ERROR:  column data type integer does not support compression
+-- update using datum from different table
+CREATE TABLE cmmove2(f1 text COMPRESSION pglz);
+INSERT INTO cmmove2 VALUES (repeat('1234567890', 1004));
+SELECT pg_column_compression(f1) FROM cmmove2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+UPDATE cmmove2 SET f1 = cmdata1.f1 FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: UPDATE cmmove2 SET f1 = cmdata1.f1 FROM cmdata1;
+                                                ^
+SELECT pg_column_compression(f1) FROM cmmove2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+-- test externally stored compressed data
+CREATE OR REPLACE FUNCTION large_val() RETURNS TEXT LANGUAGE SQL AS
+'select array_agg(md5(g::text))::text from generate_series(1, 256) g';
+CREATE TABLE cmdata2 (f1 text COMPRESSION pglz);
+INSERT INTO cmdata2 SELECT large_val() || repeat('a', 4000);
+SELECT pg_column_compression(f1) FROM cmdata2;
+ pg_column_compression 
+-----------------------
+ pglz
+(1 row)
+
+INSERT INTO cmdata1 SELECT large_val() || repeat('a', 4000);
+ERROR:  relation "cmdata1" does not exist
+LINE 1: INSERT INTO cmdata1 SELECT large_val() || repeat('a', 4000);
+                    ^
+SELECT pg_column_compression(f1) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT pg_column_compression(f1) FROM cmdata1;
+                                              ^
+SELECT SUBSTR(f1, 200, 5) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT SUBSTR(f1, 200, 5) FROM cmdata1;
+                                       ^
+SELECT SUBSTR(f1, 200, 5) FROM cmdata2;
+ substr 
+--------
+ 8f14e
+(1 row)
+
+DROP TABLE cmdata2;
+--test column type update varlena/non-varlena
+CREATE TABLE cmdata2 (f1 int);
+\d+ cmdata2
+                                         Table "public.cmdata2"
+ Column |  Type   | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+---------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | integer |           |          |         | plain   |             |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | extended | pglz        |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE int USING f1::integer;
+\d+ cmdata2
+                                         Table "public.cmdata2"
+ Column |  Type   | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+---------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | integer |           |          |         | plain   |             |              | 
+
+--changing column storage should not impact the compression method
+--but the data should not be compressed
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | extended | pglz        |              | 
+
+ALTER TABLE cmdata2 ALTER COLUMN f1 SET STORAGE plain;
+\d+ cmdata2
+                                              Table "public.cmdata2"
+ Column |       Type        | Collation | Nullable | Default | Storage | Compression | Stats target | Description 
+--------+-------------------+-----------+----------+---------+---------+-------------+--------------+-------------
+ f1     | character varying |           |          |         | plain   | pglz        |              | 
+
+INSERT INTO cmdata2 VALUES (repeat('123456789', 800));
+SELECT pg_column_compression(f1) FROM cmdata2;
+ pg_column_compression 
+-----------------------
+(1 row)
+
+-- test compression with materialized view
+CREATE MATERIALIZED VIEW mv(x) AS SELECT * FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: CREATE MATERIALIZED VIEW mv(x) AS SELECT * FROM cmdata1;
+                                                        ^
+\d+ mv
+SELECT pg_column_compression(f1) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT pg_column_compression(f1) FROM cmdata1;
+                                              ^
+SELECT pg_column_compression(x) FROM mv;
+ERROR:  relation "mv" does not exist
+LINE 1: SELECT pg_column_compression(x) FROM mv;
+                                             ^
+-- test compression with partition
+CREATE TABLE cmpart(f1 text COMPRESSION lz4) PARTITION BY HASH(f1);
+ERROR:  unsupported LZ4 compression method
+DETAIL:  This functionality requires the server to be built with lz4 support.
+HINT:  You need to rebuild PostgreSQL using --with-lz4.
+CREATE TABLE cmpart1 PARTITION OF cmpart FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+ERROR:  relation "cmpart" does not exist
+CREATE TABLE cmpart2(f1 text COMPRESSION pglz);
+ALTER TABLE cmpart ATTACH PARTITION cmpart2 FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+ERROR:  relation "cmpart" does not exist
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+ERROR:  relation "cmpart" does not exist
+LINE 1: INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+                    ^
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+ERROR:  relation "cmpart" does not exist
+LINE 1: INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+                    ^
+SELECT pg_column_compression(f1) FROM cmpart1;
+ERROR:  relation "cmpart1" does not exist
+LINE 1: SELECT pg_column_compression(f1) FROM cmpart1;
+                                              ^
+SELECT pg_column_compression(f1) FROM cmpart2;
+ pg_column_compression 
+-----------------------
+(0 rows)
+
+-- test compression with inheritence, error
+CREATE TABLE cminh() INHERITS(cmdata, cmdata1);
+ERROR:  relation "cmdata1" does not exist
+CREATE TABLE cminh(f1 TEXT COMPRESSION lz4) INHERITS(cmdata);
+NOTICE:  merging column "f1" with inherited definition
+ERROR:  column "f1" has a compression method conflict
+DETAIL:  pglz versus lz4
+-- test default_toast_compression GUC
+SET default_toast_compression = '';
+ERROR:  invalid value for parameter "default_toast_compression": ""
+DETAIL:  default_toast_compression cannot be empty.
+SET default_toast_compression = 'I do not exist compression';
+ERROR:  invalid value for parameter "default_toast_compression": "I do not exist compression"
+DETAIL:  Compression method "I do not exist compression" does not exist.
+SET default_toast_compression = 'lz4';
+ERROR:  unsupported LZ4 compression method
+DETAIL:  This functionality requires the server to be built with lz4 support.
+HINT:  You need to rebuild PostgreSQL using --with-lz4.
+DROP TABLE cmdata2;
+CREATE TABLE cmdata2 (f1 text);
+\d+ cmdata2
+                                        Table "public.cmdata2"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+
+-- test alter compression method
+ALTER TABLE cmdata ALTER COLUMN f1 SET COMPRESSION lz4;
+ERROR:  unsupported LZ4 compression method
+DETAIL:  This functionality requires the server to be built with lz4 support.
+HINT:  You need to rebuild PostgreSQL using --with-lz4.
+INSERT INTO cmdata VALUES (repeat('123456789', 4004));
+\d+ cmdata
+                                        Table "public.cmdata"
+ Column | Type | Collation | Nullable | Default | Storage  | Compression | Stats target | Description 
+--------+------+-----------+----------+---------+----------+-------------+--------------+-------------
+ f1     | text |           |          |         | extended | pglz        |              | 
+Indexes:
+    "idx" btree (f1)
+
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+ pglz
+(2 rows)
+
+-- test alter compression method for the materialized view
+ALTER MATERIALIZED VIEW mv ALTER COLUMN x SET COMPRESSION lz4;
+ERROR:  relation "mv" does not exist
+\d+ mv
+-- test alter compression method for the partitioned table
+ALTER TABLE cmpart1 ALTER COLUMN f1 SET COMPRESSION pglz;
+ERROR:  relation "cmpart1" does not exist
+ALTER TABLE cmpart2 ALTER COLUMN f1 SET COMPRESSION lz4;
+ERROR:  unsupported LZ4 compression method
+DETAIL:  This functionality requires the server to be built with lz4 support.
+HINT:  You need to rebuild PostgreSQL using --with-lz4.
+-- new data should be compressed with the current compression method
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+ERROR:  relation "cmpart" does not exist
+LINE 1: INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+                    ^
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+ERROR:  relation "cmpart" does not exist
+LINE 1: INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+                    ^
+SELECT pg_column_compression(f1) FROM cmpart1;
+ERROR:  relation "cmpart1" does not exist
+LINE 1: SELECT pg_column_compression(f1) FROM cmpart1;
+                                              ^
+SELECT pg_column_compression(f1) FROM cmpart2;
+ pg_column_compression 
+-----------------------
+(0 rows)
+
+--vacuum full to recompress the data
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+ pglz
+(2 rows)
+
+VACUUM FULL cmdata;
+SELECT pg_column_compression(f1) FROM cmdata;
+ pg_column_compression 
+-----------------------
+ pglz
+ pglz
+(2 rows)
+
+-- check data is ok
+SELECT length(f1) FROM cmdata;
+ length 
+--------
+  10000
+  36036
+(2 rows)
+
+SELECT length(f1) FROM cmdata1;
+ERROR:  relation "cmdata1" does not exist
+LINE 1: SELECT length(f1) FROM cmdata1;
+                               ^
+SELECT length(f1) FROM cmmove1;
+ length 
+--------
+  10000
+(1 row)
+
+SELECT length(f1) FROM cmmove2;
+ length 
+--------
+  10040
+(1 row)
+
+SELECT length(f1) FROM cmmove3;
+ length 
+--------
+  10000
+(1 row)
+
+\set HIDE_TOAST_COMPRESSION true
index e280198b17978ae0e04ff559c61cf86d1b4f8ee7..70c38309d764e8443db83f27bb38797c43eb3c70 100644 (file)
@@ -115,7 +115,7 @@ test: plancache limit plpgsql copy2 temp domain rangefuncs prepare conversion tr
 # ----------
 # Another group of parallel tests
 # ----------
-test: partition_join partition_prune reloptions hash_part indexing partition_aggregate partition_info tuplesort explain
+test: partition_join partition_prune reloptions hash_part indexing partition_aggregate partition_info tuplesort explain compression
 
 # event triggers cannot run concurrently with any test that runs DDL
 # oidjoins is read-only, though, and should run late for best coverage
index 8dc4941c240cd428193136cdb6f218d535b158f4..1524676f3b396560188e577085f5a74741b1fa1a 100644 (file)
@@ -78,11 +78,11 @@ psql_start_test(const char *testname,
     * against different AMs without unnecessary differences.
     */
    offset += snprintf(psql_cmd + offset, sizeof(psql_cmd) - offset,
-                      "\"%s%spsql\" -X -a -q -d \"%s\" -v %s < \"%s\" > \"%s\" 2>&1",
+                      "\"%s%spsql\" -X -a -q -d \"%s\" %s < \"%s\" > \"%s\" 2>&1",
                       bindir ? bindir : "",
                       bindir ? "/" : "",
                       dblist->str,
-                      "HIDE_TABLEAM=\"on\"",
+                      "-v HIDE_TABLEAM=on -v HIDE_TOAST_COMPRESSION=on",
                       infile,
                       outfile);
    if (offset >= sizeof(psql_cmd))
index 6a57e889a15014155a047ecd8bbbf14d3fda0423..d81d04136ce8d4376509e9aad139eea028669d03 100644 (file)
@@ -201,6 +201,7 @@ test: partition_aggregate
 test: partition_info
 test: tuplesort
 test: explain
+test: compression
 test: event_trigger
 test: oidjoins
 test: fast_default
diff --git a/src/test/regress/sql/compression.sql b/src/test/regress/sql/compression.sql
new file mode 100644 (file)
index 0000000..d97e26b
--- /dev/null
@@ -0,0 +1,136 @@
+\set HIDE_TOAST_COMPRESSION false
+
+-- test creating table with compression method
+CREATE TABLE cmdata(f1 text COMPRESSION pglz);
+CREATE INDEX idx ON cmdata(f1);
+INSERT INTO cmdata VALUES(repeat('1234567890', 1000));
+\d+ cmdata
+CREATE TABLE cmdata1(f1 TEXT COMPRESSION lz4);
+INSERT INTO cmdata1 VALUES(repeat('1234567890', 1004));
+\d+ cmdata1
+
+-- verify stored compression method in the data
+SELECT pg_column_compression(f1) FROM cmdata;
+SELECT pg_column_compression(f1) FROM cmdata1;
+
+-- decompress data slice
+SELECT SUBSTR(f1, 200, 5) FROM cmdata;
+SELECT SUBSTR(f1, 2000, 50) FROM cmdata1;
+
+-- copy with table creation
+SELECT * INTO cmmove1 FROM cmdata;
+\d+ cmmove1
+SELECT pg_column_compression(f1) FROM cmmove1;
+
+-- copy to existing table
+CREATE TABLE cmmove3(f1 text COMPRESSION pglz);
+INSERT INTO cmmove3 SELECT * FROM cmdata;
+INSERT INTO cmmove3 SELECT * FROM cmdata1;
+SELECT pg_column_compression(f1) FROM cmmove3;
+
+-- test LIKE INCLUDING COMPRESSION
+CREATE TABLE cmdata2 (LIKE cmdata1 INCLUDING COMPRESSION);
+\d+ cmdata2
+DROP TABLE cmdata2;
+
+-- try setting compression for incompressible data type
+CREATE TABLE cmdata2 (f1 int COMPRESSION pglz);
+
+-- update using datum from different table
+CREATE TABLE cmmove2(f1 text COMPRESSION pglz);
+INSERT INTO cmmove2 VALUES (repeat('1234567890', 1004));
+SELECT pg_column_compression(f1) FROM cmmove2;
+UPDATE cmmove2 SET f1 = cmdata1.f1 FROM cmdata1;
+SELECT pg_column_compression(f1) FROM cmmove2;
+
+-- test externally stored compressed data
+CREATE OR REPLACE FUNCTION large_val() RETURNS TEXT LANGUAGE SQL AS
+'select array_agg(md5(g::text))::text from generate_series(1, 256) g';
+CREATE TABLE cmdata2 (f1 text COMPRESSION pglz);
+INSERT INTO cmdata2 SELECT large_val() || repeat('a', 4000);
+SELECT pg_column_compression(f1) FROM cmdata2;
+INSERT INTO cmdata1 SELECT large_val() || repeat('a', 4000);
+SELECT pg_column_compression(f1) FROM cmdata1;
+SELECT SUBSTR(f1, 200, 5) FROM cmdata1;
+SELECT SUBSTR(f1, 200, 5) FROM cmdata2;
+DROP TABLE cmdata2;
+
+--test column type update varlena/non-varlena
+CREATE TABLE cmdata2 (f1 int);
+\d+ cmdata2
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE int USING f1::integer;
+\d+ cmdata2
+
+--changing column storage should not impact the compression method
+--but the data should not be compressed
+ALTER TABLE cmdata2 ALTER COLUMN f1 TYPE varchar;
+\d+ cmdata2
+ALTER TABLE cmdata2 ALTER COLUMN f1 SET STORAGE plain;
+\d+ cmdata2
+INSERT INTO cmdata2 VALUES (repeat('123456789', 800));
+SELECT pg_column_compression(f1) FROM cmdata2;
+
+-- test compression with materialized view
+CREATE MATERIALIZED VIEW mv(x) AS SELECT * FROM cmdata1;
+\d+ mv
+SELECT pg_column_compression(f1) FROM cmdata1;
+SELECT pg_column_compression(x) FROM mv;
+
+-- test compression with partition
+CREATE TABLE cmpart(f1 text COMPRESSION lz4) PARTITION BY HASH(f1);
+CREATE TABLE cmpart1 PARTITION OF cmpart FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE cmpart2(f1 text COMPRESSION pglz);
+
+ALTER TABLE cmpart ATTACH PARTITION cmpart2 FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+SELECT pg_column_compression(f1) FROM cmpart1;
+SELECT pg_column_compression(f1) FROM cmpart2;
+
+-- test compression with inheritence, error
+CREATE TABLE cminh() INHERITS(cmdata, cmdata1);
+CREATE TABLE cminh(f1 TEXT COMPRESSION lz4) INHERITS(cmdata);
+
+-- test default_toast_compression GUC
+SET default_toast_compression = '';
+SET default_toast_compression = 'I do not exist compression';
+SET default_toast_compression = 'lz4';
+DROP TABLE cmdata2;
+CREATE TABLE cmdata2 (f1 text);
+\d+ cmdata2
+
+-- test alter compression method
+ALTER TABLE cmdata ALTER COLUMN f1 SET COMPRESSION lz4;
+INSERT INTO cmdata VALUES (repeat('123456789', 4004));
+\d+ cmdata
+SELECT pg_column_compression(f1) FROM cmdata;
+
+-- test alter compression method for the materialized view
+ALTER MATERIALIZED VIEW mv ALTER COLUMN x SET COMPRESSION lz4;
+\d+ mv
+
+-- test alter compression method for the partitioned table
+ALTER TABLE cmpart1 ALTER COLUMN f1 SET COMPRESSION pglz;
+ALTER TABLE cmpart2 ALTER COLUMN f1 SET COMPRESSION lz4;
+
+-- new data should be compressed with the current compression method
+INSERT INTO cmpart VALUES (repeat('123456789', 1004));
+INSERT INTO cmpart VALUES (repeat('123456789', 4004));
+SELECT pg_column_compression(f1) FROM cmpart1;
+SELECT pg_column_compression(f1) FROM cmpart2;
+
+--vacuum full to recompress the data
+SELECT pg_column_compression(f1) FROM cmdata;
+VACUUM FULL cmdata;
+SELECT pg_column_compression(f1) FROM cmdata;
+
+-- check data is ok
+SELECT length(f1) FROM cmdata;
+SELECT length(f1) FROM cmdata1;
+SELECT length(f1) FROM cmmove1;
+SELECT length(f1) FROM cmmove2;
+SELECT length(f1) FROM cmmove3;
+
+\set HIDE_TOAST_COMPRESSION true
index a4f5cc4bdbcb7ded9fcef03cbc196c4afdf8dbc6..14605371bb149c2497bb37be355a3b35dcd97888 100644 (file)
@@ -485,6 +485,7 @@ sub GenerateFiles
        USE_ICU => $self->{options}->{icu} ? 1 : undef,
        USE_LIBXML                 => undef,
        USE_LIBXSLT                => undef,
+       USE_LZ4                    => undef,
        USE_LDAP                   => $self->{options}->{ldap} ? 1 : undef,
        USE_LLVM                   => undef,
        USE_NAMED_POSIX_SEMAPHORES => undef,