Test-KT
diff --git a/‎lib/cli.py
Lines changed: 19 additions & 0 deletions b/‎lib/cli.py
Lines changed: 19 additions & 0 deletions
diff --git a/‎lib/gui/display_command.py
Lines changed: 1 addition & 1 deletion b/‎lib/gui/display_command.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎lib/gui/stats.py
Lines changed: 1 addition & 1 deletion b/‎lib/gui/stats.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎lib/model/memory_saving_gradients.py
Lines changed: 439 additions & 0 deletions b/‎lib/model/memory_saving_gradients.py
Lines changed: 439 additions & 0 deletions
diff --git a/‎plugins/train/model/_base.py
Lines changed: 63 additions & 25 deletions b/‎plugins/train/model/_base.py
Lines changed: 63 additions & 25 deletions
@@ -879,6 +879,25 @@ def get_argument_list():
                               "help": "Disables TensorBoard logging. NB: Disabling logs means "
                                       "that you will not be able to use the graph or analysis "
                                       "for this session in the GUI."})
+        argument_list.append({"opts": ("-pp", "--ping-pong"),
+                              "action": "store_true",
+                              "dest": "pingpong",
+                              "default": False,
+                              "help": "Enable ping pong training. Trains one side at a time, "
+                                      "switching sides at each save iteration. Training will take "
+                                      "2 to 4 times longer, with about a 30%%-50%% reduction in "
+                                      "VRAM useage. NB: Preview won't show until both sides have "
+                                      "been trained once."})
+        argument_list.append({"opts": ("-msg", "--memory-saving-gradients"),
+                              "action": "store_true",
+                              "dest": "memory_saving_gradients",
+                              "default": False,
+                              "help": "Trades off VRAM useage against computation time. Can fit "
+                                      "larger models into memory at a cost of slower training "
+                                      "speed. 50%%-150%% batch size increase for 20%%-50%% longer "
+                                      "training time. NB: Launch time will be significantly "
+                                      "delayed. Switching sides using ping-pong training will "
+                                      "take longer."})
         argument_list.append({"opts": ("-wl", "--warp-to-landmarks"),
                               "action": "store_true",
                               "dest": "warp_to_landmarks",
 
@@ -193,7 +193,7 @@ def display_item_set(self):
         session = get_config().session
         if session.initialized and session.logging_disabled:
             logger.trace("Logs disabled. Hiding graph")
-            self.set_info("Graph is disabled as 'no-logs' has been selected")
+            self.set_info("Graph is disabled as 'no-logs' or 'pingpong' has been selected")
             self.display_item = None
         elif session.initialized:
             logger.trace("Loading graph")
 
@@ -136,7 +136,7 @@ def iterations(self):
     @property
     def logging_disabled(self):
         """ Return whether logging is disabled for this session """
-        return self.session["no_logs"]
+        return self.session["no_logs"] or self.session["pingpong"]
 
     @property
     def loss(self):
 
@@ -14,7 +14,7 @@
 import keras
 from keras import losses
 from keras import backend as K
-from keras.models import load_model
+from keras.models import load_model, Model
 from keras.optimizers import Adam
 from keras.utils import get_custom_objects, multi_gpu_model
 
@@ -42,12 +42,16 @@ def __init__(self,
                  input_shape=None,
                  encoder_dim=None,
                  trainer="original",
+                 pingpong=False,
+                 memory_saving_gradients=False,
                  predict=False):
-        logger.debug("Initializing ModelBase (%s): (model_dir: '%s', gpus: %s, "
+        logger.debug("Initializing ModelBase (%s): (model_dir: '%s', gpus: %s, no_logs: %s"
                      "training_image_size, %s, alignments_paths: %s, preview_scale: %s, "
-                     "input_shape: %s, encoder_dim: %s)", self.__class__.__name__, model_dir, gpus,
-                     training_image_size, alignments_paths, preview_scale, input_shape,
-                     encoder_dim)
+                     "input_shape: %s, encoder_dim: %s, trainer: %s, pingpong: %s, "
+                     "memory_saving_gradients: %s, predict: %s)",
+                     self.__class__.__name__, model_dir, gpus, no_logs, training_image_size,
+                     alignments_paths, preview_scale, input_shape, encoder_dim, trainer,
+                     pingpong, memory_saving_gradients, predict)
 
         self.predict = predict
         self.model_dir = model_dir
@@ -60,7 +64,7 @@ def __init__(self,
         self.encoder_dim = encoder_dim
         self.trainer = trainer
 
-        self.state = State(self.model_dir, self.name, no_logs, training_image_size)
+        self.state = State(self.model_dir, self.name, no_logs, pingpong, training_image_size)
         self.is_legacy = False
         self.rename_legacy()
         self.load_state_info()
@@ -74,8 +78,10 @@ def __init__(self,
         self.training_opts = {"alignments": alignments_paths,
                               "preview_scaling": preview_scale / 100,
                               "warp_to_landmarks": warp_to_landmarks,
-                              "no_flip": no_flip}
+                              "no_flip": no_flip,
+                              "pingpong": pingpong}
 
+        self.set_gradient_type(memory_saving_gradients)
         self.build()
         self.set_training_data()
         logger.debug("Initialized ModelBase (%s)", self.__class__.__name__)
@@ -105,6 +111,15 @@ def models_exist(self):
         logger.debug("Pre-existing models exist: %s", retval)
         return retval
 
+    @staticmethod
+    def set_gradient_type(memory_saving_gradients):
+        """ Monkeypatch Memory Saving Gradients if requested """
+        if not memory_saving_gradients:
+            return
+        logger.info("Using Memory Saving Gradients")
+        from lib.model import memory_saving_gradients
+        K.__dict__["gradients"] = memory_saving_gradients.gradients_memory
+
     def set_training_data(self):
         """ Override to set model specific training data.
 
@@ -132,7 +147,7 @@ def build(self):
         self.load_models(swapped=False)
         self.build_autoencoders()
         self.log_summary()
-        self.compile_predictors()
+        self.compile_predictors(initialize=True)
 
     def build_autoencoders(self):
         """ Override for Model Specific autoencoder builds
@@ -215,24 +230,42 @@ def set_output_shape(self, model):
         self.output_shape = tuple(out[0])
         logger.debug("Added output shape: %s", self.output_shape)
 
-    def compile_predictors(self):
+    def reset_pingpong(self):
+        """ Reset the models for pingpong training """
+        logger.debug("Resetting models")
+
+        # Clear models and graph
+        self.predictors = dict()
+        K.clear_session()
+
+        # Load Models for current training run
+        for model in self.networks.values():
+            model.network = Model.from_config(model.config)
+            model.network.set_weights(model.weights)
+
+        self.build_autoencoders()
+        self.compile_predictors(initialize=False)
+        logger.debug("Reset models")
+
+    def compile_predictors(self, initialize=True):
         """ Compile the predictors """
         logger.debug("Compiling Predictors")
         optimizer = self.get_optimizer(lr=5e-5, beta_1=0.5, beta_2=0.999)
 
         for side, model in self.predictors.items():
             loss_names = ["loss"]
-            loss_funcs = [self.loss_function(side)]
+            loss_funcs = [self.loss_function(side, initialize)]
             mask = [inp for inp in model.inputs if inp.name.startswith("mask")]
             if mask:
                 loss_names.insert(0, "mask_loss")
-                loss_funcs.insert(0, self.mask_loss_function(mask[0], side))
+                loss_funcs.insert(0, self.mask_loss_function(mask[0], side, initialize))
             model.compile(optimizer=optimizer, loss=loss_funcs)
 
             if len(loss_names) > 1:
                 loss_names.insert(0, "total_loss")
-            self.state.add_session_loss_names(side, loss_names)
-            self.history[side] = list()
+            if initialize:
+                self.state.add_session_loss_names(side, loss_names)
+                self.history[side] = list()
         logger.debug("Compiled Predictors. Losses: %s", loss_names)
 
     def get_optimizer(self, lr=5e-5, beta_1=0.5, beta_2=0.999):  # pylint: disable=invalid-name
@@ -250,24 +283,24 @@ def get_optimizer(self, lr=5e-5, beta_1=0.5, beta_2=0.999):  # pylint: disable=i
         logger.debug("Optimizer kwargs: %s", opt_kwargs)
         return Adam(**opt_kwargs)
 
-    def loss_function(self, side):
+    def loss_function(self, side, initialize):
         """ Set the loss function """
         if self.config.get("dssim_loss", False):
-            if side == "a" and not self.predict:
+            if side == "a" and not self.predict and initialize:
                 logger.verbose("Using DSSIM Loss")
             loss_func = DSSIMObjective()
         else:
-            if side == "a" and not self.predict:
+            if side == "a" and not self.predict and initialize:
                 logger.verbose("Using Mean Absolute Error Loss")
             loss_func = losses.mean_absolute_error
         logger.debug(loss_func)
         return loss_func
 
-    def mask_loss_function(self, mask, side):
+    def mask_loss_function(self, mask, side, initialize):
         """ Set the loss function for masks
             Side is input so we only log once """
         if self.config.get("dssim_mask_loss", False):
-            if side == "a" and not self.predict:
+            if side == "a" and not self.predict and initialize:
                 logger.verbose("Using DSSIM Loss for mask")
             mask_loss_func = DSSIMObjective()
         else:
@@ -276,7 +309,7 @@ def mask_loss_function(self, mask, side):
             mask_loss_func = losses.mean_absolute_error
 
         if self.config.get("penalized_mask_loss", False):
-            if side == "a" and not self.predict:
+            if side == "a" and not self.predict and initialize:
                 logger.verbose("Using Penalized Loss for mask")
             mask_loss_func = PenalizedLoss(mask, mask_loss_func)
         logger.debug(mask_loss_func)
@@ -329,7 +362,7 @@ def load_models(self, swapped):
 
         if not self.models_exist and not self.predict:
             logger.info("Creating new '%s' model in folder: '%s'", self.name, self.model_dir)
-            return
+            return None
         if not self.models_exist and self.predict:
             logger.error("Model could not be found in folder '%s'. Exiting", self.model_dir)
             exit(0)
@@ -495,6 +528,8 @@ def __init__(self, filename, network_type, side, network):
         self.name = self.set_name()
         self.network = network
         self.network.name = self.name
+        self.config = network.get_config()  # For pingpong restore
+        self.weights = network.get_weights()  # For pingpong restore
         logger.debug("Initialized %s", self.__class__.__name__)
 
     def set_name(self):
@@ -521,6 +556,7 @@ def load(self, fullpath=None):
             logger.warning("Failed loading existing training data. Generating new models")
             logger.debug("Exception: %s", str(err))
             return False
+        self.config = network.get_config()
         self.network = network  # Update network with saved model
         self.network.name = self.type
         return True
@@ -531,6 +567,7 @@ def save(self, fullpath=None, should_backup=False):
         if should_backup:
             self.backup(fullpath=fullpath)
         logger.debug("Saving model: '%s'", fullpath)
+        self.weights = self.network.get_weights()
         self.network.save(fullpath)
 
     def backup(self, fullpath=None):
@@ -553,10 +590,10 @@ def convert_legacy_weights(self):
 
 class State():
     """ Class to hold the model's current state and autoencoder structure """
-    def __init__(self, model_dir, model_name, no_logs, training_image_size):
+    def __init__(self, model_dir, model_name, no_logs, pingpong, training_image_size):
         logger.debug("Initializing %s: (model_dir: '%s', model_name: '%s', no_logs: %s, "
-                     "training_image_size: '%s'", self.__class__.__name__, model_dir,
-                     model_name, no_logs, training_image_size)
+                     "pingpong: %s, training_image_size: '%s'", self.__class__.__name__, model_dir,
+                     model_name, no_logs, pingpong, training_image_size)
         self.serializer = Serializer.get_serializer("json")
         filename = "{}_state.{}".format(model_name, self.serializer.ext)
         self.filename = str(model_dir / filename)
@@ -570,7 +607,7 @@ def __init__(self, model_dir, model_name, no_logs, training_image_size):
         self.config = dict()
         self.load()
         self.session_id = self.new_session_id()
-        self.create_new_session(no_logs)
+        self.create_new_session(no_logs, pingpong)
         logger.debug("Initialized %s:", self.__class__.__name__)
 
     @property
@@ -602,11 +639,12 @@ def new_session_id(self):
         logger.debug(session_id)
         return session_id
 
-    def create_new_session(self, no_logs):
+    def create_new_session(self, no_logs, pingpong):
         """ Create a new session """
         logger.debug("Creating new session. id: %s", self.session_id)
         self.sessions[self.session_id] = {"timestamp": time.time(),
                                           "no_logs": no_logs,
+                                          "pingpong": pingpong,
                                           "loss_names": dict(),
                                           "batchsize": 0,
                                           "iterations": 0}