Update LogSoftMax to work in spatial domain

fmassa · soumith · commit 5db118e64bb6 · 2016-10-07T16:08:39.000-04:00
diff --git a/generic/LogSoftMax.c b/generic/LogSoftMax.c
@@ -8,23 +8,35 @@ void THNN_(LogSoftMax_updateOutput)(
           THTensor *output)
 {
   real *input_data, *output_data;
-  long nframe = 0, dim = 0;
+  long nframe = 0, dim = 0, stride = 0;
   long t, d;
 
   if (input->nDimension == 1)
   {
     nframe = 1;
     dim = input->size[0];
+    stride = 1;
   }
   else if (input->nDimension == 2)
   {
     nframe = input->size[0];
     dim = input->size[1];
+    stride = 1;
   }
-  else
+  else if (input->nDimension == 3)
   {
-    THArgCheck(0, 2, "vector or matrix expected");
+    nframe = 1;
+    dim = input->size[0];
+    stride = input->size[1]*input->size[2];
   }
+  else if (input->nDimension == 4)
+  {
+    nframe = input->size[0];
+    dim = input->size[1];
+    stride = input->size[2]*input->size[3];
+  }
+  else
+    THArgCheck(0, 2, "1D, 2D, 3D or 4D tensor expected");
 
   input = THTensor_(newContiguous)(input);
   THTensor_(resizeAs)(output, input);
@@ -35,22 +47,22 @@ void THNN_(LogSoftMax_updateOutput)(
   accreal logsum;
   real maxInput;
   #pragma omp parallel for private(t, d, maxInput, logsum, input_data, output_data)
-  for (t = 0; t < nframe; t++)
+  for (t = 0; t < stride*nframe; t++)
   {
     logsum = 0;
     maxInput = -THInf;
-    input_data = input_data0 + dim*t;
-    output_data = output_data0 + dim*t;
+    input_data = input_data0 + (t/stride)*dim*stride + t % stride;
+    output_data = output_data0 + (t/stride)*dim*stride + t % stride;
 
     for (d = 0; d < dim; d++)
-      maxInput = THMax(maxInput, input_data[d]);
+      maxInput = THMax(maxInput, input_data[d*stride]);
 
     for (d = 0; d < dim; d++)
-      logsum += exp(input_data[d] - maxInput);
+      logsum += exp(input_data[d*stride] - maxInput);
     logsum = maxInput + log(logsum);
 
     for (d = 0; d < dim; d++)
-      output_data[d] = input_data[d] - logsum;
+      output_data[d*stride] = input_data[d*stride] - logsum;
   }
 
   THTensor_(free)(input);
@@ -66,45 +78,61 @@ void THNN_(LogSoftMax_updateGradInput)(
   THNN_CHECK_SHAPE(input, gradOutput);
   gradOutput = THTensor_(newContiguous)(gradOutput);
   real *gradInput_data, *gradOutput_data, *output_data;
-  long nframe = 0, dim = 0;
+  long nframe = 0, dim = 0, stride = 0;
   long t, d;
 
   if (output->nDimension == 1)
   {
     nframe = 1;
     dim = output->size[0];
+    stride = 1;
   }
   else if (output->nDimension == 2)
   {
     nframe = output->size[0];
     dim = output->size[1];
+    stride = 1;
   }
-  else
+  else if (output->nDimension == 3)
   {
-    THError("vector or matrix expected");
+    nframe = 1;
+    dim = output->size[0];
+    stride = output->size[1]*output->size[2];
   }
+  else if (output->nDimension == 4)
+  {
+    nframe = output->size[0];
+    dim = output->size[1];
+    stride = output->size[2]*output->size[3];
+  }
+  else
+    THError("1D, 2D, 3D or 4D tensor expected");
+
+  output = THTensor_(newContiguous)(output);
+  gradOutput = THTensor_(newContiguous)(gradOutput);
 
   THTensor_(resizeAs)(gradInput, output);
   real *gradInput_data0 = THTensor_(data)(gradInput);
   real *output_data0 = THTensor_(data)(output);
   real *gradOutput_data0 = THTensor_(data)(gradOutput);
   accreal sum;
   #pragma omp parallel for private(t, sum, d, gradInput_data, output_data, gradOutput_data)
-  for (t = 0; t < nframe; t++)
+  for (t = 0; t < stride*nframe; t++)
   {
     sum = 0;
-    gradInput_data = gradInput_data0 + dim*t;
-    output_data = output_data0 + dim*t;
-    gradOutput_data = gradOutput_data0 + dim*t;
+    gradInput_data = gradInput_data0 + (t/stride)*dim*stride + t % stride;
+    output_data = output_data0 + (t/stride)*dim*stride + t % stride;
+    gradOutput_data = gradOutput_data0 + (t/stride)*dim*stride + t % stride;
 
     for (d = 0; d < dim; d++)
-      sum += gradOutput_data[d];
+      sum += gradOutput_data[d*stride];
 
     for (d = 0; d < dim; d++)
-      gradInput_data[d] = gradOutput_data[d] - exp(output_data[d])*sum;
+      gradInput_data[d*stride] = gradOutput_data[d*stride] - exp(output_data[d*stride])*sum;
   }
 
   THTensor_(free)(gradOutput);
+  THTensor_(free)(output);
 }
 
 #endif