correct the use of all_reduce (PaddlePaddle#7108) (PaddlePaddle#7199)

yghstill · web-flow · commit b0620a7b8782 · 2022-10-26T20:36:24.000+08:00
diff --git a/ppdet/modeling/heads/gfl_head.py b/ppdet/modeling/heads/gfl_head.py
@@ -388,12 +388,7 @@ def get_loss(self, gfl_head_outs, gt_meta):
 
         avg_factor = sum(avg_factor)
         try:
-            avg_factor_clone = avg_factor.clone()
-            tmp_avg_factor = paddle.distributed.all_reduce(avg_factor_clone)
-            if tmp_avg_factor is not None:
-                avg_factor = tmp_avg_factor
-            else:
-                avg_factor = avg_factor_clone
+            paddle.distributed.all_reduce(avg_factor)
             avg_factor = paddle.clip(
                 avg_factor / paddle.distributed.get_world_size(), min=1)
         except:
diff --git a/ppdet/modeling/heads/simota_head.py b/ppdet/modeling/heads/simota_head.py
@@ -179,15 +179,8 @@ def get_loss(self, head_outs, gt_meta):
                                                    num_level_anchors)
         num_total_pos = sum(pos_num_l)
         try:
-            cloned_num_total_pos = num_total_pos.clone()
-            reduced_cloned_num_total_pos = paddle.distributed.all_reduce(
-                cloned_num_total_pos)
-            if reduced_cloned_num_total_pos is not None:
-                num_total_pos = reduced_cloned_num_total_pos / paddle.distributed.get_world_size(
-                )
-            else:
-                num_total_pos = cloned_num_total_pos / paddle.distributed.get_world_size(
-                )
+            paddle.distributed.all_reduce(num_total_pos)
+            num_total_pos = num_total_pos / paddle.distributed.get_world_size()
         except:
             num_total_pos = max(num_total_pos, 1)
 
@@ -262,12 +255,7 @@ def get_loss(self, head_outs, gt_meta):
 
         avg_factor = sum(avg_factor)
         try:
-            avg_factor_clone = avg_factor.clone()
-            tmp_avg_factor = paddle.distributed.all_reduce(avg_factor_clone)
-            if tmp_avg_factor is not None:
-                avg_factor = tmp_avg_factor
-            else:
-                avg_factor = avg_factor_clone
+            paddle.distributed.all_reduce(avg_factor)
             avg_factor = paddle.clip(
                 avg_factor / paddle.distributed.get_world_size(), min=1)
         except:
@@ -408,15 +396,8 @@ def get_loss(self, head_outs, gt_meta):
                                                    num_level_anchors)
         num_total_pos = sum(pos_num_l)
         try:
-            cloned_num_total_pos = num_total_pos.clone()
-            reduced_cloned_num_total_pos = paddle.distributed.all_reduce(
-                cloned_num_total_pos)
-            if reduced_cloned_num_total_pos is not None:
-                num_total_pos = reduced_cloned_num_total_pos / paddle.distributed.get_world_size(
-                )
-            else:
-                num_total_pos = cloned_num_total_pos / paddle.distributed.get_world_size(
-                )
+            paddle.distributed.all_reduce(num_total_pos)
+            num_total_pos = num_total_pos / paddle.distributed.get_world_size()
         except:
             num_total_pos = max(num_total_pos, 1)
 
@@ -494,12 +475,7 @@ def get_loss(self, head_outs, gt_meta):
 
         avg_factor = sum(avg_factor)
         try:
-            avg_factor_clone = avg_factor.clone()
-            tmp_avg_factor = paddle.distributed.all_reduce(avg_factor_clone)
-            if tmp_avg_factor is not None:
-                avg_factor = tmp_avg_factor
-            else:
-                avg_factor = avg_factor_clone
+            paddle.distributed.all_reduce(avg_factor)
             avg_factor = paddle.clip(
                 avg_factor / paddle.distributed.get_world_size(), min=1)
         except: