Remove force CPU offload.

Signed-off-by: Dennis Liu <[email protected]>
NVIDIA · Feb 13, 2025 · 6a2d88a · 6a2d88a
1 parent 3ffd732
commit 6a2d88a
Showing 1 changed file with 7 additions and 3 deletions.
diff --git a/transformer_engine/pytorch/cpu_offload.py b/transformer_engine/pytorch/cpu_offload.py
@@ -381,7 +381,6 @@ def bulk_offload_group(self, group_to_offload):
                     if self.tensor_need_offloading_checker(tensor_on_device):
                         state = SynchronizedGroupOffloadHandler.offload(tensor_on_device)
                         self.tensor_tag_to_state[tensor_tag] = state
-                        tensor_on_device.data = torch.Tensor()  # Force to release memory
 
     def synchronize_on_group_commit_forward(self, current_group):
         """Synchronize on group commit forward."""
@@ -517,9 +516,14 @@ def tensor_need_offloading_checker_all(tensor):
             "mentioned what to offload (weights/activations)"
         )
 
-    cpu_offload_handler = AsyncDoubleBufferGroupOffloadHandler(
+    # cpu_offload_handler = AsyncDoubleBufferGroupOffloadHandler(
+    #     num_offload_group=num_layers,
+    #     num_model_group=model_layers,
+    #     tensor_need_offloading_checker=tensor_need_offloading_checker,
+    # )
+
+    cpu_offload_handler = SynchronizedGroupOffloadHandler(
         num_offload_group=num_layers,
-        num_model_group=model_layers,
         tensor_need_offloading_checker=tensor_need_offloading_checker,
     )