add constant fold

lanluo-nvidia · lanluo-nvidia · commit 5a2213ed2538 · 2025-05-01T20:45:33.000-07:00
diff --git a/py/torch_tensorrt/dynamo/conversion/impl/quantize.py b/py/torch_tensorrt/dynamo/conversion/impl/quantize.py
@@ -108,12 +108,11 @@ def dynamic_block_quantize(
         # Add Q node
         dynamic_quantize_layer = ctx.net.add_dynamic_quantize(
             input_tensor,
-            axis=-1,
-            block_size=16,
-            output_type=trt.DataType.FP4,
-            scale_type=trt.DataType.FP8,
+            -1,
+            16,
+            trt.DataType.FP4,
+            trt.DataType.FP8,
         )
-        dynamic_quantize_layer.set_output_type(0, trt.DataType.FP4)
 
         set_layer_name(
             dynamic_quantize_layer, target, name + "_dynamic_quantize", source_ir
diff --git a/py/torch_tensorrt/dynamo/lowering/passes/constant_folding.py b/py/torch_tensorrt/dynamo/lowering/passes/constant_folding.py
@@ -101,4 +101,9 @@ def __init__(self, *args: Any, **kwargs: Any) -> None:
 
     # TODO: Update this function when quantization is added
     def is_impure(self, node: torch.fx.node.Node) -> bool:
+        if node.target in (
+            torch.ops.tensorrt.quantize_op.default,
+            torch.ops.tensorrt.dynamic_block_quantize_op.default,
+        ):
+            return True
         return False