Merge branch 'main' into trl-dev

modelscope · hjh0119 · Apr 30, 2025 · Apr 23, 2025 · Apr 23, 2025 · Apr 23, 2025
commit 5285e70332dd9ee993af45b23901d4580bc14427
diff --git a/swift/llm/argument/infer_args.py b/swift/llm/argument/infer_args.py
@@ -78,6 +78,7 @@ class VllmArguments:
     use_async_engine: bool = True
     data_parallel_size: int = 1
     log_level: Literal['critical', 'error', 'warning', 'info', 'debug', 'trace'] = 'info'
+    vllm_quantization: Optional[str] = None
 
     def __post_init__(self):
         self.limit_mm_per_prompt = ModelArguments.parse_to_dict(self.limit_mm_per_prompt)