update name

PaddlePaddle · chang-wenbin · Mar 30, 2025 · Apr 1, 2025 · Apr 1, 2025 · Apr 1, 2025
commit 9254cb4b83d797face5750e2284547a37281d10b
diff --git a/deploy/qwen2_5_vl/README.md b/deploy/qwen2_5_vl/README.md
@@ -60,7 +60,7 @@ python deploy/qwen2_5_vl/qwen2_5_vl_infer.py \
     --inference_model True \
     --mode dynamic \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --benchmark True
 ```
 
@@ -82,7 +82,7 @@ python deploy/qwen2_5_vl/qwen2_5_vl_infer.py \
     --inference_model True \
     --mode dynamic \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --quant_type "weight_only_int8" \
     --benchmark True
 ```
@@ -105,7 +105,7 @@ python -m paddle.distributed.launch --gpus "0,1,2,3" deploy/qwen2_5_vl/qwen2_5_v
     --mode dynamic \
     --append_attn 1 \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --benchmark True
 ```
 

diff --git a/deploy/qwen2_5_vl/scripts/qwen2_5_vl.sh b/deploy/qwen2_5_vl/scripts/qwen2_5_vl.sh
@@ -12,6 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
+export PYTHONPATH=/root/paddlejob/workspace/env_run/output/changwenbin/PaddleMIX/PaddleNLP
 
 export CUDA_VISIBLE_DEVICES=2
 export USE_FASTER_TOP_P_SAMPLING=1
@@ -33,7 +34,7 @@ python deploy/qwen2_5_vl/qwen2_5_vl_infer.py \
     --mode dynamic \
     --append_attn 1 \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --benchmark True
 
 
@@ -53,7 +54,7 @@ python deploy/qwen2_5_vl/qwen2_5_vl_infer.py \
 #     --inference_model True \
 #     --mode dynamic \
 #     --dtype bfloat16 \
-#     --enable_stream_output False \
+#     --output_via_mq False \
 #     --quant_type "weight_only_int8" \
 #     --benchmark True 
 
@@ -75,5 +76,5 @@ python deploy/qwen2_5_vl/qwen2_5_vl_infer.py \
 #     --mode dynamic \
 #     --append_attn 1 \
 #     --dtype bfloat16 \
-#     --enable_stream_output False \
+#     --output_via_mq False \
 #     --benchmark True 
diff --git a/deploy/qwen2_vl/README.md b/deploy/qwen2_vl/README.md
@@ -50,7 +50,7 @@ python deploy/qwen2_vl/single_image_infer.py\
     --inference_model True \
     --mode dynamic \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --benchmark True
 
 ### 3.2. 文本&视频输入高性能推理

diff --git a/deploy/qwen2_vl/scripts/qwen2_vl.sh b/deploy/qwen2_vl/scripts/qwen2_vl.sh
@@ -12,6 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
+export PYTHONPATH=/root/paddlejob/workspace/env_run/output/changwenbin/PaddleMIX/PaddleNLP
 
 export CUDA_VISIBLE_DEVICES=0
 #fp16  高性能推理
@@ -29,7 +30,7 @@ python deploy/qwen2_vl/single_image_infer.py\
     --inference_model True \
     --mode dynamic \
     --dtype bfloat16 \
-    --enable_stream_output False \
+    --output_via_mq False \
     --benchmark True 
 
 
@@ -49,7 +50,7 @@ python deploy/qwen2_vl/single_image_infer.py\
 #     --inference_model True \
 #     --mode dynamic \
 #     --dtype bfloat16 \
-#     --enable_stream_output False \
+#     --output_via_mq False \
 #     --quant_type "weight_only_int8" \
 #     --benchmark True
 
@@ -69,5 +70,5 @@ python deploy/qwen2_vl/single_image_infer.py\
 #     --inference_model True \
 #     --mode dynamic \
 #     --dtype bfloat16 \
-#     --enable_stream_output False \
+#     --output_via_mq False \
 #     --benchmark True