InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 #3890

zhengxingmao · 2025-04-15T12:01:13Z

输入的是视频数据，5秒一段，数据格式是多选题。训练命令如下：
CUDA_VISIBLE_DEVICES=0,1,2,3
VIDEO_MAX_PIXELS=50176
VIDEO_SEGMENTS=8
swift sft
--model internvl3
--dataset dataset_internvl
--train_type lora
--torch_dtype bfloat16
--num_train_epochs 1
--per_device_train_batch_size 1
--per_device_eval_batch_size 1
--learning_rate 2e-6
--lora_rank 8
--lora_alpha 32
--freeze_llm true
--freeze_vit false
--gradient_accumulation_steps $(expr 16 / $nproc_per_node)
--eval_steps 50
--save_steps 50
--save_total_limit 2
--logging_steps 5
--max_length 2048
--output_dir output
--warmup_ratio 0.15
--dataloader_num_workers 4
--deepspeed zero3

Jintao-Huang · 2025-04-16T07:39:38Z

建议 freeze_llm false

zhengxingmao · 2025-04-16T11:58:42Z

感谢你的回复，freeze_llm false 的意义是什么呢？特别是对应新场景来说

zhengxingmao changed the title ~~InternVL3 lora 解冻vit，freeze llm，训练新场景时，eval_acc 一直很低~~ InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 Apr 15, 2025

zhengxingmao closed this as completed Apr 21, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 #3890

InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 #3890

zhengxingmao commented Apr 15, 2025

Jintao-Huang commented Apr 16, 2025

zhengxingmao commented Apr 16, 2025

InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 #3890

InternVL3 lora 训练时解冻vit，freeze llm，训练新场景时，eval_acc 一直很低 #3890

Comments

zhengxingmao commented Apr 15, 2025

Jintao-Huang commented Apr 16, 2025

zhengxingmao commented Apr 16, 2025