Remove tokenizer parameter from SFTTrainer instantiation

qgallouedec · qgallouedec · commit 09f7eb0f034d · 2025-09-12T15:47:26.000-06:00
diff --git a/notebooks/1/4.ipynb b/notebooks/1/4.ipynb
@@ -1944,7 +1944,7 @@
     },
     {
       "cell_type": "code",
-      "execution_count": 36,
+      "execution_count": null,
       "metadata": {
         "colab": {
           "base_uri": "https://localhost:8080/",
@@ -2384,7 +2384,6 @@
         "    model=model,\n",
         "    args=sft_config,\n",
         "    train_dataset=train_dataset,\n",
-        "    tokenizer=tokenizer,\n",
         "    peft_config=peft_config,\n",
         "    packing=True,\n",
         "    dataset_kwargs={\n",
diff --git a/units/en/unit1/3.md b/units/en/unit1/3.md
@@ -289,7 +289,6 @@ from trl import SFTTrainer
 
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
     train_dataset=dataset["train"],
     args=config,
 )
@@ -504,7 +503,6 @@ config = SFTConfig(
 # Train!
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
     train_dataset=dataset["train"],
     args=config,
 )
diff --git a/units/en/unit1/3a.md b/units/en/unit1/3a.md
@@ -142,7 +142,6 @@ trainer = SFTTrainer(
     model=model,
     args=SFTConfig(output_dir="lora-adapter", num_train_epochs=1, per_device_train_batch_size=2),
     train_dataset=dataset["train"],
-    tokenizer=tokenizer,
     peft_config=peft_config,
     packing=True,
 )
diff --git a/units/en/unit1/4.md b/units/en/unit1/4.md
@@ -1186,7 +1186,6 @@ from trl import SFTTrainer
 
 lora_trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
     train_dataset=formatted_dataset,  # dataset with a "text" field or messages + dataset_text_field in config
     args=training_config,
     peft_config=peft_config,  # << enable LoRA
@@ -1204,7 +1203,6 @@ We instantiate the trainer, capture a pre-training baseline generation, launch `
 
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
     train_dataset=dataset["train"],
     args=config,
 )
diff --git a/units/en/unit1/5.md b/units/en/unit1/5.md
@@ -64,7 +64,6 @@ config = SFTConfig(
 # Train
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
     train_dataset=dataset["train"],
     args=config,
 )
diff --git a/v1/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -279,7 +279,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # LoRA configuration\n",
     "    max_seq_length=max_seq_length,  # Maximum sequence length\n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # Enable input packing for efficiency\n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # Special tokens handled by template\n",
diff --git a/v1/5_vision_language_models/notebooks/vlm_sft_sample.ipynb b/v1/5_vision_language_models/notebooks/vlm_sft_sample.ipynb
@@ -369,7 +369,6 @@
     "    eval_dataset=ds[\"test\"],\n",
     "    data_collator=collate_fn,\n",
     "    peft_config=peft_config,\n",
-    "    tokenizer=processor.tokenizer,\n",
     ")\n",
     "\n",
     "# TODO: 🦁 🐕 align the SFTTrainer params with your chosen dataset. For example, if you are using the `bigcode/the-stack-smol` dataset, you will need to choose the `content` column`"
diff --git a/v1/es/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb b/v1/es/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb
@@ -168,7 +168,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/es/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/es/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -279,7 +279,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # Configuración LoRA\n",
     "    max_seq_length=max_seq_length,  # Longitud máxima de la secuencia\n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # Habilita el empaquetado de entrada para mayor eficiencia\n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # Los tokens especiales son manejados por la plantilla\n",
diff --git a/v1/ja/1_instruction_tuning/notebooks/chat_templates_example.ipynb b/v1/ja/1_instruction_tuning/notebooks/chat_templates_example.ipynb
@@ -168,7 +168,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/ja/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb b/v1/ja/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb
@@ -168,7 +168,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/ja/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/ja/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -279,7 +279,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # LoRA設定\n",
     "    max_seq_length=max_seq_length,  # 最大シーケンス長\n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # 効率のために入力パッキングを有効化\n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # テンプレートで処理される特殊トークン\n",
diff --git a/v1/ko/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb b/v1/ko/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb
@@ -164,7 +164,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/ko/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/ko/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -280,7 +280,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # LoRA configuration\n",
     "    max_seq_length=max_seq_length,  # 최대 시퀀스 길이\n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # 효율성을 위해 입력 패킹 활성화\n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # 템플릿에서 추가 토큰 처리\n",
diff --git a/v1/pt-br/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb b/v1/pt-br/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb
@@ -166,7 +166,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/pt-br/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/pt-br/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -280,7 +280,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # LoRA configuration\n",
     "    max_seq_length=max_seq_length,  # Maximum sequence length\n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # Enable input packing for efficiency\n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # Special tokens handled by template\n",
diff --git a/v1/vi/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb b/v1/vi/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb
@@ -183,7 +183,6 @@
     "    model=model,\n",
     "    args=sft_config,\n",
     "    train_dataset=ds[\"train\"],\n",
-    "    tokenizer=tokenizer,\n",
     "    eval_dataset=ds[\"test\"],\n",
     ")\n",
     "\n",
diff --git a/v1/vi/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb b/v1/vi/3_parameter_efficient_finetuning/notebooks/finetune_sft_peft.ipynb
@@ -278,7 +278,6 @@
     "    train_dataset=dataset[\"train\"],\n",
     "    peft_config=peft_config,  # Cấu hình LoRA\n",
     "    max_seq_length=max_seq_length,  # Độ dài chuỗi tối đa \n",
-    "    tokenizer=tokenizer,\n",
     "    packing=True,  # Bật đóng gói đầu vào cho hiệu quả \n",
     "    dataset_kwargs={\n",
     "        \"add_special_tokens\": False,  # Token đặc biệt được xử lý bởi template\n",
diff --git a/v1/vi/5_vision_language_models/notebooks/vlm_sft_sample.ipynb b/v1/vi/5_vision_language_models/notebooks/vlm_sft_sample.ipynb
@@ -368,7 +368,6 @@
     "    eval_dataset=ds[\"test\"],\n",
     "    data_collator=collate_fn,\n",
     "    peft_config=peft_config,\n",
-    "    tokenizer=processor.tokenizer,\n",
     ")\n",
     "\n",
     "# TODO: 🦁 🐕 điều chỉnh các tham số SFTTrainer với tập dữ liệu bạn đã chọn. Ví dụ: nếu bạn đang sử dụng tập dữ liệu `bigcode/the-stack-smol`, bạn sẽ cần chọn cột `content`"

Original file line number	Diff line number	Diff line change
`@@ -289,7 +289,6 @@ from trl import SFTTrainer`
`289`	`289`
`290`	`290`	`trainer = SFTTrainer(`
`291`	`291`	`model=model,`
`292`		`- tokenizer=tokenizer,`
`293`	`292`	`train_dataset=dataset["train"],`
`294`	`293`	`args=config,`
`295`	`294`	`)`
`@@ -504,7 +503,6 @@ config = SFTConfig(`
`504`	`503`	`# Train!`
`505`	`504`	`trainer = SFTTrainer(`
`506`	`505`	`model=model,`
`507`		`- tokenizer=tokenizer,`
`508`	`506`	`train_dataset=dataset["train"],`
`509`	`507`	`args=config,`
`510`	`508`	`)`
Original file line number	Diff line number	Diff line change
`@@ -142,7 +142,6 @@ trainer = SFTTrainer(`
`142`	`142`	`model=model,`
`143`	`143`	`args=SFTConfig(output_dir="lora-adapter", num_train_epochs=1, per_device_train_batch_size=2),`
`144`	`144`	`train_dataset=dataset["train"],`
`145`		`- tokenizer=tokenizer,`
`146`	`145`	`peft_config=peft_config,`
`147`	`146`	`packing=True,`
`148`	`147`	`)`
Original file line number	Diff line number	Diff line change
`@@ -64,7 +64,6 @@ config = SFTConfig(`
`64`	`64`	`# Train`
`65`	`65`	`trainer = SFTTrainer(`
`66`	`66`	`model=model,`
`67`		`- tokenizer=tokenizer,`
`68`	`67`	`train_dataset=dataset["train"],`
`69`	`68`	`args=config,`
`70`	`69`	`)`