Spaces:

m6011
/

Najdi_TTS_Project

Build error

App Files Files Community

m6011 commited on 20 days ago

Commit

13cef53

•

1 Parent(s): 99d4e63

Create train.py

Browse files

Files changed (1) hide show

train.py +54 -0

train.py ADDED Viewed

	@@ -0,0 +1,54 @@

+import torch
+from torch.utils.data import DataLoader
+from datasets import load_dataset
+from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
+from transformers import Trainer, TrainingArguments
+# تحميل بيانات SADA
+dataset = load_dataset("m6011/sada2022")
+# تحميل نموذج Wav2Vec2 لتحويل الصوت إلى نص (يمكنك تغييره إذا كنت تود استخدام نموذج آخر)
+processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
+model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
+# معالجة البيانات - تحويل النص إلى رموز صوتية مناسبة (حسب النموذج المختار)
+def preprocess_data(batch):
+    audio = batch["audio"]
+    inputs = processor(audio["array"], sampling_rate=audio["sampling_rate"], return_tensors="pt", padding=True)
+    batch["input_values"] = inputs.input_values[0]
+    batch["attention_mask"] = inputs.attention_mask[0]
+    # تحويل النص إلى رموز
+    with processor.as_target_processor():
+        batch["labels"] = processor(batch["ProcessedText"]).input_ids
+    return batch
+# تطبيق المعالجة المسبقة على البيانات
+dataset = dataset.map(preprocess_data, remove_columns=["audio", "ProcessedText"])
+# إعدادات التدريب
+training_args = TrainingArguments(
+    output_dir="./wav2vec2-saudi-tts",
+    group_by_length=True,
+    per_device_train_batch_size=4,
+    evaluation_strategy="steps",
+    num_train_epochs=3,
+    save_steps=400,
+    eval_steps=400,
+    logging_steps=400,
+    learning_rate=3e-4,
+    warmup_steps=500,
+    save_total_limit=2,
+)
+# إعداد المدرب
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=dataset["train"],
+    eval_dataset=dataset["test"],
+    tokenizer=processor.feature_extractor,
+)
+# بدء التدريب
+trainer.train()