Spaces:

m6011
/

Najdi_TTS_Project

Build error

App Files Files Community

m6011 commited on 19 days ago

Commit

771feaa

•

1 Parent(s): e2e4659

Update train.py

Browse files

Files changed (1) hide show

train.py +6 -7

train.py CHANGED Viewed

@@ -1,14 +1,11 @@
-# train.py
 import os
 import shutil
 from espnet2.bin.tts_train import TTSTrainer
 from espnet2.tasks.tts import TTSTask
-from espnet_model_zoo.downloader import ModelDownloader
 from datasets import load_dataset
 import yaml
-# تحميل بيانات sada2022
 dataset = load_dataset("m6011/sada2022")
 # تقسيم البيانات إلى تدريب وتحقق
@@ -19,7 +16,7 @@ valid_data = dataset['test']
 os.makedirs('data/train', exist_ok=True)
 os.makedirs('data/valid', exist_ok=True)
-# حفظ البيانات في ملفات نصية
 with open('data/train/wav.scp', 'w', encoding='utf-8') as wav_scp, \
      open('data/train/text', 'w', encoding='utf-8') as text_file:
     for idx, sample in enumerate(train_data):
@@ -42,7 +39,7 @@ with open('data/valid/wav.scp', 'w', encoding='utf-8') as wav_scp, \
 config_path = 'conf/train.yaml'
 os.makedirs('conf', exist_ok=True)
-# يمكنك تخصيص إعدادات التدريب هنا أو استخدام الإعدادات الافتراضية
 config = {
     'output_dir': 'exp/tts_fastspeech2',
     'token_type': 'char',
@@ -77,9 +74,10 @@ def generate_token_list(text_files, output_file):
         for token in tokens:
             f.write(f'{token}\n')
 generate_token_list(['data/train/text', 'data/valid/text'], 'tokens.txt')
-# بدء عملية التدريب
 train_args = [
     '--config', 'conf/train.yaml',
     '--use_preprocessor', 'true',
@@ -92,4 +90,5 @@ train_args = [
     '--output_dir', 'exp/tts_fastspeech2',
 ]
 TTSTask.main(train_args)

 import os
 import shutil
 from espnet2.bin.tts_train import TTSTrainer
 from espnet2.tasks.tts import TTSTask
 from datasets import load_dataset
 import yaml
+# تحميل بيانات sada2022 من Hugging Face Datasets
 dataset = load_dataset("m6011/sada2022")
 # تقسيم البيانات إلى تدريب وتحقق
 os.makedirs('data/train', exist_ok=True)
 os.makedirs('data/valid', exist_ok=True)
+# حفظ البيانات في ملفات نصية (wav.scp و text)
 with open('data/train/wav.scp', 'w', encoding='utf-8') as wav_scp, \
      open('data/train/text', 'w', encoding='utf-8') as text_file:
     for idx, sample in enumerate(train_data):
 config_path = 'conf/train.yaml'
 os.makedirs('conf', exist_ok=True)
+# إعدادات التدريب
 config = {
     'output_dir': 'exp/tts_fastspeech2',
     'token_type': 'char',
         for token in tokens:
             f.write(f'{token}\n')
+# توليد قائمة التوكينات (tokens.txt)
 generate_token_list(['data/train/text', 'data/valid/text'], 'tokens.txt')
+# إعداد التدريب
 train_args = [
     '--config', 'conf/train.yaml',
     '--use_preprocessor', 'true',
     '--output_dir', 'exp/tts_fastspeech2',
 ]
+# بدء عملية التدريب
 TTSTask.main(train_args)