Spaces:

Solo448
/

SpeechT5-TTS-BN

Running

Solo448 commited on 18 days ago

Commit

e500175

•

1 Parent(s): 43606fe

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,13 +19,7 @@ speaker_model = EncoderClassifier.from_hparams(
     savedir=os.path.join("/tmp", "speechbrain/spkrec-xvect-voxceleb")
 )
-def create_speaker_embedding(waveform):
-    with torch.no_grad():
-        speaker_embeddings = speaker_model.encode_batch(torch.tensor(waveform))
-        speaker_embeddings = torch.nn.functional.normalize(speaker_embeddings, dim=2)
-        speaker_embeddings = speaker_embeddings.squeeze().cpu().numpy()
-    return speaker_embeddings
 # Load a sample from the dataset for speaker embedding
 try:
     dataset = load_dataset("Sajjo/bangala_data_v3", split="train", trust_remote_code=True)
@@ -37,6 +31,13 @@ except Exception as e:
     # Use a random speaker embedding as fallback
     speaker_embedding = torch.randn(1, 512)
 def text_to_speech(text):
     # Clean up text
     replacements = [

     savedir=os.path.join("/tmp", "speechbrain/spkrec-xvect-voxceleb")
 )
 # Load a sample from the dataset for speaker embedding
 try:
     dataset = load_dataset("Sajjo/bangala_data_v3", split="train", trust_remote_code=True)
     # Use a random speaker embedding as fallback
     speaker_embedding = torch.randn(1, 512)
+def create_speaker_embedding(waveform):
+    with torch.no_grad():
+        speaker_embeddings = speaker_model.encode_batch(torch.tensor(waveform))
+        speaker_embeddings = torch.nn.functional.normalize(speaker_embeddings, dim=2)
+        speaker_embeddings = speaker_embeddings.squeeze().cpu().numpy()
+    return speaker_embeddings
 def text_to_speech(text):
     # Clean up text
     replacements = [