Spaces:

CineAI
/

Chelsea

Sleeping

CineAI commited on Mar 20, 2024

Commit

23b8975

verified ·

1 Parent(s): 3edbfec

Update audio2text/a2t.py

Files changed (1) hide show

audio2text/a2t.py CHANGED Viewed

@@ -14,16 +14,25 @@ class A2T:
     def __preprocces(self, audio, frame_rate):
         try:
             audio = audio / 32678.0
             if len(audio.shape) > 1:
                 audio = librosa.to_mono(audio.T)
             if frame_rate != 16_000:
                 audio = librosa.resample(audio, orig_sr=frame_rate, target_sr=16000)
             audio = audio[:16_000*LIMIT]
             audio = torch.tensor(audio)
             return audio
         except Exception as e:
             print("Preprocces error", e)
@@ -31,8 +40,7 @@ class A2T:
     def predict(self):
         if self.mic is not None:
-            audio = self.mic.get_array_of_samples()
-            audio = np.array(audio)
             frame_rate = self.mic.frame_rate
         else:
             return "please provide audio"

     def __preprocces(self, audio, frame_rate):
         try:
             audio = audio / 32678.0
+            print("Audio div : ", audio)
             if len(audio.shape) > 1:
                 audio = librosa.to_mono(audio.T)
+            print("Audio mono : ", audio)
             if frame_rate != 16_000:
                 audio = librosa.resample(audio, orig_sr=frame_rate, target_sr=16000)
+            print("Audio resample : ", audio)
             audio = audio[:16_000*LIMIT]
+            print("Audio cut : ", audio)
             audio = torch.tensor(audio)
+            print("Audio torch : ", audio)
             return audio
         except Exception as e:
             print("Preprocces error", e)
     def predict(self):
         if self.mic is not None:
+            audio = self.mic
             frame_rate = self.mic.frame_rate
         else:
             return "please provide audio"