Spaces:

CineAI
/

Chelsea

Sleeping

CineAI commited on Mar 21, 2024

Commit

fd86276

verified ·

1 Parent(s): 204958c

Update audio2text/a2t.py

Files changed (1) hide show

audio2text/a2t.py CHANGED Viewed

@@ -40,15 +40,14 @@ class A2T:
     def predict(self):
         if self.mic is not None:
-            audio = self.mic.get_array_of_samples()
-            audio = np.array(audio)
-            frame_rate = self.mic.frame_rate
         else:
             return "please provide audio"
         try:
             forced_decoder_ids = processor.get_decoder_prompt_ids(language="english", task="transcribe")
-            audio = self.__preprocces(audio=audio, frame_rate=frame_rate)
             inputs = processor(audio=audio, sampling_rate=16000, return_tensors="pt")
             predicted_ids = model.generate(**inputs, max_length=400, forced_decoder_ids=forced_decoder_ids)
             transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)

     def predict(self):
         if self.mic is not None:
+            audio = self.mic
+            # frame_rate = self.mic.frame_rate
         else:
             return "please provide audio"
         try:
             forced_decoder_ids = processor.get_decoder_prompt_ids(language="english", task="transcribe")
+            # audio = self.__preprocces(audio=audio, frame_rate=frame_rate)
             inputs = processor(audio=audio, sampling_rate=16000, return_tensors="pt")
             predicted_ids = model.generate(**inputs, max_length=400, forced_decoder_ids=forced_decoder_ids)
             transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)