Update app.py
Browse files
app.py
CHANGED
@@ -104,22 +104,28 @@ def entity_comb(output):
|
|
104 |
|
105 |
# Ses dosyasını metne çevirme fonksiyonu
|
106 |
def transcribe_audio(audio_file):
|
107 |
-
|
|
|
108 |
model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
|
109 |
|
|
|
110 |
audio_input = io.BytesIO(audio_file)
|
111 |
waveform, sample_rate = torchaudio.load(audio_input, normalize=True)
|
112 |
|
|
|
113 |
inputs = processor(waveform.squeeze().numpy(), sampling_rate=sample_rate, return_tensors="pt", padding="longest")
|
114 |
|
|
|
115 |
with torch.no_grad():
|
116 |
logits = model(inputs.input_values).logits
|
117 |
|
|
|
118 |
predicted_ids = torch.argmax(logits, dim=-1)
|
119 |
transcription = processor.batch_decode(predicted_ids)[0]
|
120 |
|
121 |
return transcription
|
122 |
|
|
|
123 |
# Çalıştır butonu
|
124 |
if st.button("Çalıştır"):
|
125 |
if input_method == "Ses Dosyası Yükle" and uploaded_audio is not None:
|
|
|
104 |
|
105 |
# Ses dosyasını metne çevirme fonksiyonu
|
106 |
def transcribe_audio(audio_file):
|
107 |
+
# Wav2Vec2 model ve feature extractor yükleme
|
108 |
+
processor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
|
109 |
model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
|
110 |
|
111 |
+
# Ses dosyasını yükleme
|
112 |
audio_input = io.BytesIO(audio_file)
|
113 |
waveform, sample_rate = torchaudio.load(audio_input, normalize=True)
|
114 |
|
115 |
+
# Ses verisini işleme
|
116 |
inputs = processor(waveform.squeeze().numpy(), sampling_rate=sample_rate, return_tensors="pt", padding="longest")
|
117 |
|
118 |
+
# Model ile tahmin yapma
|
119 |
with torch.no_grad():
|
120 |
logits = model(inputs.input_values).logits
|
121 |
|
122 |
+
# Tahmin sonuçlarını çözme
|
123 |
predicted_ids = torch.argmax(logits, dim=-1)
|
124 |
transcription = processor.batch_decode(predicted_ids)[0]
|
125 |
|
126 |
return transcription
|
127 |
|
128 |
+
|
129 |
# Çalıştır butonu
|
130 |
if st.button("Çalıştır"):
|
131 |
if input_method == "Ses Dosyası Yükle" and uploaded_audio is not None:
|