Spaces:

WhiteAngelss
/

turkce-varlik-tanima-teknofest-nlp

Sleeping

App Files Files Community

ihsan66 commited on Jul 31

Commit

259780b

•

1 Parent(s): d5d6be1

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -49

app.py CHANGED Viewed

@@ -6,7 +6,8 @@ import io
 import torch
 import torchaudio
 import librosa
-from transformers import Wav2Vec2ForCTC, Wav2Vec2FeatureExtractor
 st.set_page_config(layout="wide")
 # Örnek metin listesi
@@ -35,10 +36,6 @@ st.sidebar.write("")
 if model_checkpoint == "akdeniz27/xlm-roberta-base-turkish-ner":
     aggregation = "simple"
-elif model_checkpoint in ["xlm-roberta-large-finetuned-conll03-english", "asahi417/tner-xlm-roberta-base-ontonotes5"]:
-    aggregation = "simple"
-    st.sidebar.write("")
-    st.sidebar.write("The selected NER model is included just to show the zero-shot transfer learning capability of XLM-Roberta pretrained language model.")
 else:
     aggregation = "first"
@@ -47,24 +44,19 @@ st.subheader("Metin Giriş Yöntemi Seç")
 input_method = st.radio("", ('Örneklerden Seç', 'Metin Yaz veya Yapıştır', 'Dosya Yükle', 'Ses Dosyası Yükle'))
 if input_method == 'Örneklerden Seç':
-    selected_text = st.selectbox('Metin Seç', example_list, index=0, key=1)
-    st.subheader("Seçilen Metin")
-    input_text = st.text_area("Metin", selected_text, height=128, max_chars=None, key=2)
 elif input_method == "Metin Yaz veya Yapıştır":
-    st.subheader("Metin")
-    input_text = st.text_area('Metin Yaz veya Yapıştır', value="", height=128, max_chars=None, key=2)
 elif input_method == "Dosya Yükle":
-    st.subheader("Metin")
     uploaded_file = st.file_uploader("Dosya Seç", type="txt")
     if uploaded_file is not None:
         input_text = str(uploaded_file.read(), "utf-8")
     else:
         input_text = ""
 elif input_method == "Ses Dosyası Yükle":
-    st.subheader("Ses Dosyası")
-    uploaded_audio = st.file_uploader("Ses Dosyasını Seç", type=["wav"])
-    if uploaded_audio is not None:
-        audio_bytes = uploaded_audio.read()
 @st.cache_resource
 def load_pipeline(model_name, task_type):
@@ -110,56 +102,33 @@ def entity_comb(output):
             output_comb.append(entity)
     return output_comb
 # Ses dosyasını metne çevirme fonksiyonu
 def transcribe_audio(audio_file):
-    # Wav2Vec2 model ve processor yükleme
     processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
     model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
-    # Ses dosyasını yükleme
-    audio_input = io.BytesIO(audio_file.read())
-    # Torchaudio ile ses dosyasını okuma
     waveform, sample_rate = torchaudio.load(audio_input, normalize=True)
-    # Ses verisini işleme
     inputs = processor(waveform.squeeze().numpy(), sampling_rate=sample_rate, return_tensors="pt", padding="longest")
-    # Model ile tahmin yapma
     with torch.no_grad():
         logits = model(inputs.input_values).logits
-    # Tahmin sonuçlarını çözme
     predicted_ids = torch.argmax(logits, dim=-1)
     transcription = processor.batch_decode(predicted_ids)[0]
     return transcription
-Run_Button = st.button("Çalıştır", key=None)
-# Metin giriş yöntemi
-st.subheader("Metin Giriş Yöntemi Seç")
-input_method = st.radio("", ('Metin Yaz veya Yapıştır', 'Ses Dosyası Yükle'), key="input_method_radio")
-if input_method == "Metin Yaz veya Yapıştır":
-    st.subheader("Metin Girişi")
-    input_text = st.text_area("Metni buraya yazın veya yapıştırın:", key="text_input_area")
-    if input_text != "":
-        st.subheader("Girdiğiniz Metin")
-        st.write(input_text)
-elif input_method == "Ses Dosyası Yükle":
-    st.subheader("Ses Dosyası")
-    uploaded_audio = st.file_uploader("Ses Dosyasını Seç", type=["wav"], key="audio_file_uploader")
-    if uploaded_audio is not None:
         transcription = transcribe_audio(uploaded_audio)
         st.subheader("Ses Transkripsiyonu")
         st.write(transcription)
-    elif input_text != "":
         if task == "Metin Sınıflandırma":
             pipeline_model = load_pipeline(model_checkpoint, task)
             output = pipeline_model(input_text)
@@ -185,10 +154,7 @@ elif input_method == "Ses Dosyası Yükle":
             st.dataframe(df_final)
             st.subheader("Spacy Tarzı Görselleştirme")
-            spacy_display = {}
-            spacy_display["ents"] = []
-            spacy_display["text"] = input_text
-            spacy_display["title"] = None
             for entity in output_comb:
                 spacy_display["ents"].append({"start": entity["start"], "end": entity["end"], "label": entity["entity_group"]})

 import torch
 import torchaudio
 import librosa
+from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 st.set_page_config(layout="wide")
 # Örnek metin listesi
 if model_checkpoint == "akdeniz27/xlm-roberta-base-turkish-ner":
     aggregation = "simple"
 else:
     aggregation = "first"
 input_method = st.radio("", ('Örneklerden Seç', 'Metin Yaz veya Yapıştır', 'Dosya Yükle', 'Ses Dosyası Yükle'))
 if input_method == 'Örneklerden Seç':
+    selected_text = st.selectbox('Metin Seç', example_list, index=0, key="example_selectbox")
+    input_text = st.text_area("Metin", selected_text, height=128, key="text_area")
 elif input_method == "Metin Yaz veya Yapıştır":
+    input_text = st.text_area('Metin Yaz veya Yapıştır', value="", height=128, key="text_area")
 elif input_method == "Dosya Yükle":
     uploaded_file = st.file_uploader("Dosya Seç", type="txt")
     if uploaded_file is not None:
         input_text = str(uploaded_file.read(), "utf-8")
     else:
         input_text = ""
 elif input_method == "Ses Dosyası Yükle":
+    uploaded_audio = st.file_uploader("Ses Dosyasını Seç", type=["wav"], key="audio_file_uploader")
+    audio_bytes = uploaded_audio.read() if uploaded_audio is not None else None
 @st.cache_resource
 def load_pipeline(model_name, task_type):
             output_comb.append(entity)
     return output_comb
 # Ses dosyasını metne çevirme fonksiyonu
 def transcribe_audio(audio_file):
     processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
     model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
+    audio_input = io.BytesIO(audio_file)
     waveform, sample_rate = torchaudio.load(audio_input, normalize=True)
     inputs = processor(waveform.squeeze().numpy(), sampling_rate=sample_rate, return_tensors="pt", padding="longest")
     with torch.no_grad():
         logits = model(inputs.input_values).logits
     predicted_ids = torch.argmax(logits, dim=-1)
     transcription = processor.batch_decode(predicted_ids)[0]
     return transcription
+# Çalıştır butonu
+if st.button("Çalıştır"):
+    if input_method == "Ses Dosyası Yükle" and uploaded_audio is not None:
         transcription = transcribe_audio(uploaded_audio)
         st.subheader("Ses Transkripsiyonu")
         st.write(transcription)
+    elif input_method in ["Metin Yaz veya Yapıştır", "Örneklerden Seç", "Dosya Yükle"] and input_text:
+        task = st.sidebar.radio("Görev Seçin", ['Metin Sınıflandırma', 'Metin Analizi', 'Duygu Analizi', 'Metin Oluşturma'])
         if task == "Metin Sınıflandırma":
             pipeline_model = load_pipeline(model_checkpoint, task)
             output = pipeline_model(input_text)
             st.dataframe(df_final)
             st.subheader("Spacy Tarzı Görselleştirme")
+            spacy_display = {"ents": [], "text": input_text, "title": None}
             for entity in output_comb:
                 spacy_display["ents"].append({"start": entity["start"], "end": entity["end"], "label": entity["entity_group"]})