Spaces:

srinivasbilla
/

vc_chat

Running on Zero

srinivasbilla commited on 2 days ago

Commit

6f15984

verified ·

1 Parent(s): e39605b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,18 +12,18 @@ from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, WhisperTokeni
 from kokoro import KPipeline
 import soundfile as sf
 import subprocess
-subprocess.run(
-    "pip install flash-attn --no-build-isolation",
-    env={"FLASH_ATTENTION_SKIP_CUDA_BUILD": "TRUE"},
-    shell=True,
-)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16
 MODEL_NAME = "openai/whisper-large-v3-turbo"
 model = AutoModelForSpeechSeq2Seq.from_pretrained(
-    MODEL_NAME, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True, attn_implementation="flash_attention_2"
 )
 model.to(device)

 from kokoro import KPipeline
 import soundfile as sf
 import subprocess
+# subprocess.run(
+#     "pip install flash-attn --no-build-isolation",
+#     env={"FLASH_ATTENTION_SKIP_CUDA_BUILD": "TRUE"},
+#     shell=True,
+# )
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16
 MODEL_NAME = "openai/whisper-large-v3-turbo"
+#  attn_implementation="flash_attention_2"
 model = AutoModelForSpeechSeq2Seq.from_pretrained(
+    MODEL_NAME, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True,
 )
 model.to(device)