image_to_video

Running

aiqcamp commited on Dec 22, 2024

Commit

b1e6cb0

verified ·

1 Parent(s): 9002f84

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,25 +25,10 @@ from mmaudio.model.flow_matching import FlowMatching
 from mmaudio.model.networks import MMAudio, get_my_mmaudio
 from mmaudio.model.sequence_config import SequenceConfig
 from mmaudio.model.utils.features_utils import FeaturesUtils
-# 오디오 모델 설정
-device = 'cuda'
-dtype = torch.bfloat16
-model: ModelConfig = all_model_cfg['large_44k_v2']
-model.download_if_needed()
-output_dir = Path('./output/gradio')
-setup_eval_logging()
-net, feature_utils, seq_cfg = get_model()  # get_model 함수는 이전에 제공된 코드 사용
-# 로깅 설정
-logging.basicConfig(level=logging.INFO)
-logger = logging.getLogger(__name__)
-# API 설정
-CATBOX_USER_HASH = "30f52c895fd9d9cb387eee489"
-REPLICATE_API_TOKEN = os.getenv("API_KEY")
 def get_model() -> tuple[MMAudio, FeaturesUtils, SequenceConfig]:
     seq_cfg = model.seq_cfg
@@ -61,6 +46,28 @@ def get_model() -> tuple[MMAudio, FeaturesUtils, SequenceConfig]:
     return net, feature_utils, seq_cfg
 @spaces.GPU(duration=120)
 @torch.inference_mode()
 def video_to_audio(video_path: str, prompt: str, negative_prompt: str = "music",

 from mmaudio.model.networks import MMAudio, get_my_mmaudio
 from mmaudio.model.sequence_config import SequenceConfig
 from mmaudio.model.utils.features_utils import FeaturesUtils
+# 먼저 get_model 함수 정의
 def get_model() -> tuple[MMAudio, FeaturesUtils, SequenceConfig]:
     seq_cfg = model.seq_cfg
     return net, feature_utils, seq_cfg
+# 그 다음 모델 설정 및 초기화
+device = 'cuda'
+dtype = torch.bfloat16
+model: ModelConfig = all_model_cfg['large_44k_v2']
+model.download_if_needed()
+output_dir = Path('./output/gradio')
+setup_eval_logging()
+net, feature_utils, seq_cfg = get_model()
+# 로깅 설정
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# API 설정
+CATBOX_USER_HASH = "30f52c895fd9d9cb387eee489"
+REPLICATE_API_TOKEN = os.getenv("API_KEY")
 @spaces.GPU(duration=120)
 @torch.inference_mode()
 def video_to_audio(video_path: str, prompt: str, negative_prompt: str = "music",