Spaces:

amanmibra
/

void-demo-aisf

Runtime error

App Files Files Community

amanmibra commited on May 21, 2023

Commit

0c3ff42

1 Parent(s): 40f7298

Add modal pipelines

Browse files

Files changed (3) hide show

pipelines/example.py +34 -0
pipelines/images.py +21 -0
pipelines/train.py +147 -0

pipelines/example.py ADDED Viewed

	@@ -0,0 +1,34 @@

+# # PyTorch with CUDA GPU support
+#
+# This example shows how you can use CUDA GPUs in Modal, with a minimal PyTorch
+# image. You can specify GPU requirements in the `stub.function` decorator.
+import time
+import modal
+stub = modal.Stub(
+    "example-import-torch",
+    image=modal.Image.debian_slim().pip_install(
+        "torch", find_links="https://download.pytorch.org/whl/cu116"
+    ),
+)
+@stub.function(gpu="any")
+def gpu_function():
+    import subprocess
+    import torch
+    subprocess.run(["nvidia-smi"])
+    print("Torch version:", torch.__version__)
+    print("CUDA available:", torch.cuda.is_available())
+    print("CUDA device count:", torch.cuda.device_count())
+if __name__ == "__main__":
+    t0 = time.time()
+    with stub.run():
+        gpu_function.call()
+    print("Full time spent:", time.time() - t0)

pipelines/images.py ADDED Viewed

	@@ -0,0 +1,21 @@

+from modal import Image
+training_image_conda = (
+    Image.conda()
+    .conda_install(
+        "pytorch::pytorch",
+        "torchaudio",
+        "pandas",
+        channels=["conda-forge"]
+    )
+)
+training_image_pip = (
+    Image.debian_slim(python_version="3.9")
+    .pip_install(
+        "torch==2.0.0",
+        "torchaudio==2.0.0",
+        "pandas",
+        "tqdm",
+    )
+)

pipelines/train.py ADDED Viewed

	@@ -0,0 +1,147 @@

+import sys
+sys.path.append('..')
+# torch
+import torch
+import torchaudio
+from torch import nn
+from torch.utils.data import DataLoader
+# modal
+from modal import Mount, Stub, gpu, create_package_mounts
+# internal
+from pipelines.images import training_image_pip
+# model
+from dataset import VoiceDataset
+from cnn import CNNetwork
+# script defaults
+BATCH_SIZE = 128
+EPOCHS = 10
+LEARNING_RATE = 0.001
+TRAIN_FILE="data/train"
+TEST_FILE="data/test"
+SAMPLE_RATE=48000
+stub = Stub(
+    "void-training",
+    image=training_image_pip,
+)
+@stub.function(
+    gpu=gpu.A100(memory=20),
+    mounts=[
+        Mount.from_local_file(local_path='dataset.py'),
+        Mount.from_local_file(local_path='cnn.py'),
+    ],
+    timeout=EPOCHS * 60,
+)
+def train(
+        model,
+        train_dataloader,
+        loss_fn,
+        optimizer,
+        device,
+        epochs,
+    ):
+    import time
+    import torch
+    print("Begin model training...")
+    begin = time.time()
+    model = model.to(device)
+    # metrics
+    training_acc = []
+    training_loss = []
+    for i in range(epochs):
+        print(f"Epoch {i + 1}/{epochs}")
+        then = time.time()
+        # train model
+        train_epoch_loss, train_epoch_acc = train_epoch.call(model, train_dataloader, loss_fn, optimizer, device)
+        # training metrics
+        training_loss.append(train_epoch_loss/len(train_dataloader))
+        training_acc.append(train_epoch_acc/len(train_dataloader))
+        now = time.time()
+        print("Training Loss: {:.2f}, Training Accuracy: {:.2f}, Time: {:.2f}s".format(training_loss[i], training_acc[i], now - then))
+        print ("-------------------------------------------- \n")
+    end = time.time()
+    print("-------- Finished Training --------")
+    print("-------- Total Time -- {:.2f}s --------".format(end - begin))
+@stub.function(
+    gpu=gpu.A100(memory=20),
+    mounts=[
+        Mount.from_local_file(local_path='dataset.py'),
+        Mount.from_local_file(local_path='cnn.py'),
+    ]
+)
+def train_epoch(model, train_dataloader, loss_fn, optimizer, device):
+    import torch
+    from tqdm import tqdm
+    train_loss = 0.0
+    train_acc = 0.0
+    total = 0.0
+    model.train()
+    for wav, target in tqdm(train_dataloader):
+        wav, target = wav.to(device), target.to(device)
+        # calculate loss
+        output = model(wav)
+        loss = loss_fn(output, target)
+        # backprop and update weights
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+        # metrics
+        train_loss += loss.item()
+        prediction = torch.argmax(output, 1)
+        train_acc += (prediction == target).sum().item()/len(prediction)
+        total += 1
+    return train_loss, train_acc
+@stub.local_entrypoint()
+def main():
+    print("Initiating model training...")
+    device = "cpu"
+    # instantiating our dataset object and create data loader
+    mel_spectrogram = torchaudio.transforms.MelSpectrogram(
+        sample_rate=SAMPLE_RATE,
+        n_fft=2048,
+        hop_length=512,
+        n_mels=128
+    )
+    # dataset/dataloader
+    train_dataset = VoiceDataset(TRAIN_FILE, mel_spectrogram, device, time_limit_in_secs=3)
+    train_dataloader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
+    # construct model
+    model = CNNetwork()
+    # init loss function and optimizer
+    loss_fn = nn.CrossEntropyLoss()
+    optimizer = torch.optim.Adam(model.parameters(), lr=LEARNING_RATE)
+    # train model
+    train.call(model, train_dataloader, loss_fn, optimizer, "cuda", EPOCHS)