Spaces:

not-lain
/

gpu-utils

Running on Zero

not-lain commited on 20 days ago

Commit

4b54c6a

1 Parent(s): 7a3185b

finish sam2

Files changed (2) hide show

app.py CHANGED Viewed

@@ -7,6 +7,8 @@ from transformers import AutoModelForImageSegmentation
 from diffusers import FluxFillPipeline
 from PIL import Image, ImageOps
 from sam2.sam2_image_predictor import SAM2ImagePredictor
 torch.set_float32_matmul_precision(["high", "highest"][0])
@@ -122,9 +124,29 @@ def rmbg(image=None, url=None):
     return image
-def mask_generation(image=None, json=None):
     predictor = SAM2ImagePredictor.from_pretrained("facebook/sam2-hiera-tiny")
-    return None
 @spaces.GPU
@@ -200,7 +222,13 @@ sam2_tab = gr.Interface(
         gr.Image("image", type="pil"),
         gr.JSON(),
     ],
-    outputs=["image"],
 )
 demo = gr.TabbedInterface(

 from diffusers import FluxFillPipeline
 from PIL import Image, ImageOps
 from sam2.sam2_image_predictor import SAM2ImagePredictor
+import numpy as np
+import matplotlib.pyplot as plt
 torch.set_float32_matmul_precision(["high", "highest"][0])
     return image
+def mask_generation(image=None, d=None):
     predictor = SAM2ImagePredictor.from_pretrained("facebook/sam2-hiera-tiny")
+    predictor.set_image(image)
+    input_point = np.array(d["input_points"])
+    input_label = np.array(d["input_labels"])
+    masks, scores, logits = predictor.predict(
+        point_coords=input_point,
+        point_labels=input_label,
+        multimask_output=True,
+    )
+    sorted_ind = np.argsort(scores)[::-1]
+    masks = masks[sorted_ind]
+    scores = scores[sorted_ind]
+    logits = logits[sorted_ind]
+    out = []
+    image = Image.fromarray(image)
+    for i in range(len(masks)):
+        m = Image.fromarray(masks[i] * 255).convert("L")
+        comp = Image.composite(Image.fromarray(image), m, m)
+        out.append((comp, f"image {i}"))
+    return out
 @spaces.GPU
         gr.Image("image", type="pil"),
         gr.JSON(),
     ],
+    outputs=gr.Gallery(),
+    examples=[
+        [
+            "./assets/truck.jpg",
+            {"input_points": [[500, 375], [1125, 625]], "input_labels": [1, 0]},
+        ]
+    ],
 )
 demo = gr.TabbedInterface(

assets/truck.jpg ADDED Viewed