Spaces:

editing-images
/

ledits

Running on A10G

App Files Files Community

Linoy Tsaban commited on May 26, 2023

Commit

277aca5

•

1 Parent(s): 4eb55a5

Update app.py

Browse files

Files changed (1) hide show

app.py +69 -15

app.py CHANGED Viewed

@@ -50,25 +50,22 @@ device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 sd_pipe = StableDiffusionPipeline.from_pretrained(sd_model_id).to(device)
 sd_pipe.scheduler = DDIMScheduler.from_config(sd_model_id, subfolder = "scheduler")
 sem_pipe = SemanticStableDiffusionPipeline.from_pretrained(sd_model_id).to(device)
-def edit(input_image,
                     src_prompt,
                     tar_prompt,
                     steps,
-                    src_cfg_scale,
                     skip,
-                    tar_cfg_scale,
-                    edit_concept,
-                    sega_edit_guidance,
-                    warm_up,
-                    neg_guidance):
     offsets=(0,0,0,0)
     x0 = load_512(input_image, *offsets, device)
     # invert
-    wt, zs, wts = invert(x0 =x0 , prompt_src=src_prompt, num_diffusion_steps=steps, cfg_scale_src=src_cfg_scale)
     latnets = wts[skip].expand(1, -1, -1, -1)
     eta = 1
@@ -76,7 +73,15 @@ def edit(input_image,
     pure_ddpm_out = sample(wt, zs, wts, prompt_tar=tar_prompt,
                            cfg_scale_tar=tar_cfg_scale, skip=skip,
                            eta = eta)
     editing_args = dict(
     editing_prompt = [edit_concept],
     reverse_editing_direction = [neg_guidance],
@@ -90,7 +95,48 @@ def edit(input_image,
                         num_images_per_prompt=1,
                         num_inference_steps=steps,
                         use_ddpm=True,  wts=wts, zs=zs[skip:], **editing_args)
-    return pure_ddpm_out,sega_out.images[0]
 ####################################
@@ -132,7 +178,7 @@ with gr.Blocks() as demo:
     with gr.Row():
         #inversion
         steps = gr.Number(value=100, precision=0, label="Steps", interactive=True)
-        src_cfg_scale = gr.Number(value=3.5, label=f"Source CFG", interactive=True)
         # reconstruction
         skip = gr.Number(value=36, precision=0, label="Skip", interactive=True)
         tar_cfg_scale = gr.Number(value=15, label=f"Reconstruction CFG", interactive=True)
@@ -146,20 +192,28 @@ with gr.Blocks() as demo:
     # gr.Markdown(help_text)
     generate_button.click(
-        fn=edit,
         inputs=[input_image,
                 src_prompt,
                 tar_prompt,
                 steps,
                 src_cfg_scale,
                 skip,
-                tar_cfg_scale,
                 edit_concept,
                 sega_edit_guidance,
                 warm_up,
                 neg_guidance
         ],
-        outputs=[ddpm_edited_image, sega_edited_image],
     )

 sd_pipe = StableDiffusionPipeline.from_pretrained(sd_model_id).to(device)
 sd_pipe.scheduler = DDIMScheduler.from_config(sd_model_id, subfolder = "scheduler")
 sem_pipe = SemanticStableDiffusionPipeline.from_pretrained(sd_model_id).to(device)
+latents, wts, zs = None, None, None
+def invert_and_reconstruct(input_image,
                     src_prompt,
                     tar_prompt,
                     steps,
+                    # src_cfg_scale,
                     skip,
+                    tar_cfg_scale):
     offsets=(0,0,0,0)
     x0 = load_512(input_image, *offsets, device)
     # invert
+    # wt, zs, wts = invert(x0 =x0 , prompt_src=src_prompt, num_diffusion_steps=steps, cfg_scale_src=src_cfg_scale)
+    wt, zs, wts = invert(x0 =x0 , prompt_src=src_prompt, num_diffusion_steps=steps)
     latnets = wts[skip].expand(1, -1, -1, -1)
     eta = 1
     pure_ddpm_out = sample(wt, zs, wts, prompt_tar=tar_prompt,
                            cfg_scale_tar=tar_cfg_scale, skip=skip,
                            eta = eta)
+    return pure_ddpm_out
+def edit( tar_prompt,
+         steps,
+         edit_concept,
+         sega_edit_guidance,
+                    warm_up,
+                    neg_guidance):
     editing_args = dict(
     editing_prompt = [edit_concept],
     reverse_editing_direction = [neg_guidance],
                         num_images_per_prompt=1,
                         num_inference_steps=steps,
                         use_ddpm=True,  wts=wts, zs=zs[skip:], **editing_args)
+    return sega_out.images[0]
+# def edit(input_image,
+#                     src_prompt,
+#                     tar_prompt,
+#                     steps,
+#                     # src_cfg_scale,
+#                     skip,
+#                     tar_cfg_scale,
+#                     edit_concept,
+#                     sega_edit_guidance,
+#                     warm_up,
+#                     neg_guidance):
+#     offsets=(0,0,0,0)
+#     x0 = load_512(input_image, *offsets, device)
+#     # invert
+#     # wt, zs, wts = invert(x0 =x0 , prompt_src=src_prompt, num_diffusion_steps=steps, cfg_scale_src=src_cfg_scale)
+#     wt, zs, wts = invert(x0 =x0 , prompt_src=src_prompt, num_diffusion_steps=steps)
+#     latnets = wts[skip].expand(1, -1, -1, -1)
+#     eta = 1
+#     #pure DDPM output
+#     pure_ddpm_out = sample(wt, zs, wts, prompt_tar=tar_prompt,
+#                            cfg_scale_tar=tar_cfg_scale, skip=skip,
+#                            eta = eta)
+#     editing_args = dict(
+#     editing_prompt = [edit_concept],
+#     reverse_editing_direction = [neg_guidance],
+#     edit_warmup_steps=[warm_up],
+#     edit_guidance_scale=[sega_edit_guidance],
+#     edit_threshold=[.93],
+#     edit_momentum_scale=0.5,
+#     edit_mom_beta=0.6
+#   )
+#     sega_out = sem_pipe(prompt=tar_prompt,eta=eta, latents=latnets,
+#                         num_images_per_prompt=1,
+#                         num_inference_steps=steps,
+#                         use_ddpm=True,  wts=wts, zs=zs[skip:], **editing_args)
+#     return pure_ddpm_out,sega_out.images[0]
 ####################################
     with gr.Row():
         #inversion
         steps = gr.Number(value=100, precision=0, label="Steps", interactive=True)
+        # src_cfg_scale = gr.Number(value=3.5, label=f"Source CFG", interactive=True)
         # reconstruction
         skip = gr.Number(value=36, precision=0, label="Skip", interactive=True)
         tar_cfg_scale = gr.Number(value=15, label=f"Reconstruction CFG", interactive=True)
     # gr.Markdown(help_text)
     generate_button.click(
+        fn=invert_and_reconstruct,
         inputs=[input_image,
                 src_prompt,
                 tar_prompt,
                 steps,
                 src_cfg_scale,
                 skip,
+                tar_cfg_scale
+        ],
+        outputs=[ddpm_edited_image],
+    )
+    edit_button.click(
+        fn=edit,
+        inputs=[tar_prompt,
+                steps,
                 edit_concept,
                 sega_edit_guidance,
                 warm_up,
                 neg_guidance
         ],
+        outputs=[sega_edited_image],
     )