Fix seed, better progress bar, fix euler_a for batch size > 1

author: Volpeon <git@volpeon.ink> 2022-10-01 16:53:19 +0200
committer: Volpeon <git@volpeon.ink> 2022-10-01 16:53:19 +0200
commit: 6720c99f7082dc855059ad4afd6b3cb45b62bc1f (patch)
tree: d27f69880472df0cd6f63ea42bbf7a789ec5d0b7
parent: Made inference script interactive (diff)
download: textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.tar.gz
textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.tar.bz2
textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.zip
3 files changed, 15 insertions, 15 deletions
diff --git a/infer.py b/infer.py
index 40720ea..d917239 100644
--- a/infer.py
+++ b/infer.py
@@ -91,7 +91,7 @@ def create_cmd_parser():
    parser.add_argument(
        "--seed",
        type=int,
-        default=torch.random.seed(),
+        default=None,
    )
    parser.add_argument(
        "--config",
@@ -167,11 +167,15 @@ def generate(output_dir, pipeline, args):
    output_dir = output_dir.joinpath(f"{now}_{slugify(args.prompt)[:100]}")
    output_dir.mkdir(parents=True, exist_ok=True)
+    seed = args.seed or torch.random.seed()
    save_args(output_dir, args)
    with autocast("cuda"):
        for i in range(args.batch_num):
-            generator = torch.Generator(device="cuda").manual_seed(args.seed + i)
+            pipeline.set_progress_bar_config(desc=f"Batch {i + 1} of {args.batch_num}")
+            generator = torch.Generator(device="cuda").manual_seed(seed + i)
            images = pipeline(
                prompt=[args.prompt] * args.batch_size,
                height=args.height,
@@ -183,7 +187,7 @@ def generate(output_dir, pipeline, args):
            ).images
            for j, image in enumerate(images):
-                image.save(output_dir.joinpath(f"{args.seed + i}_{j}.jpg"))
+                image.save(output_dir.joinpath(f"{seed + i}_{j}.jpg"))
 class CmdParse(cmd.Cmd):
diff --git a/pipelines/stable_diffusion/clip_guided_stable_diffusion.py b/pipelines/stable_diffusion/clip_guided_stable_diffusion.py
index ddf7ce1..eff74b5 100644
--- a/pipelines/stable_diffusion/clip_guided_stable_diffusion.py
+++ b/pipelines/stable_diffusion/clip_guided_stable_diffusion.py
@@ -254,10 +254,10 @@ class CLIPGuidedStableDiffusion(DiffusionPipeline):
            noise_pred = None
            if isinstance(self.scheduler, EulerAScheduler):
                sigma = t.reshape(1)
-                sigma_in = torch.cat([sigma] * 2)
+                sigma_in = torch.cat([sigma] * latent_model_input.shape[0])
                # noise_pred = model(latent_model_input,sigma_in,uncond_embeddings, text_embeddings,guidance_scale)
                noise_pred = CFGDenoiserForward(self.unet, latent_model_input, sigma_in,
-                                                text_embeddings, guidance_scale, DSsigmas=self.scheduler.DSsigmas)
+                                                text_embeddings, guidance_scale, quantize=True, DSsigmas=self.scheduler.DSsigmas)
                # noise_pred = self.unet(latent_model_input, sigma_in, encoder_hidden_states=text_embeddings).sample
            else:
                # predict the noise residual
diff --git a/schedulers/scheduling_euler_a.py b/schedulers/scheduling_euler_a.py
index 29ebd07..9fbedaa 100644
--- a/schedulers/scheduling_euler_a.py
+++ b/schedulers/scheduling_euler_a.py
@@ -41,7 +41,6 @@ def get_sigmas(sigmas, n=None):
        return append_zero(sigmas.flip(0))
    t_max = len(sigmas) - 1  # = 999
    t = torch.linspace(t_max, 0, n, device=sigmas.device)
-    # t = torch.linspace(t_max, 0, n, device=sigmas.device)
    return append_zero(t_to_sigma(t, sigmas))
 # from k_samplers utils.py
@@ -55,14 +54,15 @@ def append_dims(x, target_dims):
    return x[(...,) + (None,) * dims_to_append]
-def CFGDenoiserForward(Unet, x_in, sigma_in, cond_in, cond_scale, DSsigmas=None):
+def CFGDenoiserForward(Unet, x_in, sigma_in, cond_in, cond_scale, quantize=False, DSsigmas=None):
    # x_in = torch.cat([x] * 2)#A# concat the latent
    # sigma_in = torch.cat([sigma] * 2) #A# concat sigma
    # cond_in = torch.cat([uncond, cond])
    # uncond, cond = self.inner_model(x_in, sigma_in, cond=cond_in).chunk(2)
    # uncond, cond = DiscreteEpsDDPMDenoiserForward(Unet,x_in, sigma_in,DSsigmas=DSsigmas, cond=cond_in).chunk(2)
    # return uncond + (cond - uncond) * cond_scale
-    noise_pred = DiscreteEpsDDPMDenoiserForward(Unet, x_in, sigma_in, DSsigmas=DSsigmas, cond=cond_in)
+    noise_pred = DiscreteEpsDDPMDenoiserForward(
+        Unet, x_in, sigma_in, quantize=quantize, DSsigmas=DSsigmas, cond=cond_in)
    return noise_pred
 # from k_samplers sampling.py
@@ -82,9 +82,7 @@ def get_scalings(sigma):
 # DiscreteSchedule DS
-def DSsigma_to_t(sigma, quantize=None, DSsigmas=None):
+def DSsigma_to_t(sigma, quantize=False, DSsigmas=None):
-    # quantize = self.quantize if quantize is None else quantize
-    quantize = False
    dists = torch.abs(sigma - DSsigmas[:, None])
    if quantize:
        return torch.argmin(dists, dim=0).view(sigma.shape)
@@ -96,13 +94,11 @@ def DSsigma_to_t(sigma, quantize=None, DSsigmas=None):
    return t.view(sigma.shape)
-def DiscreteEpsDDPMDenoiserForward(Unet, input, sigma, DSsigmas=None, **kwargs):
+def DiscreteEpsDDPMDenoiserForward(Unet, input, sigma, DSsigmas=None, quantize=False, **kwargs):
    sigma = sigma.to(Unet.device)
    DSsigmas = DSsigmas.to(Unet.device)
    c_out, c_in = [append_dims(x, input.ndim) for x in get_scalings(sigma)]
-    # ??? what is eps?
+    eps = Unet(input * c_in, DSsigma_to_t(sigma, quantize=quantize, DSsigmas=DSsigmas),
-    # eps = CVDget_eps(Unet,input * c_in, DSsigma_to_t(sigma), **kwargs)
-    eps = Unet(input * c_in, DSsigma_to_t(sigma, DSsigmas=DSsigmas),
               encoder_hidden_states=kwargs['cond']).sample
    return input + eps * c_out
author	Volpeon <git@volpeon.ink>	2022-10-01 16:53:19 +0200
committer	Volpeon <git@volpeon.ink>	2022-10-01 16:53:19 +0200
commit	6720c99f7082dc855059ad4afd6b3cb45b62bc1f (patch)
tree	d27f69880472df0cd6f63ea42bbf7a789ec5d0b7
parent	Made inference script interactive (diff)
download	textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.tar.gz textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.tar.bz2 textual-inversion-diff-6720c99f7082dc855059ad4afd6b3cb45b62bc1f.zip