Various updates

author: Volpeon <git@volpeon.ink> 2022-10-12 08:18:22 +0200
committer: Volpeon <git@volpeon.ink> 2022-10-12 08:18:22 +0200
commit: f5b656d21c5b449eed6ce212e909043c124f79ee (patch)
tree: 905f20900433f1e77840cd66417395168e0eec7f /pipelines
parent: Added EMA support to Textual Inversion (diff)
download: textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.tar.gz
textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.tar.bz2
textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.zip
1 files changed, 5 insertions, 6 deletions
diff --git a/pipelines/stable_diffusion/vlpn_stable_diffusion.py b/pipelines/stable_diffusion/vlpn_stable_diffusion.py
index bfecd1c..8927a78 100644
--- a/pipelines/stable_diffusion/vlpn_stable_diffusion.py
+++ b/pipelines/stable_diffusion/vlpn_stable_diffusion.py
@@ -11,7 +11,7 @@ from diffusers import AutoencoderKL, DiffusionPipeline, DDIMScheduler, LMSDiscre
 from diffusers.pipelines.stable_diffusion.pipeline_stable_diffusion import StableDiffusionPipelineOutput
 from diffusers.utils import logging
 from transformers import CLIPTextModel, CLIPTokenizer
-from schedulers.scheduling_euler_a import EulerAScheduler, CFGDenoiserForward
+from schedulers.scheduling_euler_a import EulerAScheduler
 logger = logging.get_logger(__name__)  # pylint: disable=invalid-name
@@ -284,10 +284,9 @@ class VlpnStableDiffusion(DiffusionPipeline):
            noise_pred = None
            if isinstance(self.scheduler, EulerAScheduler):
-                sigma = t.reshape(1)
+                c_out, c_in, sigma_in = self.scheduler.prepare_input(latent_model_input, t, batch_size)
-                sigma_in = torch.cat([sigma] * latent_model_input.shape[0])
+                eps = self.unet(latent_model_input * c_in, sigma_in, encoder_hidden_states=text_embeddings).sample
-                noise_pred = CFGDenoiserForward(self.unet, latent_model_input, sigma_in,
+                noise_pred = latent_model_input + eps * c_out
-                                                text_embeddings, guidance_scale, quantize=True, DSsigmas=self.scheduler.DSsigmas)
            else:
                # predict the noise residual
                noise_pred = self.unet(latent_model_input, t, encoder_hidden_states=text_embeddings).sample
@@ -305,7 +304,7 @@ class VlpnStableDiffusion(DiffusionPipeline):
        image = self.vae.decode(latents).sample
        image = (image / 2 + 0.5).clamp(0, 1)
-        image = image.cpu().permute(0, 2, 3, 1).numpy()
+        image = image.cpu().permute(0, 2, 3, 1).float().numpy()
        if output_type == "pil":
            image = self.numpy_to_pil(image)
author	Volpeon <git@volpeon.ink>	2022-10-12 08:18:22 +0200
committer	Volpeon <git@volpeon.ink>	2022-10-12 08:18:22 +0200
commit	f5b656d21c5b449eed6ce212e909043c124f79ee (patch)
tree	905f20900433f1e77840cd66417395168e0eec7f /pipelines
parent	Added EMA support to Textual Inversion (diff)
download	textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.tar.gz textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.tar.bz2 textual-inversion-diff-f5b656d21c5b449eed6ce212e909043c124f79ee.zip