Better noise generation during training: https://www.crosslabs.org/blog/diffusion-with-offset-noise

author: Volpeon <git@volpeon.ink> 2023-02-13 21:19:46 +0100
committer: Volpeon <git@volpeon.ink> 2023-02-13 21:19:46 +0100
commit: e9b7143c790ebc8b7b18c41f51d0e799ac84a337 (patch)
tree: ee9f6e3f192706ba96ec3aa20b24836b5ee0e673 /training/functional.py
parent: Update (diff)
download: textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.tar.gz
textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.tar.bz2
textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.zip
1 files changed, 7 insertions, 0 deletions
diff --git a/training/functional.py b/training/functional.py
index 83e70e2..62b8260 100644
--- a/training/functional.py
+++ b/training/functional.py
@@ -157,6 +157,7 @@ def save_samples(
                width=image_size,
                generator=gen,
                guidance_scale=guidance_scale,
+                sag_scale=0,
                num_inference_steps=num_steps,
                output_type='pil'
            ).images
@@ -273,6 +274,12 @@ def loss_step(
        layout=latents.layout,
        device=latents.device,
        generator=generator
+    ) + 0.1 * torch.randn(
+        latents.shape[0], latents.shape[1], 1, 1,
+        dtype=latents.dtype,
+        layout=latents.layout,
+        device=latents.device,
+        generator=generator
    )
    bsz = latents.shape[0]
    # Sample a random timestep for each image
author	Volpeon <git@volpeon.ink>	2023-02-13 21:19:46 +0100
committer	Volpeon <git@volpeon.ink>	2023-02-13 21:19:46 +0100
commit	e9b7143c790ebc8b7b18c41f51d0e799ac84a337 (patch)
tree	ee9f6e3f192706ba96ec3aa20b24836b5ee0e673 /training/functional.py
parent	Update (diff)
download	textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.tar.gz textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.tar.bz2 textual-inversion-diff-e9b7143c790ebc8b7b18c41f51d0e799ac84a337.zip