Made low-freq noise configurable

author: Volpeon <git@volpeon.ink> 2023-02-14 11:02:41 +0100
committer: Volpeon <git@volpeon.ink> 2023-02-14 11:02:41 +0100
commit: 7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd (patch)
tree: 03e2f9517e3b05be76d3c04ef6165b23c47195f8 /training
parent: Better noise generation during training: https://www.crosslabs.org/blog/diffu... (diff)
download: textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.tar.gz
textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.tar.bz2
textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.zip
1 files changed, 11 insertions, 6 deletions
diff --git a/training/functional.py b/training/functional.py
index 62b8260..a9c7a8a 100644
--- a/training/functional.py
+++ b/training/functional.py
@@ -256,6 +256,7 @@ def loss_step(
    text_encoder: CLIPTextModel,
    with_prior_preservation: bool,
    prior_loss_weight: float,
+    low_freq_noise: float,
    seed: int,
    step: int,
    batch: dict[str, Any],
@@ -274,13 +275,15 @@ def loss_step(
        layout=latents.layout,
        device=latents.device,
        generator=generator
-    ) + 0.1 * torch.randn(
-        latents.shape[0], latents.shape[1], 1, 1,
-        dtype=latents.dtype,
-        layout=latents.layout,
-        device=latents.device,
-        generator=generator
    )
+    if low_freq_noise > 0:
+        noise += low_freq_noise * torch.randn(
+            latents.shape[0], latents.shape[1], 1, 1,
+            dtype=latents.dtype,
+            layout=latents.layout,
+            device=latents.device,
+            generator=generator
+        )
    bsz = latents.shape[0]
    # Sample a random timestep for each image
    timesteps = torch.randint(
@@ -553,6 +556,7 @@ def train(
    global_step_offset: int = 0,
    with_prior_preservation: bool = False,
    prior_loss_weight: float = 1.0,
+    low_freq_noise: float = 0.05,
    **kwargs,
 ):
    text_encoder, unet, optimizer, train_dataloader, val_dataloader, lr_scheduler, extra = strategy.prepare(
@@ -587,6 +591,7 @@ def train(
        text_encoder,
        with_prior_preservation,
        prior_loss_weight,
+        low_freq_noise,
        seed,
    )
author	Volpeon <git@volpeon.ink>	2023-02-14 11:02:41 +0100
committer	Volpeon <git@volpeon.ink>	2023-02-14 11:02:41 +0100
commit	7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd (patch)
tree	03e2f9517e3b05be76d3c04ef6165b23c47195f8 /training
parent	Better noise generation during training: https://www.crosslabs.org/blog/diffu... (diff)
download	textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.tar.gz textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.tar.bz2 textual-inversion-diff-7c56bf2fa99a8f6b7e23bb66ef4a2364dec3fbbd.zip