Update

author: Volpeon <git@volpeon.ink> 2023-01-17 16:39:33 +0100
committer: Volpeon <git@volpeon.ink> 2023-01-17 16:39:33 +0100
commit: 8e9d62225db11913bf7ef67221fc3508d7fe1149 (patch)
tree: 4c17e8491a77bc92deb276dedba7949a8bb7297a /training/strategy
parent: Optimized embedding normalization (diff)
download: textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.tar.gz
textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.tar.bz2
textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.zip
2 files changed, 10 insertions, 9 deletions
diff --git a/training/strategy/dreambooth.py b/training/strategy/dreambooth.py
index d813b49..f57e736 100644
--- a/training/strategy/dreambooth.py
+++ b/training/strategy/dreambooth.py
@@ -99,8 +99,7 @@ def dreambooth_strategy_callbacks(
    def on_prepare():
        unet.requires_grad_(True)
        text_encoder.requires_grad_(True)
-        text_encoder.text_model.embeddings.persist()
+        text_encoder.text_model.embeddings.requires_grad_(False)
-        text_encoder.text_model.embeddings.temp_token_embedding.requires_grad_(False)
        if ema_unet is not None:
            ema_unet.to(accelerator.device)
@@ -125,7 +124,7 @@ def dreambooth_strategy_callbacks(
        with ema_context():
            yield
-    def on_before_optimize(epoch: int):
+    def on_before_optimize(lr: float, epoch: int):
        if accelerator.sync_gradients:
            params_to_clip = [unet.parameters()]
            if epoch < train_text_encoder_epochs:
diff --git a/training/strategy/ti.py b/training/strategy/ti.py
index ba78b98..e922954 100644
--- a/training/strategy/ti.py
+++ b/training/strategy/ti.py
@@ -117,14 +117,15 @@ def textual_inversion_strategy_callbacks(
        with ema_context():
            yield
-    def on_after_optimize(lr: float):
+    @torch.no_grad()
+    def on_before_optimize(lr: float, epoch: int):
        if use_emb_decay:
-            with torch.no_grad():
+            text_encoder.text_model.embeddings.normalize(
-                text_encoder.text_model.embeddings.normalize(
+                emb_decay_target,
-                    emb_decay_target,
+                min(1.0, emb_decay * lr)
-                    min(1.0, emb_decay * lr)
+            )
-                )
+    def on_after_optimize(lr: float):
        if ema_embeddings is not None:
            ema_embeddings.step(text_encoder.text_model.embeddings.temp_token_embedding.parameters())
@@ -154,6 +155,7 @@ def textual_inversion_strategy_callbacks(
        on_model=on_model,
        on_train=on_train,
        on_eval=on_eval,
+        on_before_optimize=on_before_optimize,
        on_after_optimize=on_after_optimize,
        on_log=on_log,
        on_checkpoint=on_checkpoint,
author	Volpeon <git@volpeon.ink>	2023-01-17 16:39:33 +0100
committer	Volpeon <git@volpeon.ink>	2023-01-17 16:39:33 +0100
commit	8e9d62225db11913bf7ef67221fc3508d7fe1149 (patch)
tree	4c17e8491a77bc92deb276dedba7949a8bb7297a /training/strategy
parent	Optimized embedding normalization (diff)
download	textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.tar.gz textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.tar.bz2 textual-inversion-diff-8e9d62225db11913bf7ef67221fc3508d7fe1149.zip