Add --valid_set_repeat

author: Volpeon <git@volpeon.ink> 2023-01-09 10:19:37 +0100
committer: Volpeon <git@volpeon.ink> 2023-01-09 10:19:37 +0100
commit: b57ca669a150d9313447612fb8c37668f4f2a80d (patch)
tree: b0ebfedc33c26847838850416b96fd2623cf6ba5 /train_ti.py
parent: No cache after all (diff)
download: textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.tar.gz
textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.tar.bz2
textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.zip
1 files changed, 22 insertions, 0 deletions
diff --git a/train_ti.py b/train_ti.py
index 03f52c4..7784d04 100644
--- a/train_ti.py
+++ b/train_ti.py
@@ -381,6 +381,12 @@ def parse_args():
        help="Number of images in the validation dataset."
    )
    parser.add_argument(
+        "--valid_set_repeat",
+        type=int,
+        default=None,
+        help="Times the images in the validation dataset are repeated."
+    )
+    parser.add_argument(
        "--train_batch_size",
        type=int,
        default=1,
@@ -399,6 +405,12 @@ def parse_args():
        help="The weight of prior preservation loss."
    )
    parser.add_argument(
+        "--max_grad_norm",
+        default=3.0,
+        type=float,
+        help="Max gradient norm."
+    )
+    parser.add_argument(
        "--noise_timesteps",
        type=int,
        default=1000,
@@ -465,6 +477,9 @@ def parse_args():
    if isinstance(args.exclude_collections, str):
        args.exclude_collections = [args.exclude_collections]
+    if args.valid_set_repeat is None:
+        args.valid_set_repeat = args.train_batch_size
    if args.output_dir is None:
        raise ValueError("You must specify --output_dir")
@@ -735,6 +750,7 @@ def main():
        dropout=args.tag_dropout,
        template_key=args.train_data_template,
        valid_set_size=args.valid_set_size,
+        valid_set_repeat=args.valid_set_repeat,
        num_workers=args.dataloader_num_workers,
        seed=args.seed,
        filter=keyword_filter,
@@ -961,6 +977,12 @@ def main():
                        accelerator.backward(loss)
+                        if accelerator.sync_gradients:
+                            accelerator.clip_grad_norm_(
+                                text_encoder.text_model.embeddings.temp_token_embedding.parameters(),
+                                args.max_grad_norm
+                            )
                        optimizer.step()
                        if not accelerator.optimizer_step_was_skipped:
                            lr_scheduler.step()
author	Volpeon <git@volpeon.ink>	2023-01-09 10:19:37 +0100
committer	Volpeon <git@volpeon.ink>	2023-01-09 10:19:37 +0100
commit	b57ca669a150d9313447612fb8c37668f4f2a80d (patch)
tree	b0ebfedc33c26847838850416b96fd2623cf6ba5 /train_ti.py
parent	No cache after all (diff)
download	textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.tar.gz textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.tar.bz2 textual-inversion-diff-b57ca669a150d9313447612fb8c37668f4f2a80d.zip