Add Textual Inversion with class dataset (a la Dreambooth)

author: Volpeon <git@volpeon.ink> 2022-10-04 19:22:22 +0200
committer: Volpeon <git@volpeon.ink> 2022-10-04 19:22:22 +0200
commit: 300deaa789a0321f32d5e7f04d9860eaa258110e (patch)
tree: 892e89753e5c4d86d787131595751bc03c610be8 /textual_inversion.py
parent: Default sample steps 30 -> 40 (diff)
download: textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.tar.gz
textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.tar.bz2
textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.zip
1 files changed, 6 insertions, 7 deletions
diff --git a/textual_inversion.py b/textual_inversion.py
index d842288..7919ebd 100644
--- a/textual_inversion.py
+++ b/textual_inversion.py
@@ -230,7 +230,7 @@ def parse_args():
    parser.add_argument(
        "--sample_steps",
        type=int,
-        default=40,
+        default=30,
        help="Number of steps for sample generation. Higher values will result in more detailed samples, but longer runtimes.",
    )
    parser.add_argument(
@@ -329,7 +329,7 @@ class Checkpointer:
        self.placeholder_token_id = placeholder_token_id
        self.output_dir = output_dir
        self.sample_image_size = sample_image_size
-        self.seed = seed
+        self.seed = seed or torch.random.seed()
        self.sample_batches = sample_batches
        self.sample_batch_size = sample_batch_size
@@ -481,9 +481,9 @@ def main():
    # Convert the initializer_token, placeholder_token to ids
    initializer_token_ids = tokenizer.encode(args.initializer_token, add_special_tokens=False)
    # Check if initializer_token is a single token or a sequence of tokens
-    if args.vectors_per_token % len(initializer_token_ids) != 0:
+    if len(initializer_token_ids) > 1:
        raise ValueError(
-            f"vectors_per_token ({args.vectors_per_token}) must be divisible by initializer token ({len(initializer_token_ids)}).")
+            f"initializer_token_ids must not have more than 1 vector, but it's {len(initializer_token_ids)}.")
    initializer_token_ids = torch.tensor(initializer_token_ids)
    placeholder_token_id = tokenizer.convert_tokens_to_ids(args.placeholder_token)
@@ -590,7 +590,7 @@ def main():
        sample_image_size=args.sample_image_size,
        sample_batch_size=args.sample_batch_size,
        sample_batches=args.sample_batches,
-        seed=args.seed or torch.random.seed()
+        seed=args.seed
    )
    # Scheduler and math around the number of training steps.
@@ -620,8 +620,7 @@ def main():
    unet.eval()
    # We need to recalculate our total training steps as the size of the training dataloader may have changed.
-    num_update_steps_per_epoch = math.ceil(
+    num_update_steps_per_epoch = math.ceil(len(train_dataloader) / args.gradient_accumulation_steps)
-        (len(train_dataloader) + len(val_dataloader)) / args.gradient_accumulation_steps)
    if overrode_max_train_steps:
        args.max_train_steps = args.num_train_epochs * num_update_steps_per_epoch
author	Volpeon <git@volpeon.ink>	2022-10-04 19:22:22 +0200
committer	Volpeon <git@volpeon.ink>	2022-10-04 19:22:22 +0200
commit	300deaa789a0321f32d5e7f04d9860eaa258110e (patch)
tree	892e89753e5c4d86d787131595751bc03c610be8 /textual_inversion.py
parent	Default sample steps 30 -> 40 (diff)
download	textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.tar.gz textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.tar.bz2 textual-inversion-diff-300deaa789a0321f32d5e7f04d9860eaa258110e.zip