Add support for Adafactor, add TI initializer noise

author: Volpeon <git@volpeon.ink> 2023-04-01 12:35:43 +0200
committer: Volpeon <git@volpeon.ink> 2023-04-01 12:35:43 +0200
commit: 01eee0cb24f52ca78761b78917959e1c247eae94 (patch)
tree: 914c0d3f5b888a4c344b30a861639c8e3d5259dd /train_lora.py
parent: Update (diff)
download: textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.tar.gz
textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.tar.bz2
textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.zip
1 files changed, 15 insertions, 1 deletions
diff --git a/train_lora.py b/train_lora.py
index f74a438..f8dccae 100644
--- a/train_lora.py
+++ b/train_lora.py
@@ -14,6 +14,7 @@ from accelerate.logging import get_logger
 from accelerate.utils import LoggerType, set_seed
 from peft import LoraConfig, LoraModel
 from slugify import slugify
+import transformers
 from util.files import load_config, load_embeddings_from_dir
 from data.csv import VlpnDataModule, keyword_filter
@@ -317,7 +318,7 @@ def parse_args():
        "--optimizer",
        type=str,
        default="dadan",
-        help='Optimizer to use ["adam", "adam8bit", "dadam", "dadan"]'
+        help='Optimizer to use ["adam", "adam8bit", "dadam", "dadan", "adafactor"]'
    )
    parser.add_argument(
        "--dadaptation_d0",
@@ -567,6 +568,19 @@ def main():
            eps=args.adam_epsilon,
            amsgrad=args.adam_amsgrad,
        )
+    elif args.optimizer == 'adafactor':
+        create_optimizer = partial(
+            transformers.optimization.Adafactor,
+            beta1=args.adam_beta1,
+            weight_decay=args.adam_weight_decay,
+            scale_parameter=True,
+            relative_step=True,
+            warmup_init=True,
+        )
+        args.lr_scheduler = "adafactor"
+        args.lr_min_lr = args.learning_rate
+        args.learning_rate = None
    elif args.optimizer == 'dadam':
        try:
            import dadaptation
author	Volpeon <git@volpeon.ink>	2023-04-01 12:35:43 +0200
committer	Volpeon <git@volpeon.ink>	2023-04-01 12:35:43 +0200
commit	01eee0cb24f52ca78761b78917959e1c247eae94 (patch)
tree	914c0d3f5b888a4c344b30a861639c8e3d5259dd /train_lora.py
parent	Update (diff)
download	textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.tar.gz textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.tar.bz2 textual-inversion-diff-01eee0cb24f52ca78761b78917959e1c247eae94.zip