Bring back Lion optimizer

author: Volpeon <git@volpeon.ink> 2023-04-03 12:39:17 +0200
committer: Volpeon <git@volpeon.ink> 2023-04-03 12:39:17 +0200
commit: a08cd4b1581ca195f619e8bdb6cb6448287d4d2f (patch)
tree: 49c753924b44f8b82403ee52ed21f3ab60c76748 /train_lora.py
parent: Fix memory leak (diff)
download: textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.tar.gz
textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.tar.bz2
textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.zip
1 files changed, 27 insertions, 3 deletions
diff --git a/train_lora.py b/train_lora.py
index cf73645..a0cd174 100644
--- a/train_lora.py
+++ b/train_lora.py
@@ -318,7 +318,7 @@ def parse_args():
        "--optimizer",
        type=str,
        default="dadan",
-        help='Optimizer to use ["adam", "adam8bit", "dadam", "dadan", "adafactor"]'
+        help='Optimizer to use ["adam", "adam8bit", "lion", "dadam", "dadan", "adafactor"]'
    )
    parser.add_argument(
        "--dadaptation_d0",
@@ -329,13 +329,13 @@ def parse_args():
    parser.add_argument(
        "--adam_beta1",
        type=float,
-        default=0.9,
+        default=None,
        help="The beta1 parameter for the Adam optimizer."
    )
    parser.add_argument(
        "--adam_beta2",
        type=float,
-        default=0.999,
+        default=None,
        help="The beta2 parameter for the Adam optimizer."
    )
    parser.add_argument(
@@ -468,6 +468,18 @@ def parse_args():
    if args.output_dir is None:
        raise ValueError("You must specify --output_dir")
+    if args.adam_beta1 is None:
+        if args.optimizer in ('adam', 'adam8bit'):
+            args.adam_beta1 = 0.9
+        elif args.optimizer == 'lion':
+            args.adam_beta1 = 0.95
+    if args.adam_beta2 is None:
+        if args.optimizer in ('adam', 'adam8bit'):
+            args.adam_beta2 = 0.999
+        elif args.optimizer == 'lion':
+            args.adam_beta2 = 0.98
    return args
@@ -568,6 +580,18 @@ def main():
            eps=args.adam_epsilon,
            amsgrad=args.adam_amsgrad,
        )
+    elif args.optimizer == 'lion':
+        try:
+            import lion_pytorch
+        except ImportError:
+            raise ImportError("To use Lion, please install the lion_pytorch library: `pip install lion-pytorch`.")
+        create_optimizer = partial(
+            lion_pytorch.Lion,
+            betas=(args.adam_beta1, args.adam_beta2),
+            weight_decay=args.adam_weight_decay,
+            use_triton=True,
+        )
    elif args.optimizer == 'adafactor':
        create_optimizer = partial(
            transformers.optimization.Adafactor,
author	Volpeon <git@volpeon.ink>	2023-04-03 12:39:17 +0200
committer	Volpeon <git@volpeon.ink>	2023-04-03 12:39:17 +0200
commit	a08cd4b1581ca195f619e8bdb6cb6448287d4d2f (patch)
tree	49c753924b44f8b82403ee52ed21f3ab60c76748 /train_lora.py
parent	Fix memory leak (diff)
download	textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.tar.gz textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.tar.bz2 textual-inversion-diff-a08cd4b1581ca195f619e8bdb6cb6448287d4d2f.zip