Update

author: Volpeon <git@volpeon.ink> 2022-10-09 12:42:21 +0200
committer: Volpeon <git@volpeon.ink> 2022-10-09 12:42:21 +0200
commit: 1eef9a946161fd06b0e72ec804c68f4f0e74b380 (patch)
tree: b4a272b7240c25c0eef173dbfd193ba89a592929 /models
parent: Update (diff)
download: textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.tar.gz
textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.tar.bz2
textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.zip
1 files changed, 138 insertions, 0 deletions
diff --git a/models/hypernetwork.py b/models/hypernetwork.py
new file mode 100644
index 0000000..fe8a312
--- /dev/null
+++ b/models/hypernetwork.py
@@ -0,0 +1,138 @@
+import math
+from typing import Dict, Optional, Iterable, List, Tuple, Any
+import copy
+import torch
+import numpy as np
+from torch import nn
+from functorch import make_functional, make_functional_with_buffers
+from diffusers.configuration_utils import ConfigMixin, register_to_config
+from diffusers.modeling_utils import ModelMixin
+def get_weight_chunk_dims(num_target_parameters: int, num_embeddings: int):
+    weight_chunk_dim = math.ceil(num_target_parameters / num_embeddings)
+    if weight_chunk_dim != 0:
+        remainder = num_target_parameters % weight_chunk_dim
+        if remainder > 0:
+            diff = math.ceil(remainder / weight_chunk_dim)
+            num_embeddings += diff
+    return weight_chunk_dim
+def count_params(target: ModelMixin):
+    return sum([np.prod(p.size()) for p in target.parameters()])
+class FunctionalParamVectorWrapper(ModelMixin):
+    """
+    This wraps a module so that it takes params in the forward pass
+    """
+    def __init__(self, module: ModelMixin):
+        super().__init__()
+        self.custom_buffers = None
+        param_dict = dict(module.named_parameters())
+        self.target_weight_shapes = {k: param_dict[k].size() for k in param_dict}
+        try:
+            _functional, self.named_params = make_functional(module)
+        except Exception:
+            _functional, self.named_params, buffers = make_functional_with_buffers(
+                module
+            )
+            self.custom_buffers = buffers
+        self.functional = [_functional]  # remove params from being counted
+    def forward(self, param_vector: torch.Tensor, *args, **kwargs):
+        params = []
+        start = 0
+        for p in self.named_params:
+            end = start + np.prod(p.size())
+            params.append(param_vector[start:end].view(p.size()))
+            start = end
+        if self.custom_buffers is not None:
+            return self.functional[0](params, self.custom_buffers, *args, **kwargs)
+        return self.functional[0](params, *args, **kwargs)
+class Hypernetwork(ModelMixin, ConfigMixin):
+    @register_to_config
+    def __init__(
+        self,
+        target_network: ModelMixin,
+        num_target_parameters: Optional[int] = None,
+        embedding_dim: int = 100,
+        num_embeddings: int = 3,
+        weight_chunk_dim: Optional[int] = None,
+    ):
+        super().__init__()
+        self._target = FunctionalParamVectorWrapper(target_network)
+        self.target_weight_shapes = self._target.target_weight_shapes
+        self.num_target_parameters = num_target_parameters
+        self.embedding_dim = embedding_dim
+        self.num_embeddings = num_embeddings
+        self.weight_chunk_dim = weight_chunk_dim
+        self.embedding_module = self.make_embedding_module()
+        self.weight_generator = self.make_weight_generator()
+    def make_embedding_module(self) -> nn.Module:
+        return nn.Embedding(self.num_embeddings, self.embedding_dim)
+    def make_weight_generator(self) -> nn.Module:
+        return nn.Linear(self.embedding_dim, self.weight_chunk_dim)
+    def generate_params(
+        self, inp: Iterable[Any] = []
+    ) -> Tuple[torch.Tensor, Dict[str, Any]]:
+        embedding = self.embedding_module(
+            torch.arange(self.num_embeddings, device=self.device)
+        )
+        generated_params = self.weight_generator(embedding).view(-1)
+        return generated_params, {"embedding": embedding}
+    def forward(
+        self,
+        inp: Iterable[Any] = [],
+        *args,
+        **kwargs,
+    ):
+        generated_params, aux_output = self.generate_params(inp, *args, **kwargs)
+        assert generated_params.shape[-1] >= self.num_target_parameters
+        return self._target(generated_params, *inp)
+    @property
+    def device(self) -> torch.device:
+        return self._target.device
+    @classmethod
+    def from_target(
+        cls,
+        target_network: ModelMixin,
+        num_target_parameters: Optional[int] = None,
+        embedding_dim: int = 8,
+        num_embeddings: int = 3,
+        weight_chunk_dim: Optional[int] = None,
+        *args,
+        **kwargs,
+    ):
+        if num_target_parameters is None:
+            num_target_parameters = count_params(target_network)
+        if weight_chunk_dim is None:
+            weight_chunk_dim = get_weight_chunk_dims(num_target_parameters, num_embeddings)
+        return cls(
+            target_network=target_network,
+            num_target_parameters=num_target_parameters,
+            embedding_dim=embedding_dim,
+            num_embeddings=num_embeddings,
+            weight_chunk_dim=weight_chunk_dim,
+            *args,
+            **kwargs,
+        )
author	Volpeon <git@volpeon.ink>	2022-10-09 12:42:21 +0200
committer	Volpeon <git@volpeon.ink>	2022-10-09 12:42:21 +0200
commit	1eef9a946161fd06b0e72ec804c68f4f0e74b380 (patch)
tree	b4a272b7240c25c0eef173dbfd193ba89a592929 /models
parent	Update (diff)
download	textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.tar.gz textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.tar.bz2 textual-inversion-diff-1eef9a946161fd06b0e72ec804c68f4f0e74b380.zip

diff --git a/models/hypernetwork.py b/models/hypernetwork.py new file mode 100644 index 0000000..fe8a312 --- /dev/null +++ b/models/hypernetwork.py
@@ -0,0 +1,138 @@
	1	import math
	2	from typing import Dict, Optional, Iterable, List, Tuple, Any
	3	import copy
	4	import torch
	5	import numpy as np
	6	from torch import nn
	7	from functorch import make_functional, make_functional_with_buffers
	8	from diffusers.configuration_utils import ConfigMixin, register_to_config
	9	from diffusers.modeling_utils import ModelMixin
	10
	11
	12	def get_weight_chunk_dims(num_target_parameters: int, num_embeddings: int):
	13	weight_chunk_dim = math.ceil(num_target_parameters / num_embeddings)
	14	if weight_chunk_dim != 0:
	15	remainder = num_target_parameters % weight_chunk_dim
	16	if remainder > 0:
	17	diff = math.ceil(remainder / weight_chunk_dim)
	18	num_embeddings += diff
	19	return weight_chunk_dim
	20
	21
	22	def count_params(target: ModelMixin):
	23	return sum([np.prod(p.size()) for p in target.parameters()])
	24
	25
	26	class FunctionalParamVectorWrapper(ModelMixin):
	27	"""
	28	This wraps a module so that it takes params in the forward pass
	29	"""
	30
	31	def __init__(self, module: ModelMixin):
	32	super().__init__()
	33
	34	self.custom_buffers = None
	35	param_dict = dict(module.named_parameters())
	36	self.target_weight_shapes = {k: param_dict[k].size() for k in param_dict}
	37
	38	try:
	39	_functional, self.named_params = make_functional(module)
	40	except Exception:
	41	_functional, self.named_params, buffers = make_functional_with_buffers(
	42	module
	43	)
	44	self.custom_buffers = buffers
	45	self.functional = [_functional] # remove params from being counted
	46
	47	def forward(self, param_vector: torch.Tensor, args, *kwargs):
	48	params = []
	49	start = 0
	50	for p in self.named_params:
	51	end = start + np.prod(p.size())
	52	params.append(param_vector[start:end].view(p.size()))
	53	start = end
	54	if self.custom_buffers is not None:
	55	return self.functional[0](params, self.custom_buffers, args, *kwargs)
	56	return self.functional[0](params, args, *kwargs)
	57
	58
	59	class Hypernetwork(ModelMixin, ConfigMixin):
	60	@register_to_config
	61	def __init__(
	62	self,
	63	target_network: ModelMixin,
	64	num_target_parameters: Optional[int] = None,
	65	embedding_dim: int = 100,
	66	num_embeddings: int = 3,
	67	weight_chunk_dim: Optional[int] = None,
	68	):
	69	super().__init__()
	70
	71	self._target = FunctionalParamVectorWrapper(target_network)
	72
	73	self.target_weight_shapes = self._target.target_weight_shapes
	74
	75	self.num_target_parameters = num_target_parameters
	76
	77	self.embedding_dim = embedding_dim
	78	self.num_embeddings = num_embeddings
	79	self.weight_chunk_dim = weight_chunk_dim
	80
	81	self.embedding_module = self.make_embedding_module()
	82	self.weight_generator = self.make_weight_generator()
	83
	84	def make_embedding_module(self) -> nn.Module:
	85	return nn.Embedding(self.num_embeddings, self.embedding_dim)
	86
	87	def make_weight_generator(self) -> nn.Module:
	88	return nn.Linear(self.embedding_dim, self.weight_chunk_dim)
	89
	90	def generate_params(
	91	self, inp: Iterable[Any] = []
	92	) -> Tuple[torch.Tensor, Dict[str, Any]]:
	93	embedding = self.embedding_module(
	94	torch.arange(self.num_embeddings, device=self.device)
	95	)
	96	generated_params = self.weight_generator(embedding).view(-1)
	97	return generated_params, {"embedding": embedding}
	98
	99	def forward(
	100	self,
	101	inp: Iterable[Any] = [],
	102	*args,
	103	**kwargs,
	104	):
	105	generated_params, aux_output = self.generate_params(inp, args, *kwargs)
	106
	107	assert generated_params.shape[-1] >= self.num_target_parameters
	108
	109	return self._target(generated_params, *inp)
	110
	111	@property
	112	def device(self) -> torch.device:
	113	return self._target.device
	114
	115	@classmethod
	116	def from_target(
	117	cls,
	118	target_network: ModelMixin,
	119	num_target_parameters: Optional[int] = None,
	120	embedding_dim: int = 8,
	121	num_embeddings: int = 3,
	122	weight_chunk_dim: Optional[int] = None,
	123	*args,
	124	**kwargs,
	125	):
	126	if num_target_parameters is None:
	127	num_target_parameters = count_params(target_network)
	128	if weight_chunk_dim is None:
	129	weight_chunk_dim = get_weight_chunk_dims(num_target_parameters, num_embeddings)
	130	return cls(
	131	target_network=target_network,
	132	num_target_parameters=num_target_parameters,
	133	embedding_dim=embedding_dim,
	134	num_embeddings=num_embeddings,
	135	weight_chunk_dim=weight_chunk_dim,
	136	*args,
	137	**kwargs,
	138	)