1 files changed, 0 insertions, 38 deletions
diff --git a/models/clip/prompt.py b/models/clip/prompt.py
deleted file mode 100644
index a7380be..0000000
--- a/models/clip/prompt.py
+++ /dev/null
@@ -1,38 +0,0 @@
-from typing import Union, Optional
-import torch
-from transformers import CLIPTokenizer, CLIPTextModel
-class PromptProcessor():
-    def __init__(self, tokenizer: CLIPTokenizer, text_encoder: CLIPTextModel):
-        self.tokenizer = tokenizer
-        self.text_encoder = text_encoder
-    def get_input_ids(self, prompt: Union[str, list[str]]):
-        return self.tokenizer(
-            prompt,
-            padding="do_not_pad",
-        ).input_ids
-    def unify_input_ids(self, input_ids: list[list[int]]):
-        return self.tokenizer.pad(
-            {"input_ids": input_ids},
-            padding=True,
-            pad_to_multiple_of=self.tokenizer.model_max_length,
-            return_tensors="pt"
-        )
-    def get_embeddings(self, input_ids: torch.LongTensor, position_ids: Optional[torch.LongTensor] = None, attention_mask=None):
-        prompts = input_ids.shape[0]
-        input_ids = input_ids.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
-        if position_ids is not None:
-            position_ids = position_ids.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
-        if attention_mask is not None:
-            attention_mask = attention_mask.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
-        text_embeddings = self.text_encoder(input_ids, position_ids=position_ids, attention_mask=attention_mask)[0]
-        text_embeddings = text_embeddings.view((prompts, -1, text_embeddings.shape[2]))
-        return text_embeddings

diff --git a/models/clip/prompt.py b/models/clip/prompt.py deleted file mode 100644 index a7380be..0000000 --- a/models/clip/prompt.py +++ /dev/null
@@ -1,38 +0,0 @@
1	from typing import Union, Optional
2
3	import torch
4
5	from transformers import CLIPTokenizer, CLIPTextModel
6
7
8	class PromptProcessor():
9	def __init__(self, tokenizer: CLIPTokenizer, text_encoder: CLIPTextModel):
10	self.tokenizer = tokenizer
11	self.text_encoder = text_encoder
12
13	def get_input_ids(self, prompt: Union[str, list[str]]):
14	return self.tokenizer(
15	prompt,
16	padding="do_not_pad",
17	).input_ids
18
19	def unify_input_ids(self, input_ids: list[list[int]]):
20	return self.tokenizer.pad(
21	{"input_ids": input_ids},
22	padding=True,
23	pad_to_multiple_of=self.tokenizer.model_max_length,
24	return_tensors="pt"
25	)
26
27	def get_embeddings(self, input_ids: torch.LongTensor, position_ids: Optional[torch.LongTensor] = None, attention_mask=None):
28	prompts = input_ids.shape[0]
29
30	input_ids = input_ids.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
31	if position_ids is not None:
32	position_ids = position_ids.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
33	if attention_mask is not None:
34	attention_mask = attention_mask.view((-1, self.tokenizer.model_max_length)).to(self.text_encoder.device)
35
36	text_embeddings = self.text_encoder(input_ids, position_ids=position_ids, attention_mask=attention_mask)[0]
37	text_embeddings = text_embeddings.view((prompts, -1, text_embeddings.shape[2]))
38	return text_embeddings