silver
/

chatglm-6b-slim

@@ -754,9 +754,8 @@ class ChatGLMModel(ChatGLMPreTrainedModel):
     def set_input_embeddings(self, new_embeddings: torch.Tensor):
         self.word_embeddings = new_embeddings
-    @staticmethod
-    def get_masks(seq, device):
-        context_length = seq.index(130004) + 1
         attention_mask = torch.ones((1, len(seq), len(seq)), device=device)
         attention_mask.tril_()
@@ -767,9 +766,9 @@ class ChatGLMModel(ChatGLMPreTrainedModel):
         return attention_mask
     def get_position_ids(self, seq, mask_position, device, gmask=False):
-        context_length = seq.index(130004) + 1
         if self.position_encoding_2d:
-            seq_length = seq.index(130004)
             position_ids = torch.arange(context_length, dtype=torch.long, device=device)
             if not gmask:
                 position_ids[seq_length:] = mask_position
@@ -824,14 +823,8 @@ class ChatGLMModel(ChatGLMPreTrainedModel):
         if past_key_values is None:
             past_key_values = tuple([None] * len(self.layers))
-            MASK, gMASK = 130000, 130001
-            mask_token = MASK if MASK in input_ids else gMASK
-            use_gmask = False if MASK in input_ids else gMASK
             seq = input_ids[0].tolist()
-            mask_position = seq.index(mask_token)
             if attention_mask is None:
                 attention_mask = self.get_masks(
                     seq=seq,
@@ -839,6 +832,11 @@ class ChatGLMModel(ChatGLMPreTrainedModel):
                 )
             if position_ids is None:
                 position_ids = self.get_position_ids(
                     seq=seq,
                     mask_position=mask_position,
@@ -942,7 +940,7 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
         attention_mask = (attention_mask < 0.5).bool()
         if self.position_encoding_2d:
-            seq_length = seq.index(130004)
             position_ids = torch.arange(context_length, dtype=torch.long, device=device)
             if not gmask:
                 position_ids[seq_length:] = mask_position
@@ -980,7 +978,7 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
         # only last token for input_ids if past is not None
         if past is not None or past_key_values is not None:
-            context_length = seq.index(130004)
             last_token = input_ids[:, -1].unsqueeze(-1)
             if self.position_encoding_2d:
                 position_ids = torch.tensor([[[mask_position], [len(seq) - context_length]]], dtype=torch.long,

     def set_input_embeddings(self, new_embeddings: torch.Tensor):
         self.word_embeddings = new_embeddings
+    def get_masks(self, seq, device):
+        context_length = seq.index(self.config.bos_token_id) + 1
         attention_mask = torch.ones((1, len(seq), len(seq)), device=device)
         attention_mask.tril_()
         return attention_mask
     def get_position_ids(self, seq, mask_position, device, gmask=False):
+        context_length = seq.index(self.config.bos_token_id) + 1
         if self.position_encoding_2d:
+            seq_length = seq.index(self.config.bos_token_id)
             position_ids = torch.arange(context_length, dtype=torch.long, device=device)
             if not gmask:
                 position_ids[seq_length:] = mask_position
         if past_key_values is None:
             past_key_values = tuple([None] * len(self.layers))
             seq = input_ids[0].tolist()
             if attention_mask is None:
                 attention_mask = self.get_masks(
                     seq=seq,
                 )
             if position_ids is None:
+                MASK, gMASK = 130000, 130001
+                mask_token = MASK if MASK in input_ids else gMASK
+                use_gmask = False if MASK in input_ids else gMASK
+                mask_position = seq.index(mask_token)
                 position_ids = self.get_position_ids(
                     seq=seq,
                     mask_position=mask_position,
         attention_mask = (attention_mask < 0.5).bool()
         if self.position_encoding_2d:
+            seq_length = seq.index(self.config.bos_token_id)
             position_ids = torch.arange(context_length, dtype=torch.long, device=device)
             if not gmask:
                 position_ids[seq_length:] = mask_position
         # only last token for input_ids if past is not None
         if past is not None or past_key_values is not None:
+            context_length = seq.index(self.config.bos_token_id)
             last_token = input_ids[:, -1].unsqueeze(-1)
             if self.position_encoding_2d:
                 position_ids = torch.tensor([[[mask_position], [len(seq) - context_length]]], dtype=torch.long,