Spaces:

mlwong
/

npc-bert-demo

Running on Zero

ML Wong commited on Feb 27, 2024

Commit

411fb81

1 Parent(s): 597c86a

Update model

Files changed (2) hide show

models/npc-bert-gpt2-best/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffa5b9e133f91b3757ce917312ddc5c57754cb4f5e94b6942bcf1cdc612f623f
 size 1046838512

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddbf903b6f48ae6b9e950249c403ea0bb51060cff36457968fc932b0e22130c4
 size 1046838512

npc_bert_models/summary_module.py CHANGED Viewed

@@ -1,6 +1,7 @@
 from transformers import AutoTokenizer, EncoderDecoderModel
 from transformers import pipeline as hf_pipeline
 from pathlib import Path
 class NpcBertGPT2():
@@ -33,10 +34,10 @@ class NpcBertGPT2():
                                     device='cpu',
                                     num_beams=4,
                                     do_sample=True,
-                                    top_p = 0.92,
-                                    top_k = 0,
                                     early_stopping=True,
-                                    no_repeat_ngram_size=2,
                                     max_new_tokens=60)
     def __call__(self, *args):
@@ -61,5 +62,13 @@ class NpcBertGPT2():
         pipe_out, = self.pipeline(*args)
         pipe_out = pipe_out['generated_text']
         return pipe_out

 from transformers import AutoTokenizer, EncoderDecoderModel
 from transformers import pipeline as hf_pipeline
 from pathlib import Path
+import re
 class NpcBertGPT2():
                                     device='cpu',
                                     num_beams=4,
                                     do_sample=True,
+                                    top_k = 5,
+                                    temperature=.95,
                                     early_stopping=True,
+                                    no_repeat_ngram_size=5,
                                     max_new_tokens=60)
     def __call__(self, *args):
         pipe_out, = self.pipeline(*args)
         pipe_out = pipe_out['generated_text']
+        # remove repeated lines by hard coding
+        mo = re.search("\. (questionable|anterio|zius)", pipe_out)
+        if mo is not None:
+            end_sig = mo.start()
+            pipe_out = pipe_out[:end_sig + 1]
         return pipe_out