thu-coai
/

LongLM-base

Text2Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Jiann commited on Sep 25, 2022

Commit

61670f0

·

1 Parent(s): fadb937

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -6,7 +6,6 @@ tags:
 - pytorch
 - lm-head
 - zh
-datasets:
 metrics:
 widget:
 - text: "小咕噜对靳司寒完全是个自来熟，小家伙爬进他怀里小手搂着他的脖子，奶声奶气的要求：“靳蜀黎,你给咕噜讲故事好不好？”讲故事？童话故事吗？“我不会。”小家伙明显不信。嘟着小嘴大眼汪汪的盯着他，“哼。”小家伙轻轻哼了一声,靳司寒默了半晌，<extra_id_1>"
@@ -49,6 +48,7 @@ We collect 120G novels as the pretraining data for LongLM.
    ```python\
    from transformers import T5Tokenizer, T5ForConditionalGeneration
    tokenizer = T5Tokenizer.from_pretrained('LongLM-large')
    model = T5ForConditionalGeneration.from_pretrained('LongLM-large')
    ```

 - pytorch
 - lm-head
 - zh
 metrics:
 widget:
 - text: "小咕噜对靳司寒完全是个自来熟，小家伙爬进他怀里小手搂着他的脖子，奶声奶气的要求：“靳蜀黎,你给咕噜讲故事好不好？”讲故事？童话故事吗？“我不会。”小家伙明显不信。嘟着小嘴大眼汪汪的盯着他，“哼。”小家伙轻轻哼了一声,靳司寒默了半晌，<extra_id_1>"
    ```python\
    from transformers import T5Tokenizer, T5ForConditionalGeneration
    tokenizer = T5Tokenizer.from_pretrained('LongLM-large')
+   tokenizer.add_special_tokens({"additional_special_tokens": ["<extra_id_%d>"%d for d in range(100)]})
    model = T5ForConditionalGeneration.from_pretrained('LongLM-large')
    ```