jinaai
/

ReaderLM-v2

Text Generation

text-generation-inference

🇪🇺 Region: EU

Model card Files Files and versions Community

numb3r3 commited on 2 days ago

Commit

2a41ea3

·

verified ·

1 Parent(s): 9cb0bd3

fix: tokenizer in prompt building

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -177,7 +177,7 @@ html = "<html><body><h1>Hello, world!</h1></body></html>"
 html = clean_html(html)
-input_prompt = create_prompt(html)
 inputs = tokenizer.encode(input_prompt, return_tensors="pt").to(device)
 outputs = model.generate(
     inputs, max_new_tokens=1024, temperature=0, do_sample=False, repetition_penalty=1.08

 html = clean_html(html)
+input_prompt = create_prompt(html, tokenizer=tokenizer)
 inputs = tokenizer.encode(input_prompt, return_tensors="pt").to(device)
 outputs = model.generate(
     inputs, max_new_tokens=1024, temperature=0, do_sample=False, repetition_penalty=1.08