Spaces:

xlr8harder
/

completion

Runtime error

App Files Files Community

xlr8harder commited on Aug 12, 2024

Commit

f5bae26

1 Parent(s): 16b5cfc

add max tokens slider and set default repetition penalty to 0.1

Browse files

Files changed (1) hide show

app.py +11 -11

app.py CHANGED Viewed

@@ -11,14 +11,14 @@ client = OpenAI(
     api_key=api_key,
 )
-def generate_completion(prompt, temperature, repetition_penalty, stop_phrase):
     try:
         completion = client.completions.create(
             model="meta-llama/Meta-Llama-3.1-405B-FP8",
             prompt=prompt,
             temperature=temperature,
             frequency_penalty=repetition_penalty,
-            max_tokens=2000,
             stop=[stop_phrase] if stop_phrase else None
         )
         return completion.choices[0].text.strip()
@@ -40,20 +40,20 @@ with gr.Blocks(theme=gr.themes.Soft()) as iface:
             prompt_input = gr.Textbox(label="Prompt", lines=6, value="The best thing about being a cat is")
         with gr.Column(scale=1):
             temperature_slider = gr.Slider(minimum=0, maximum=1, value=0.7, step=0.1, label="Temperature")
-            repetition_penalty_slider = gr.Slider(minimum=0, maximum=2, value=1.1, step=0.1, label="Repetition Penalty")
             stop_phrase_input = gr.Textbox(label="Stop Phrase", placeholder="Enter stop phrase (optional)")
     with gr.Row():
         generate_button = gr.Button("Generate Completion")
         append_button = gr.Button("Append Completion to Prompt")
         clear_button = gr.Button("Clear All Fields")
     output_text = gr.Textbox(label="Generated Completion", lines=10)
     generate_button.click(
-        generate_completion,
-        inputs=[prompt_input, temperature_slider, repetition_penalty_slider, stop_phrase_input],
         outputs=output_text
     )
@@ -62,16 +62,16 @@ with gr.Blocks(theme=gr.themes.Soft()) as iface:
         inputs=[prompt_input, output_text],
         outputs=[prompt_input, output_text]
     )
     clear_button.click(
         clear_fields,
         outputs=[prompt_input, output_text]
     )
     gr.Markdown("""
----
-This interface is powered by the Llama 3.1 405B base model, served by [Hyperbolic](https://hyperbolic.xyz), The Open Access AI Cloud.
-Thank you to Hyperbolic for making this base model available!
-""")
 iface.launch(share=True)

     api_key=api_key,
 )
+def generate_completion(prompt, temperature, repetition_penalty, stop_phrase, max_tokens):
     try:
         completion = client.completions.create(
             model="meta-llama/Meta-Llama-3.1-405B-FP8",
             prompt=prompt,
             temperature=temperature,
             frequency_penalty=repetition_penalty,
+            max_tokens=max_tokens,
             stop=[stop_phrase] if stop_phrase else None
         )
         return completion.choices[0].text.strip()
             prompt_input = gr.Textbox(label="Prompt", lines=6, value="The best thing about being a cat is")
         with gr.Column(scale=1):
             temperature_slider = gr.Slider(minimum=0, maximum=1, value=0.7, step=0.1, label="Temperature")
+            repetition_penalty_slider = gr.Slider(minimum=0, maximum=2, value=0.1, step=0.1, label="Repetition Penalty")
+            max_tokens_slider = gr.Slider(minimum=1, maximum=4000, value=250, step=1, label="Max Tokens")
             stop_phrase_input = gr.Textbox(label="Stop Phrase", placeholder="Enter stop phrase (optional)")
     with gr.Row():
         generate_button = gr.Button("Generate Completion")
         append_button = gr.Button("Append Completion to Prompt")
         clear_button = gr.Button("Clear All Fields")
     output_text = gr.Textbox(label="Generated Completion", lines=10)
     generate_button.click(
+        generate_completion,
+        inputs=[prompt_input, temperature_slider, repetition_penalty_slider, stop_phrase_input, max_tokens_slider],
         outputs=output_text
     )
         inputs=[prompt_input, output_text],
         outputs=[prompt_input, output_text]
     )
     clear_button.click(
         clear_fields,
         outputs=[prompt_input, output_text]
     )
     gr.Markdown("""
+    ---
+    This interface is powered by the Llama 3.1 405B base model, served by [Hyperbolic](https://hyperbolic.xyz), The Open Access AI Cloud.
+    Thank you to Hyperbolic for making this base model available!
+    """)
 iface.launch(share=True)