Spaces:

Fred808
/

808-GPT2

Running

App Files Files Community

Fred808 commited on 3 days ago

Commit

36267e8

verified ·

1 Parent(s): cc53fa3

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -54

app.py CHANGED Viewed

@@ -1,68 +1,49 @@
-from fastapi import FastAPI, HTTPException
-from pydantic import BaseModel
 import os
 import logging
-import openai
 # Read the NVIDIA API key from environment variables
 api_key = os.getenv("NVIDIA_API_KEY")
 if api_key is None:
     raise ValueError("NVIDIA API key not found in environment variables. Please set the NVIDIA_API_KEY.")
-# Initialize FastAPI app
-app = FastAPI()
 # Set up logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 # NVIDIA API configuration
-openai.api_key = api_key
-openai.base_url = "https://integrate.api.nvidia.com/v1"
-# Define request body schema
-class TextGenerationRequest(BaseModel):
-    prompt: str
-    max_new_tokens: int = 1024
-    temperature: float = 0.4
-    top_p: float = 0.7
-    stream: bool = True
-# Define API endpoint
-@app.post("/generate-text")
-async def generate_text(request: TextGenerationRequest):
-    try:
-        logger.info("Generating text...")
-        # Generate response from NVIDIA API
-        response = openai.ChatCompletion.create(
-            model="meta/llama-3.1-405b-instruct",
-            messages=[{"role": "user", "content": request.prompt}],
-            temperature=request.temperature,
-            top_p=request.top_p,
-            max_tokens=request.max_new_tokens,
-            stream=request.stream,
-        )
         response_text = ""
-        if request.stream:
-            for chunk in response:
-                if chunk.choices[0].delta.get("content"):
-                    response_text += chunk.choices[0].delta.content
-        else:
-            response_text = response["choices"][0]["message"]["content"]
-        return {"generated_text": response_text}
-    except Exception as e:
-        logger.error(f"Error generating text: {e}")
-        raise HTTPException(status_code=500, detail=str(e))
-# Add a root endpoint for health checks
-@app.get("/")
-async def root():
-    return {"message": "Welcome Fred808 GPT"}
-# Add a test endpoint
-@app.get("/test")
-async def test():
-    return {"message": "API is running!"}

 import os
+import requests
 import logging
 # Read the NVIDIA API key from environment variables
 api_key = os.getenv("NVIDIA_API_KEY")
 if api_key is None:
     raise ValueError("NVIDIA API key not found in environment variables. Please set the NVIDIA_API_KEY.")
 # Set up logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 # NVIDIA API configuration
+base_url = "https://integrate.api.nvidia.com/v1"
+headers = {
+    "Authorization": f"Bearer {api_key}",
+    "Content-Type": "application/json"
+}
+# Define request payload
+payload = {
+    "model": "meta/llama-3.1-405b-instruct",  # Model for NVIDIA's text generation
+    "messages": [{"role": "user", "content": "Write a limerick about the wonders of GPU computing."}],
+    "temperature": 0.2,
+    "top_p": 0.7,
+    "max_tokens": 1024,
+    "stream": True
+}
+# Call NVIDIA's API for text generation
+try:
+    logger.info("Generating text with NVIDIA API...")
+    response = requests.post(f"{base_url}/chat/completions", headers=headers, json=payload, stream=True)
+    if response.status_code == 200:
+        # Stream the response
         response_text = ""
+        for chunk in response.iter_lines():
+            if chunk:
+                data = chunk.decode("utf-8")
+                # Extract the content from the response (adjust based on actual API response structure)
+                if "content" in data:
+                    response_text += data["choices"][0]["delta"].get("content", "")
+                    print(response_text, end="")  # Print content as it's received
+    else:
+        logger.error(f"Error: {response.status_code} - {response.text}")
+except Exception as e:
+    logger.error(f"Error generating text: {e}")