Spaces:

zb9
/

colqwen-embedding-api

Sleeping

App Files Files Community

zb9 commited on Nov 25, 2024

Commit

c0f6104

verified ·

1 Parent(s): f29450b

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -14

app.py CHANGED Viewed

@@ -1,10 +1,9 @@
 import gradio as gr
 from colpali_engine.models import ColQwen2, ColQwen2Processor
 import torch
-import base64
 from PIL import Image
-import io
 import logging
 # Setup logging
 logging.basicConfig(level=logging.INFO)
@@ -13,25 +12,37 @@ logger = logging.getLogger("colqwen-api")
 # Initialize model
 logger.info("Loading ColQwen2 model...")
 model = ColQwen2.from_pretrained(
-    "vidore/colqwen2-v0.1",
     torch_dtype=torch.bfloat16,
     device_map="auto",
 )
-processor = ColQwen2Processor.from_pretrained("vidore/colqwen2-v0.1")
 model = model.eval()
 logger.info("Model loaded successfully")
-def process_image(image_data):
     try:
         logger.info("Processing image")
-        processed = processor.process_images([image_data])
-        logger.info("Image processed")
-        with torch.no_grad():
-            embeddings = model(**processed)
-            logger.info(f"Embeddings generated: {embeddings.shape}")
-        return {"embeddings": embeddings.tolist()}
     except Exception as e:
         logger.error(f"Error: {str(e)}", exc_info=True)
         raise
@@ -40,8 +51,9 @@ interface = gr.Interface(
     fn=process_image,
     inputs=gr.Image(),
     outputs="json",
-    title="ColQwen2 Embedding API"
 )
-# Add share=True to create public URL
-interface.launch()

 import gradio as gr
 from colpali_engine.models import ColQwen2, ColQwen2Processor
 import torch
 from PIL import Image
 import logging
+import numpy as np
 # Setup logging
 logging.basicConfig(level=logging.INFO)
 # Initialize model
 logger.info("Loading ColQwen2 model...")
 model = ColQwen2.from_pretrained(
+    "vidore/colqwen2-v1.0",  # Updated to v1.0
     torch_dtype=torch.bfloat16,
     device_map="auto",
 )
+processor = ColQwen2Processor.from_pretrained("vidore/colqwen2-v1.0")
 model = model.eval()
 logger.info("Model loaded successfully")
+def process_image(image):
     try:
         logger.info("Processing image")
+        # Convert to PIL Image if needed
+        if not isinstance(image, Image.Image):
+            image = Image.fromarray(image)
+        # Process image
+        inputs = processor(
+            images=image,
+            return_tensors="pt"
+        ).to(model.device)
+        logger.info("Generating embeddings")
+        with torch.no_grad():
+            outputs = model(**inputs)
+            embeddings = outputs.last_hidden_state.mean(dim=1).cpu().numpy()
+        logger.info(f"Embeddings shape: {embeddings.shape}")
+        return {
+            "embeddings": embeddings.tolist(),
+            "shape": embeddings.shape
+        }
     except Exception as e:
         logger.error(f"Error: {str(e)}", exc_info=True)
         raise
     fn=process_image,
     inputs=gr.Image(),
     outputs="json",
+    title="ColQwen2 Embedding API",
+    description="Generate embeddings from images using ColQwen2"
 )
+# Launch with API
+interface.launch(server_name="0.0.0.0", server_port=7861)