unum-cloud
/

uform-vl-multilingual-v2

Feature Extraction

Model card Files Files and versions Community

kimihailv commited on Mar 28, 2024

Commit

2efb554

·

verified ·

1 Parent(s): c0946ae

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -129,7 +129,7 @@ To load the model:
 ```python
 import uform
-model = uform.get_model('unum-cloud/uform-vl-multilingual-v2')
 ```
 To encode data:
@@ -140,11 +140,11 @@ from PIL import Image
 text = 'a small red panda in a zoo'
 image = Image.open('red_panda.jpg')
-image_data = model.preprocess_image(image)
-text_data = model.preprocess_text(text)
-image_embedding = model.encode_image(image_data)
-text_embedding = model.encode_text(text_data)
 joint_embedding = model.encode_multimodal(image=image_data, text=text_data)
 ```

 ```python
 import uform
+model, processor = uform.get_model('unum-cloud/uform-vl-multilingual-v2')
 ```
 To encode data:
 text = 'a small red panda in a zoo'
 image = Image.open('red_panda.jpg')
+image_data = processor.preprocess_image(image)
+text_data = processor.preprocess_text(text)
+image_features, image_embedding = model.encode_image(image_data, return_features=True)
+text_features, text_embedding = model.encode_text(text_data, return_features=True)
 joint_embedding = model.encode_multimodal(image=image_data, text=text_data)
 ```