sachin
/

tiny_clip

Zero-Shot Image Classification

English

Model card Files Files and versions Community

sachin commited on May 4, 2024

Commit

18cb46c

•

1 Parent(s): 69fda24

Succesfully uploaded model to HF hub in correct place

Browse files

Files changed (2) hide show

src/config.py +5 -0
src/trainer.py +29 -10

src/config.py CHANGED Viewed

@@ -8,12 +8,17 @@ MAX_DOWNLOAD_TIME = 0.2
 IMAGE_DOWNLOAD_PATH = pathlib.Path("./data/images")
 WANDB_LOG_PATH = pathlib.Path("/tmp/wandb_logs")
 MODEL_PATH = pathlib.Path("/tmp/models")
 IMAGE_DOWNLOAD_PATH.mkdir(parents=True, exist_ok=True)
 WANDB_LOG_PATH.mkdir(parents=True, exist_ok=True)
 MODEL_PATH.mkdir(parents=True, exist_ok=True)
 MODEL_NAME = "tiny_clip"
 WANDB_ENTITY = "sachinruk"

 IMAGE_DOWNLOAD_PATH = pathlib.Path("./data/images")
 WANDB_LOG_PATH = pathlib.Path("/tmp/wandb_logs")
 MODEL_PATH = pathlib.Path("/tmp/models")
+VISION_MODEL_PATH = MODEL_PATH / "vision"
+TEXT_MODEL_PATH = MODEL_PATH / "text"
 IMAGE_DOWNLOAD_PATH.mkdir(parents=True, exist_ok=True)
 WANDB_LOG_PATH.mkdir(parents=True, exist_ok=True)
 MODEL_PATH.mkdir(parents=True, exist_ok=True)
+VISION_MODEL_PATH.mkdir(parents=True, exist_ok=True)
+TEXT_MODEL_PATH.mkdir(parents=True, exist_ok=True)
 MODEL_NAME = "tiny_clip"
+REPO_ID = "sachin/clip-model"
 WANDB_ENTITY = "sachinruk"

src/trainer.py CHANGED Viewed

@@ -1,5 +1,8 @@
 import os
 from src import config
 from src import data
 from src import loss
@@ -11,23 +14,39 @@ from src.lightning_module import LightningModule
 def _upload_model_to_hub(
-    vision_encoder: models.TinyCLIPVisionEncoder, text_encoder: models.TinyCLIPTextEncoder
 ):
     vision_encoder.save_pretrained(
-        str(config.MODEL_PATH),
-        variant="vision_encoder",
         safe_serialization=True,
-        push_to_hub=True,
-        repo_id="debug-clip-model",
     )
     text_encoder.save_pretrained(
-        str(config.MODEL_PATH),
-        variant="text_encoder",
         safe_serialization=True,
-        push_to_hub=True,
-        repo_id="debug-clip-model",
     )
 def train(trainer_config: config.TrainerConfig):
     if "HF_TOKEN" not in os.environ:
@@ -51,7 +70,7 @@ def train(trainer_config: config.TrainerConfig):
     trainer = utils.get_trainer(trainer_config)
     trainer.fit(lightning_module, train_dl, valid_dl)
-    _upload_model_to_hub(vision_encoder, text_encoder)
 if __name__ == "__main__":

 import os
+from huggingface_hub import HfApi
+from loguru import logger
 from src import config
 from src import data
 from src import loss
 def _upload_model_to_hub(
+    vision_encoder: models.TinyCLIPVisionEncoder,
+    text_encoder: models.TinyCLIPTextEncoder,
+    debug: bool = False,
 ):
     vision_encoder.save_pretrained(
+        str(config.VISION_MODEL_PATH),
         safe_serialization=True,
     )
     text_encoder.save_pretrained(
+        str(config.TEXT_MODEL_PATH),
         safe_serialization=True,
     )
+    api = HfApi()
+    if debug:
+        repo_components = config.REPO_ID.split("/", maxsplit=1)
+        repo_components[1] = f"debug-{repo_components[1]}"
+        repo_id = "/".join(repo_components)
+    else:
+        repo_id = config.REPO_ID
+    common_hf_api_params = {
+        "repo_id": repo_id,
+        "repo_type": "model",
+    }
+    if not api.repo_exists(**common_hf_api_params):
+        logger.info(f"Creating repo {repo_id} on Hugging Face Hub.")
+        api.create_repo(**common_hf_api_params)  # type: ignore
+    logger.info(f"Uploading models in {str(config.MODEL_PATH)} to {repo_id}.")
+    api.upload_folder(
+        folder_path=config.MODEL_PATH,
+        **common_hf_api_params,  # type: ignore
+    )  # type: ignore
 def train(trainer_config: config.TrainerConfig):
     if "HF_TOKEN" not in os.environ:
     trainer = utils.get_trainer(trainer_config)
     trainer.fit(lightning_module, train_dl, valid_dl)
+    _upload_model_to_hub(vision_encoder, text_encoder, trainer_config.debug)
 if __name__ == "__main__":