BEE-spoke-data
/

bert-plus-L8-v1.0-syntheticSTS-4k

Sentence Similarity

sentence-transformers

feature-extraction

document embedding

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

pszemraj commited on Mar 9, 2024

Commit

a0f8abb

·

verified ·

1 Parent(s): 633d6ae

Update README.md

Files changed (1) hide show

README.md +2 -37

README.md CHANGED Viewed

@@ -78,48 +78,13 @@ print("Sentence embeddings:")
 print(sentence_embeddings)
 ```
 ## Training
-The model was trained with the parameters:
-**DataLoader**:
-`sentence_transformers.datasets.NoDuplicatesDataLoader.NoDuplicatesDataLoader` of length 8663 with parameters:
-```
-{'batch_size': 32}
-```
 **Loss**:
 `sentence_transformers.losses.MatryoshkaLoss.MatryoshkaLoss` with parameters:
   ```
-  {'loss': 'MultipleNegativesRankingLoss', 'matryoshka_dims': [768, 512, 256, 128, 64], 'matryoshka_weights': [1, 1, 1, 1, 1], 'n_dims_per_step': -1}
   ```
-Parameters of the fit()-Method:
-```
-{
-    "epochs": 1,
-    "evaluation_steps": 216,
-    "evaluator": "sentence_transformers.evaluation.EmbeddingSimilarityEvaluator.EmbeddingSimilarityEvaluator",
-    "max_grad_norm": 1,
-    "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
-    "optimizer_params": {
-        "lr": 2e-05
-    },
-    "scheduler": "WarmupLinear",
-    "steps_per_epoch": null,
-    "warmup_steps": 867,
-    "weight_decay": 0.01
-}
-```
-## Full Model Architecture
-```
-SentenceTransformer(
-  (0): Transformer({'max_seq_length': 4096, 'do_lower_case': False}) with Transformer model: BertModel
-  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
-)
-```

 print(sentence_embeddings)
 ```
 ## Training
+The model was trained with the parameters:
 **Loss**:
 `sentence_transformers.losses.MatryoshkaLoss.MatryoshkaLoss` with parameters:
   ```
+  {'loss': 'CosineSimilarityLoss', 'matryoshka_dims': [768, 512, 256, 128, 64], 'matryoshka_weights': [1, 1, 1, 1, 1], 'n_dims_per_step': -1}
   ```