gokulsrinivasagan
/

bert_base_lda_100_v1_stsb

@@ -1,28 +1,13 @@
 ---
 library_name: transformers
-language:
-- en
 base_model: gokulsrinivasagan/bert_base_lda_100_v1
 tags:
 - generated_from_trainer
-datasets:
-- glue
 metrics:
 - spearmanr
 model-index:
 - name: bert_base_lda_100_v1_stsb
-  results:
-  - task:
-      name: Text Classification
-      type: text-classification
-    dataset:
-      name: GLUE STSB
-      type: glue
-      args: stsb
-    metrics:
-    - name: Spearmanr
-      type: spearmanr
-      value: .nan
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -30,12 +15,12 @@ should probably proofread and complete it, then remove this comment. -->
 # bert_base_lda_100_v1_stsb
-This model is a fine-tuned version of [gokulsrinivasagan/bert_base_lda_100_v1](https://huggingface.co/gokulsrinivasagan/bert_base_lda_100_v1) on the GLUE STSB dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.3028
-- Pearson: nan
-- Spearmanr: nan
-- Combined Score: nan
 ## Model description
@@ -54,7 +39,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.001
 - train_batch_size: 256
 - eval_batch_size: 256
 - seed: 10
@@ -66,21 +51,19 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Pearson | Spearmanr | Combined Score |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:---------:|:--------------:|
-| 5.4876        | 1.0   | 23   | 2.5971          | nan     | nan       | nan            |
-| 2.2047        | 2.0   | 46   | 2.3759          | nan     | nan       | nan            |
-| 2.2017        | 3.0   | 69   | 2.4512          | nan     | nan       | nan            |
-| 2.1807        | 4.0   | 92   | 2.4512          | nan     | nan       | nan            |
-| 2.1807        | 5.0   | 115  | 2.5112          | nan     | nan       | nan            |
-| 2.196         | 6.0   | 138  | 2.3448          | nan     | nan       | nan            |
-| 2.1902        | 7.0   | 161  | 2.7164          | nan     | nan       | nan            |
-| 2.1899        | 8.0   | 184  | 2.6349          | nan     | nan       | nan            |
-| 2.1962        | 9.0   | 207  | 2.3354          | nan     | nan       | nan            |
-| 2.1802        | 10.0  | 230  | 2.3028          | nan     | nan       | nan            |
-| 2.1945        | 11.0  | 253  | 2.7164          | nan     | nan       | nan            |
-| 2.1932        | 12.0  | 276  | 2.7380          | nan     | nan       | nan            |
-| 2.206         | 13.0  | 299  | 2.7380          | nan     | nan       | nan            |
-| 2.1965        | 14.0  | 322  | 2.6546          | nan     | nan       | nan            |
-| 2.1794        | 15.0  | 345  | 2.4802          | nan     | nan       | nan            |
 ### Framework versions

 ---
 library_name: transformers
 base_model: gokulsrinivasagan/bert_base_lda_100_v1
 tags:
 - generated_from_trainer
 metrics:
 - spearmanr
 model-index:
 - name: bert_base_lda_100_v1_stsb
+  results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 # bert_base_lda_100_v1_stsb
+This model is a fine-tuned version of [gokulsrinivasagan/bert_base_lda_100_v1](https://huggingface.co/gokulsrinivasagan/bert_base_lda_100_v1) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.0560
+- Pearson: 0.5304
+- Spearmanr: 0.5350
+- Combined Score: 0.5327
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 256
 - eval_batch_size: 256
 - seed: 10
 | Training Loss | Epoch | Step | Validation Loss | Pearson | Spearmanr | Combined Score |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:---------:|:--------------:|
+| 2.7331        | 1.0   | 23   | 2.6189          | 0.0643  | 0.0760    | 0.0701         |
+| 1.9804        | 2.0   | 46   | 2.0897          | 0.2818  | 0.2688    | 0.2753         |
+| 1.7486        | 3.0   | 69   | 1.9471          | 0.4158  | 0.4153    | 0.4155         |
+| 1.2963        | 4.0   | 92   | 2.3058          | 0.4520  | 0.4674    | 0.4597         |
+| 1.0162        | 5.0   | 115  | 1.8442          | 0.4887  | 0.4888    | 0.4888         |
+| 0.8446        | 6.0   | 138  | 1.7664          | 0.5228  | 0.5290    | 0.5259         |
+| 0.6767        | 7.0   | 161  | 1.7574          | 0.5152  | 0.5185    | 0.5168         |
+| 0.5349        | 8.0   | 184  | 1.6844          | 0.5330  | 0.5325    | 0.5328         |
+| 0.4606        | 9.0   | 207  | 1.9862          | 0.5039  | 0.5084    | 0.5062         |
+| 0.3951        | 10.0  | 230  | 1.8024          | 0.5266  | 0.5275    | 0.5270         |
+| 0.3624        | 11.0  | 253  | 2.0157          | 0.5342  | 0.5423    | 0.5382         |
+| 0.3087        | 12.0  | 276  | 2.4094          | 0.5227  | 0.5385    | 0.5306         |
+| 0.2879        | 13.0  | 299  | 2.0560          | 0.5304  | 0.5350    | 0.5327         |
 ### Framework versions

logs/events.out.tfevents.1733317372.ki-g0008.1208741.12 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ddb8a7305a50d732206b4b90625ada95bb8b22d1b11d7cb250039c25b844d92
-size 12773

 version https://git-lfs.github.com/spec/v1
+oid sha256:c7640b87382a86b5b93bfa357e472d263fe0d57f864f65f9d3d9c88aa5ca54b3
+size 13771

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:335b48f7b5a5ce495a5edcef65a901f1dcb4aa1a94d36f0dae65ac69d2e5dafe
 size 437950172

 version https://git-lfs.github.com/spec/v1
+oid sha256:be8e0462bd543b624e2b6a98156c9c32bd73370440f02f9fe6be5df79927c62f
 size 437950172