End of training

Browse files

Files changed (6) hide show

README.md +65 -0
config.json +1 -0
model.safetensors +1 -1
runs/Jan18_17-06-46_a40b44969e29/events.out.tfevents.1705597609.a40b44969e29.1174.5 +3 -0
runs/Jan18_17-07-53_a40b44969e29/events.out.tfevents.1705597677.a40b44969e29.1174.6 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,6 +3,11 @@ license: apache-2.0
 base_model: distilbert-base-uncased
 tags:
 - generated_from_trainer
 model-index:
 - name: DIALOGUE_one
   results: []
@@ -14,6 +19,12 @@ should probably proofread and complete it, then remove this comment. -->
 # DIALOGUE_one
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
 ## Model description
@@ -40,6 +51,60 @@ The following hyperparameters were used during training:
 - lr_scheduler_type: linear
 - num_epochs: 30
 ### Framework versions
 - Transformers 4.36.2

 base_model: distilbert-base-uncased
 tags:
 - generated_from_trainer
+metrics:
+- precision
+- recall
+- f1
+- accuracy
 model-index:
 - name: DIALOGUE_one
   results: []
 # DIALOGUE_one
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.1858
+- Precision: 0.9762
+- Recall: 0.9737
+- F1: 0.9736
+- Accuracy: 0.9737
 ## Model description
 - lr_scheduler_type: linear
 - num_epochs: 30
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Precision | Recall | F1     | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:---------:|:------:|:------:|:--------:|
+| 1.1337        | 0.62  | 30   | 0.7680          | 0.9196    | 0.8816 | 0.8745 | 0.8816   |
+| 0.6026        | 1.25  | 60   | 0.2921          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.2622        | 1.88  | 90   | 0.1333          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0839        | 2.5   | 120  | 0.0827          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0477        | 3.12  | 150  | 0.1079          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.031         | 3.75  | 180  | 0.1360          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0119        | 4.38  | 210  | 0.1309          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0087        | 5.0   | 240  | 0.1303          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0067        | 5.62  | 270  | 0.1373          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0055        | 6.25  | 300  | 0.1401          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0049        | 6.88  | 330  | 0.1459          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0043        | 7.5   | 360  | 0.1443          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0034        | 8.12  | 390  | 0.1448          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0033        | 8.75  | 420  | 0.1477          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.003         | 9.38  | 450  | 0.1531          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0026        | 10.0  | 480  | 0.1543          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0024        | 10.62 | 510  | 0.1591          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0022        | 11.25 | 540  | 0.1612          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0021        | 11.88 | 570  | 0.1672          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0018        | 12.5  | 600  | 0.1672          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0017        | 13.12 | 630  | 0.1677          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0017        | 13.75 | 660  | 0.1677          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0015        | 14.38 | 690  | 0.1698          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0014        | 15.0  | 720  | 0.1714          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0013        | 15.62 | 750  | 0.1721          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0013        | 16.25 | 780  | 0.1733          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0012        | 16.88 | 810  | 0.1752          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0012        | 17.5  | 840  | 0.1769          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0011        | 18.12 | 870  | 0.1778          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0011        | 18.75 | 900  | 0.1788          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.001         | 19.38 | 930  | 0.1786          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.001         | 20.0  | 960  | 0.1794          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.001         | 20.62 | 990  | 0.1802          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.001         | 21.25 | 1020 | 0.1811          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0009        | 21.88 | 1050 | 0.1819          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0009        | 22.5  | 1080 | 0.1823          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0009        | 23.12 | 1110 | 0.1833          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0009        | 23.75 | 1140 | 0.1843          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 24.38 | 1170 | 0.1842          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 25.0  | 1200 | 0.1842          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 25.62 | 1230 | 0.1846          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 26.25 | 1260 | 0.1850          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 26.88 | 1290 | 0.1851          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 27.5  | 1320 | 0.1853          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0007        | 28.12 | 1350 | 0.1855          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 28.75 | 1380 | 0.1856          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 29.38 | 1410 | 0.1857          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
+| 0.0008        | 30.0  | 1440 | 0.1858          | 0.9762    | 0.9737 | 0.9736 | 0.9737   |
 ### Framework versions
 - Transformers 4.36.2

config.json CHANGED Viewed

@@ -26,6 +26,7 @@
   "n_heads": 12,
   "n_layers": 6,
   "pad_token_id": 0,
   "qa_dropout": 0.1,
   "seq_classif_dropout": 0.2,
   "sinusoidal_pos_embds": false,

   "n_heads": 12,
   "n_layers": 6,
   "pad_token_id": 0,
+  "problem_type": "single_label_classification",
   "qa_dropout": 0.1,
   "seq_classif_dropout": 0.2,
   "sinusoidal_pos_embds": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0c2b52f7a37b66202e2caad7fadcc5bc227b0fb90c7f1b7dfc45635a437f530
 size 267838720

 version https://git-lfs.github.com/spec/v1
+oid sha256:d86d3b0debff9cf87da8e207e1e9cad9a402d1a725ee7dcfb06f7f44c0f6958f
 size 267838720

runs/Jan18_17-06-46_a40b44969e29/events.out.tfevents.1705597609.a40b44969e29.1174.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a6c5195a0d1af8c6afbe5e4d77351bf4ed91ad1ec9e34e934bcf80eb3aea7da6
+size 12183

runs/Jan18_17-07-53_a40b44969e29/events.out.tfevents.1705597677.a40b44969e29.1174.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:59e7e4eab3be71605e2fd0c897906356bc763dc57999baa2c46c9583de694af2
+size 34933

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e952b795121b18f958ab9ceef0930a263e333ddfa90f2c19478ffb0700419092
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:25d4f6edac9fbedccdef416fb938f4f1827ad2fcd10e37f0b2e44e65eb0e558e
 size 4664