GItaf
/

JointGPT2-warmup-from-CLS

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

GItaf commited on Nov 9, 2022

Commit

5b0b191

·

1 Parent(s): 279e2dd

End of training

Files changed (3) hide show

all_results.json +15 -15
train_results.json +4 -4
with_eval_results.json +11 -11

all_results.json CHANGED Viewed

@@ -1,19 +1,19 @@
 {
     "epoch": 3.0,
-    "eval_CLS loss": 2.33956241607666,
-    "eval_CLS_accuracy": 0.622478386167147,
-    "eval_CLS_f1": 0.615766951227354,
-    "eval_CLS_precision": 0.619580054950422,
-    "eval_CLS_recall": 0.622478386167147,
-    "eval_LM loss": 11.057974815368652,
-    "eval_Perplexity": "63447.93",
-    "eval_loss": 2.3409106731414795,
-    "eval_runtime": 116.8259,
-    "eval_samples_per_second": 14.851,
-    "eval_steps_per_second": 7.43,
     "total_flos": 1.088098614116352e+16,
-    "train_loss": 0.9344328573411984,
-    "train_runtime": 3737.2556,
-    "train_samples_per_second": 5.571,
-    "train_steps_per_second": 2.785
 }

 {
     "epoch": 3.0,
+    "eval_CLS loss": 1.8206377029418945,
+    "eval_CLS_accuracy": 0.6121037463976945,
+    "eval_CLS_f1": 0.6063092264509424,
+    "eval_CLS_precision": 0.6096390716759156,
+    "eval_CLS_recall": 0.6121037463976945,
+    "eval_LM loss": 4.016696453094482,
+    "eval_Perplexity": "55.52",
+    "eval_loss": 4.472171783447266,
+    "eval_runtime": 103.1433,
+    "eval_samples_per_second": 16.821,
+    "eval_steps_per_second": 8.415,
     "total_flos": 1.088098614116352e+16,
+    "train_loss": 4.316991906069885,
+    "train_runtime": 5832.0918,
+    "train_samples_per_second": 3.57,
+    "train_steps_per_second": 1.785
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.0,
     "total_flos": 1.088098614116352e+16,
-    "train_loss": 0.9344328573411984,
-    "train_runtime": 3737.2556,
-    "train_samples_per_second": 5.571,
-    "train_steps_per_second": 2.785
 }

 {
     "epoch": 3.0,
     "total_flos": 1.088098614116352e+16,
+    "train_loss": 4.316991906069885,
+    "train_runtime": 5832.0918,
+    "train_samples_per_second": 3.57,
+    "train_steps_per_second": 1.785
 }

with_eval_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 3.0,
-    "eval_CLS loss": 2.33956241607666,
-    "eval_CLS_accuracy": 0.622478386167147,
-    "eval_CLS_f1": 0.615766951227354,
-    "eval_CLS_precision": 0.619580054950422,
-    "eval_CLS_recall": 0.622478386167147,
-    "eval_LM loss": 11.057974815368652,
-    "eval_Perplexity": "63447.93",
-    "eval_loss": 2.3409106731414795,
-    "eval_runtime": 116.8259,
-    "eval_samples_per_second": 14.851,
-    "eval_steps_per_second": 7.43
 }

 {
     "epoch": 3.0,
+    "eval_CLS loss": 1.8206377029418945,
+    "eval_CLS_accuracy": 0.6121037463976945,
+    "eval_CLS_f1": 0.6063092264509424,
+    "eval_CLS_precision": 0.6096390716759156,
+    "eval_CLS_recall": 0.6121037463976945,
+    "eval_LM loss": 4.016696453094482,
+    "eval_Perplexity": "55.52",
+    "eval_loss": 4.472171783447266,
+    "eval_runtime": 103.1433,
+    "eval_samples_per_second": 16.821,
+    "eval_steps_per_second": 8.415
 }