{
  "best_metric": 5.539509738576612,
  "best_model_checkpoint": "./training/results/checkpoint-20000",
  "epoch": 79.13669064748201,
  "eval_steps": 1000,
  "global_step": 22000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.08992805755395683,
      "grad_norm": 12.73649787902832,
      "learning_rate": 1.2500000000000002e-07,
      "loss": 3.2522,
      "step": 25
    },
    {
      "epoch": 0.17985611510791366,
      "grad_norm": 12.000336647033691,
      "learning_rate": 2.5000000000000004e-07,
      "loss": 3.0617,
      "step": 50
    },
    {
      "epoch": 0.2697841726618705,
      "grad_norm": 10.76065444946289,
      "learning_rate": 3.75e-07,
      "loss": 2.7165,
      "step": 75
    },
    {
      "epoch": 0.3597122302158273,
      "grad_norm": 8.36201286315918,
      "learning_rate": 5.000000000000001e-07,
      "loss": 2.2607,
      "step": 100
    },
    {
      "epoch": 0.44964028776978415,
      "grad_norm": 7.234769344329834,
      "learning_rate": 6.25e-07,
      "loss": 1.8433,
      "step": 125
    },
    {
      "epoch": 0.539568345323741,
      "grad_norm": 6.549698829650879,
      "learning_rate": 7.5e-07,
      "loss": 1.5515,
      "step": 150
    },
    {
      "epoch": 0.6294964028776978,
      "grad_norm": 7.549570083618164,
      "learning_rate": 8.75e-07,
      "loss": 1.3346,
      "step": 175
    },
    {
      "epoch": 0.7194244604316546,
      "grad_norm": 5.8322930335998535,
      "learning_rate": 1.0000000000000002e-06,
      "loss": 1.0572,
      "step": 200
    },
    {
      "epoch": 0.8093525179856115,
      "grad_norm": 3.925255537033081,
      "learning_rate": 1.125e-06,
      "loss": 0.6348,
      "step": 225
    },
    {
      "epoch": 0.8992805755395683,
      "grad_norm": 3.1902644634246826,
      "learning_rate": 1.25e-06,
      "loss": 0.4882,
      "step": 250
    },
    {
      "epoch": 0.9892086330935251,
      "grad_norm": 3.355315923690796,
      "learning_rate": 1.3750000000000002e-06,
      "loss": 0.4032,
      "step": 275
    },
    {
      "epoch": 1.079136690647482,
      "grad_norm": 3.4707915782928467,
      "learning_rate": 1.5e-06,
      "loss": 0.3355,
      "step": 300
    },
    {
      "epoch": 1.169064748201439,
      "grad_norm": 3.261484384536743,
      "learning_rate": 1.6250000000000001e-06,
      "loss": 0.2896,
      "step": 325
    },
    {
      "epoch": 1.2589928057553956,
      "grad_norm": 3.3107025623321533,
      "learning_rate": 1.75e-06,
      "loss": 0.2685,
      "step": 350
    },
    {
      "epoch": 1.3489208633093526,
      "grad_norm": 2.6028969287872314,
      "learning_rate": 1.8750000000000003e-06,
      "loss": 0.2365,
      "step": 375
    },
    {
      "epoch": 1.4388489208633093,
      "grad_norm": 3.380187749862671,
      "learning_rate": 2.0000000000000003e-06,
      "loss": 0.2333,
      "step": 400
    },
    {
      "epoch": 1.5287769784172662,
      "grad_norm": 3.0845112800598145,
      "learning_rate": 2.125e-06,
      "loss": 0.2191,
      "step": 425
    },
    {
      "epoch": 1.6187050359712232,
      "grad_norm": 3.15523099899292,
      "learning_rate": 2.25e-06,
      "loss": 0.1949,
      "step": 450
    },
    {
      "epoch": 1.70863309352518,
      "grad_norm": 2.5198237895965576,
      "learning_rate": 2.375e-06,
      "loss": 0.1756,
      "step": 475
    },
    {
      "epoch": 1.7985611510791366,
      "grad_norm": 2.7945399284362793,
      "learning_rate": 2.5e-06,
      "loss": 0.1748,
      "step": 500
    },
    {
      "epoch": 1.8884892086330936,
      "grad_norm": 3.299269199371338,
      "learning_rate": 2.6250000000000003e-06,
      "loss": 0.1711,
      "step": 525
    },
    {
      "epoch": 1.9784172661870505,
      "grad_norm": 2.3727056980133057,
      "learning_rate": 2.7500000000000004e-06,
      "loss": 0.1495,
      "step": 550
    },
    {
      "epoch": 2.068345323741007,
      "grad_norm": 2.1909244060516357,
      "learning_rate": 2.875e-06,
      "loss": 0.1196,
      "step": 575
    },
    {
      "epoch": 2.158273381294964,
      "grad_norm": 2.45758318901062,
      "learning_rate": 3e-06,
      "loss": 0.1023,
      "step": 600
    },
    {
      "epoch": 2.2482014388489207,
      "grad_norm": 2.009880542755127,
      "learning_rate": 3.125e-06,
      "loss": 0.1019,
      "step": 625
    },
    {
      "epoch": 2.338129496402878,
      "grad_norm": 2.2170872688293457,
      "learning_rate": 3.2500000000000002e-06,
      "loss": 0.0948,
      "step": 650
    },
    {
      "epoch": 2.4280575539568345,
      "grad_norm": 1.9289822578430176,
      "learning_rate": 3.3750000000000003e-06,
      "loss": 0.0934,
      "step": 675
    },
    {
      "epoch": 2.5179856115107913,
      "grad_norm": 2.0615289211273193,
      "learning_rate": 3.5e-06,
      "loss": 0.0935,
      "step": 700
    },
    {
      "epoch": 2.6079136690647484,
      "grad_norm": 2.231041193008423,
      "learning_rate": 3.625e-06,
      "loss": 0.0923,
      "step": 725
    },
    {
      "epoch": 2.697841726618705,
      "grad_norm": 1.953312873840332,
      "learning_rate": 3.7500000000000005e-06,
      "loss": 0.0844,
      "step": 750
    },
    {
      "epoch": 2.787769784172662,
      "grad_norm": 2.1245667934417725,
      "learning_rate": 3.875e-06,
      "loss": 0.0831,
      "step": 775
    },
    {
      "epoch": 2.8776978417266186,
      "grad_norm": 1.8499614000320435,
      "learning_rate": 4.000000000000001e-06,
      "loss": 0.0841,
      "step": 800
    },
    {
      "epoch": 2.9676258992805753,
      "grad_norm": 2.0503857135772705,
      "learning_rate": 4.125e-06,
      "loss": 0.0854,
      "step": 825
    },
    {
      "epoch": 3.0575539568345325,
      "grad_norm": 2.0084242820739746,
      "learning_rate": 4.25e-06,
      "loss": 0.0621,
      "step": 850
    },
    {
      "epoch": 3.147482014388489,
      "grad_norm": 1.3122639656066895,
      "learning_rate": 4.3750000000000005e-06,
      "loss": 0.0434,
      "step": 875
    },
    {
      "epoch": 3.237410071942446,
      "grad_norm": 1.3615615367889404,
      "learning_rate": 4.5e-06,
      "loss": 0.0416,
      "step": 900
    },
    {
      "epoch": 3.327338129496403,
      "grad_norm": 1.533996343612671,
      "learning_rate": 4.625000000000001e-06,
      "loss": 0.0451,
      "step": 925
    },
    {
      "epoch": 3.41726618705036,
      "grad_norm": 1.573549509048462,
      "learning_rate": 4.75e-06,
      "loss": 0.0404,
      "step": 950
    },
    {
      "epoch": 3.5071942446043165,
      "grad_norm": 1.4288333654403687,
      "learning_rate": 4.875e-06,
      "loss": 0.044,
      "step": 975
    },
    {
      "epoch": 3.597122302158273,
      "grad_norm": 1.5075387954711914,
      "learning_rate": 5e-06,
      "loss": 0.0479,
      "step": 1000
    },
    {
      "epoch": 3.597122302158273,
      "eval_loss": 0.10350359231233597,
      "eval_runtime": 1344.3937,
      "eval_samples_per_second": 1.653,
      "eval_steps_per_second": 0.103,
      "eval_wer": 20.29178701029401,
      "step": 1000
    },
    {
      "epoch": 3.68705035971223,
      "grad_norm": 1.842606782913208,
      "learning_rate": 4.998737373737374e-06,
      "loss": 0.0467,
      "step": 1025
    },
    {
      "epoch": 3.776978417266187,
      "grad_norm": 1.495784044265747,
      "learning_rate": 4.997474747474748e-06,
      "loss": 0.0437,
      "step": 1050
    },
    {
      "epoch": 3.866906474820144,
      "grad_norm": 2.054900646209717,
      "learning_rate": 4.9962121212121216e-06,
      "loss": 0.0497,
      "step": 1075
    },
    {
      "epoch": 3.956834532374101,
      "grad_norm": 1.438658356666565,
      "learning_rate": 4.9949494949494956e-06,
      "loss": 0.0398,
      "step": 1100
    },
    {
      "epoch": 4.046762589928058,
      "grad_norm": 1.3041224479675293,
      "learning_rate": 4.993686868686869e-06,
      "loss": 0.0293,
      "step": 1125
    },
    {
      "epoch": 4.136690647482014,
      "grad_norm": 1.2206145524978638,
      "learning_rate": 4.992424242424243e-06,
      "loss": 0.0227,
      "step": 1150
    },
    {
      "epoch": 4.226618705035971,
      "grad_norm": 1.2926621437072754,
      "learning_rate": 4.991161616161617e-06,
      "loss": 0.0231,
      "step": 1175
    },
    {
      "epoch": 4.316546762589928,
      "grad_norm": 1.4683257341384888,
      "learning_rate": 4.98989898989899e-06,
      "loss": 0.023,
      "step": 1200
    },
    {
      "epoch": 4.406474820143885,
      "grad_norm": 1.3095593452453613,
      "learning_rate": 4.988636363636364e-06,
      "loss": 0.0226,
      "step": 1225
    },
    {
      "epoch": 4.496402877697841,
      "grad_norm": 0.7059262990951538,
      "learning_rate": 4.987373737373738e-06,
      "loss": 0.0225,
      "step": 1250
    },
    {
      "epoch": 4.586330935251799,
      "grad_norm": 1.1493045091629028,
      "learning_rate": 4.986111111111112e-06,
      "loss": 0.022,
      "step": 1275
    },
    {
      "epoch": 4.676258992805756,
      "grad_norm": 1.9609806537628174,
      "learning_rate": 4.984848484848485e-06,
      "loss": 0.0232,
      "step": 1300
    },
    {
      "epoch": 4.766187050359712,
      "grad_norm": 1.5463200807571411,
      "learning_rate": 4.983585858585859e-06,
      "loss": 0.0206,
      "step": 1325
    },
    {
      "epoch": 4.856115107913669,
      "grad_norm": 0.858127772808075,
      "learning_rate": 4.982323232323233e-06,
      "loss": 0.0222,
      "step": 1350
    },
    {
      "epoch": 4.946043165467626,
      "grad_norm": 0.8384924530982971,
      "learning_rate": 4.981060606060606e-06,
      "loss": 0.0201,
      "step": 1375
    },
    {
      "epoch": 5.0359712230215825,
      "grad_norm": 0.9966625571250916,
      "learning_rate": 4.97979797979798e-06,
      "loss": 0.0173,
      "step": 1400
    },
    {
      "epoch": 5.125899280575539,
      "grad_norm": 0.6609445214271545,
      "learning_rate": 4.978535353535353e-06,
      "loss": 0.0113,
      "step": 1425
    },
    {
      "epoch": 5.215827338129497,
      "grad_norm": 0.82105952501297,
      "learning_rate": 4.977272727272728e-06,
      "loss": 0.012,
      "step": 1450
    },
    {
      "epoch": 5.305755395683454,
      "grad_norm": 1.0994760990142822,
      "learning_rate": 4.976010101010101e-06,
      "loss": 0.0118,
      "step": 1475
    },
    {
      "epoch": 5.39568345323741,
      "grad_norm": 0.4543660283088684,
      "learning_rate": 4.974747474747475e-06,
      "loss": 0.0112,
      "step": 1500
    },
    {
      "epoch": 5.485611510791367,
      "grad_norm": 3.425143241882324,
      "learning_rate": 4.973484848484849e-06,
      "loss": 0.0113,
      "step": 1525
    },
    {
      "epoch": 5.575539568345324,
      "grad_norm": 0.7691114544868469,
      "learning_rate": 4.9722222222222224e-06,
      "loss": 0.0114,
      "step": 1550
    },
    {
      "epoch": 5.66546762589928,
      "grad_norm": 0.5446438789367676,
      "learning_rate": 4.9709595959595964e-06,
      "loss": 0.0121,
      "step": 1575
    },
    {
      "epoch": 5.755395683453237,
      "grad_norm": 0.7232896089553833,
      "learning_rate": 4.9696969696969696e-06,
      "loss": 0.0118,
      "step": 1600
    },
    {
      "epoch": 5.845323741007194,
      "grad_norm": 1.3025506734848022,
      "learning_rate": 4.968434343434344e-06,
      "loss": 0.0135,
      "step": 1625
    },
    {
      "epoch": 5.935251798561151,
      "grad_norm": 1.2080421447753906,
      "learning_rate": 4.9671717171717176e-06,
      "loss": 0.0126,
      "step": 1650
    },
    {
      "epoch": 6.025179856115108,
      "grad_norm": 0.4218277633190155,
      "learning_rate": 4.9659090909090916e-06,
      "loss": 0.0094,
      "step": 1675
    },
    {
      "epoch": 6.115107913669065,
      "grad_norm": 0.5942659378051758,
      "learning_rate": 4.964646464646465e-06,
      "loss": 0.0071,
      "step": 1700
    },
    {
      "epoch": 6.205035971223022,
      "grad_norm": 0.31671133637428284,
      "learning_rate": 4.963383838383839e-06,
      "loss": 0.008,
      "step": 1725
    },
    {
      "epoch": 6.294964028776978,
      "grad_norm": 0.3538670539855957,
      "learning_rate": 4.962121212121213e-06,
      "loss": 0.0066,
      "step": 1750
    },
    {
      "epoch": 6.384892086330935,
      "grad_norm": 0.8252100348472595,
      "learning_rate": 4.960858585858586e-06,
      "loss": 0.006,
      "step": 1775
    },
    {
      "epoch": 6.474820143884892,
      "grad_norm": 0.9238548278808594,
      "learning_rate": 4.95959595959596e-06,
      "loss": 0.0074,
      "step": 1800
    },
    {
      "epoch": 6.564748201438849,
      "grad_norm": 1.1760324239730835,
      "learning_rate": 4.958333333333334e-06,
      "loss": 0.0066,
      "step": 1825
    },
    {
      "epoch": 6.654676258992806,
      "grad_norm": 0.3382113575935364,
      "learning_rate": 4.957070707070708e-06,
      "loss": 0.0103,
      "step": 1850
    },
    {
      "epoch": 6.744604316546763,
      "grad_norm": 0.9418781399726868,
      "learning_rate": 4.955808080808081e-06,
      "loss": 0.0092,
      "step": 1875
    },
    {
      "epoch": 6.83453237410072,
      "grad_norm": 0.7677399516105652,
      "learning_rate": 4.954545454545455e-06,
      "loss": 0.009,
      "step": 1900
    },
    {
      "epoch": 6.924460431654676,
      "grad_norm": 0.32002565264701843,
      "learning_rate": 4.953282828282829e-06,
      "loss": 0.0075,
      "step": 1925
    },
    {
      "epoch": 7.014388489208633,
      "grad_norm": 1.0049771070480347,
      "learning_rate": 4.952020202020202e-06,
      "loss": 0.0071,
      "step": 1950
    },
    {
      "epoch": 7.10431654676259,
      "grad_norm": 0.513941764831543,
      "learning_rate": 4.950757575757576e-06,
      "loss": 0.0043,
      "step": 1975
    },
    {
      "epoch": 7.194244604316546,
      "grad_norm": 0.8406050205230713,
      "learning_rate": 4.94949494949495e-06,
      "loss": 0.005,
      "step": 2000
    },
    {
      "epoch": 7.194244604316546,
      "eval_loss": 0.09395472705364227,
      "eval_runtime": 1340.6412,
      "eval_samples_per_second": 1.657,
      "eval_steps_per_second": 0.104,
      "eval_wer": 10.419906687402799,
      "step": 2000
    },
    {
      "epoch": 7.284172661870503,
      "grad_norm": 0.47227388620376587,
      "learning_rate": 4.948232323232323e-06,
      "loss": 0.005,
      "step": 2025
    },
    {
      "epoch": 7.374100719424461,
      "grad_norm": 0.2972259819507599,
      "learning_rate": 4.946969696969697e-06,
      "loss": 0.0047,
      "step": 2050
    },
    {
      "epoch": 7.4640287769784175,
      "grad_norm": 0.580878496170044,
      "learning_rate": 4.945707070707071e-06,
      "loss": 0.0047,
      "step": 2075
    },
    {
      "epoch": 7.553956834532374,
      "grad_norm": 0.0858689397573471,
      "learning_rate": 4.944444444444445e-06,
      "loss": 0.0047,
      "step": 2100
    },
    {
      "epoch": 7.643884892086331,
      "grad_norm": 0.9921578168869019,
      "learning_rate": 4.9431818181818184e-06,
      "loss": 0.0049,
      "step": 2125
    },
    {
      "epoch": 7.733812949640288,
      "grad_norm": 0.3222315311431885,
      "learning_rate": 4.9419191919191924e-06,
      "loss": 0.0039,
      "step": 2150
    },
    {
      "epoch": 7.823741007194244,
      "grad_norm": 0.2401006668806076,
      "learning_rate": 4.940656565656566e-06,
      "loss": 0.0045,
      "step": 2175
    },
    {
      "epoch": 7.913669064748201,
      "grad_norm": 0.26786544919013977,
      "learning_rate": 4.93939393939394e-06,
      "loss": 0.0037,
      "step": 2200
    },
    {
      "epoch": 8.003597122302159,
      "grad_norm": 1.120921015739441,
      "learning_rate": 4.938131313131314e-06,
      "loss": 0.0048,
      "step": 2225
    },
    {
      "epoch": 8.093525179856115,
      "grad_norm": 0.7425853610038757,
      "learning_rate": 4.936868686868687e-06,
      "loss": 0.0036,
      "step": 2250
    },
    {
      "epoch": 8.183453237410072,
      "grad_norm": 0.19618873298168182,
      "learning_rate": 4.935606060606061e-06,
      "loss": 0.0038,
      "step": 2275
    },
    {
      "epoch": 8.273381294964029,
      "grad_norm": 0.41672375798225403,
      "learning_rate": 4.934343434343435e-06,
      "loss": 0.003,
      "step": 2300
    },
    {
      "epoch": 8.363309352517986,
      "grad_norm": 0.3363110423088074,
      "learning_rate": 4.933080808080809e-06,
      "loss": 0.0031,
      "step": 2325
    },
    {
      "epoch": 8.453237410071942,
      "grad_norm": 0.8529962301254272,
      "learning_rate": 4.931818181818182e-06,
      "loss": 0.0034,
      "step": 2350
    },
    {
      "epoch": 8.543165467625899,
      "grad_norm": 0.15698625147342682,
      "learning_rate": 4.930555555555556e-06,
      "loss": 0.0033,
      "step": 2375
    },
    {
      "epoch": 8.633093525179856,
      "grad_norm": 0.19619868695735931,
      "learning_rate": 4.92929292929293e-06,
      "loss": 0.004,
      "step": 2400
    },
    {
      "epoch": 8.723021582733812,
      "grad_norm": 0.2903304994106293,
      "learning_rate": 4.928030303030303e-06,
      "loss": 0.0034,
      "step": 2425
    },
    {
      "epoch": 8.81294964028777,
      "grad_norm": 0.5127314329147339,
      "learning_rate": 4.926767676767677e-06,
      "loss": 0.0035,
      "step": 2450
    },
    {
      "epoch": 8.902877697841726,
      "grad_norm": 1.0652037858963013,
      "learning_rate": 4.925505050505051e-06,
      "loss": 0.0045,
      "step": 2475
    },
    {
      "epoch": 8.992805755395683,
      "grad_norm": 0.9570706486701965,
      "learning_rate": 4.924242424242425e-06,
      "loss": 0.0042,
      "step": 2500
    },
    {
      "epoch": 9.082733812949641,
      "grad_norm": 0.5939081907272339,
      "learning_rate": 4.922979797979798e-06,
      "loss": 0.0032,
      "step": 2525
    },
    {
      "epoch": 9.172661870503598,
      "grad_norm": 0.25739356875419617,
      "learning_rate": 4.921717171717172e-06,
      "loss": 0.0038,
      "step": 2550
    },
    {
      "epoch": 9.262589928057555,
      "grad_norm": 0.17940430343151093,
      "learning_rate": 4.920454545454546e-06,
      "loss": 0.0029,
      "step": 2575
    },
    {
      "epoch": 9.352517985611511,
      "grad_norm": 0.33168259263038635,
      "learning_rate": 4.919191919191919e-06,
      "loss": 0.0028,
      "step": 2600
    },
    {
      "epoch": 9.442446043165468,
      "grad_norm": 0.20831653475761414,
      "learning_rate": 4.917929292929293e-06,
      "loss": 0.002,
      "step": 2625
    },
    {
      "epoch": 9.532374100719425,
      "grad_norm": 0.19978338479995728,
      "learning_rate": 4.9166666666666665e-06,
      "loss": 0.0025,
      "step": 2650
    },
    {
      "epoch": 9.622302158273381,
      "grad_norm": 0.23154591023921967,
      "learning_rate": 4.915404040404041e-06,
      "loss": 0.0033,
      "step": 2675
    },
    {
      "epoch": 9.712230215827338,
      "grad_norm": 0.7622235417366028,
      "learning_rate": 4.9141414141414145e-06,
      "loss": 0.0039,
      "step": 2700
    },
    {
      "epoch": 9.802158273381295,
      "grad_norm": 0.23092857003211975,
      "learning_rate": 4.9128787878787885e-06,
      "loss": 0.0044,
      "step": 2725
    },
    {
      "epoch": 9.892086330935252,
      "grad_norm": 0.5034282207489014,
      "learning_rate": 4.9116161616161625e-06,
      "loss": 0.0035,
      "step": 2750
    },
    {
      "epoch": 9.982014388489208,
      "grad_norm": 0.2582780122756958,
      "learning_rate": 4.910353535353536e-06,
      "loss": 0.0033,
      "step": 2775
    },
    {
      "epoch": 10.071942446043165,
      "grad_norm": 0.4610576033592224,
      "learning_rate": 4.90909090909091e-06,
      "loss": 0.0037,
      "step": 2800
    },
    {
      "epoch": 10.161870503597122,
      "grad_norm": 0.217066690325737,
      "learning_rate": 4.907828282828283e-06,
      "loss": 0.0028,
      "step": 2825
    },
    {
      "epoch": 10.251798561151078,
      "grad_norm": 0.05713683366775513,
      "learning_rate": 4.906565656565658e-06,
      "loss": 0.003,
      "step": 2850
    },
    {
      "epoch": 10.341726618705035,
      "grad_norm": 0.5356289148330688,
      "learning_rate": 4.905303030303031e-06,
      "loss": 0.0018,
      "step": 2875
    },
    {
      "epoch": 10.431654676258994,
      "grad_norm": 0.37969082593917847,
      "learning_rate": 4.904040404040405e-06,
      "loss": 0.0022,
      "step": 2900
    },
    {
      "epoch": 10.52158273381295,
      "grad_norm": 1.078008770942688,
      "learning_rate": 4.902777777777778e-06,
      "loss": 0.0032,
      "step": 2925
    },
    {
      "epoch": 10.611510791366907,
      "grad_norm": 0.26670244336128235,
      "learning_rate": 4.901515151515152e-06,
      "loss": 0.0027,
      "step": 2950
    },
    {
      "epoch": 10.701438848920864,
      "grad_norm": 0.673686683177948,
      "learning_rate": 4.900252525252526e-06,
      "loss": 0.0029,
      "step": 2975
    },
    {
      "epoch": 10.79136690647482,
      "grad_norm": 0.37779000401496887,
      "learning_rate": 4.898989898989899e-06,
      "loss": 0.0022,
      "step": 3000
    },
    {
      "epoch": 10.79136690647482,
      "eval_loss": 0.10011211037635803,
      "eval_runtime": 1344.035,
      "eval_samples_per_second": 1.653,
      "eval_steps_per_second": 0.103,
      "eval_wer": 9.049840776123824,
      "step": 3000
    },
    {
      "epoch": 10.881294964028777,
      "grad_norm": 0.09616148471832275,
      "learning_rate": 4.897727272727273e-06,
      "loss": 0.0041,
      "step": 3025
    },
    {
      "epoch": 10.971223021582734,
      "grad_norm": 0.8408087491989136,
      "learning_rate": 4.896464646464647e-06,
      "loss": 0.0046,
      "step": 3050
    },
    {
      "epoch": 11.06115107913669,
      "grad_norm": 0.1868293583393097,
      "learning_rate": 4.895202020202021e-06,
      "loss": 0.0027,
      "step": 3075
    },
    {
      "epoch": 11.151079136690647,
      "grad_norm": 0.19219942390918732,
      "learning_rate": 4.893939393939394e-06,
      "loss": 0.0024,
      "step": 3100
    },
    {
      "epoch": 11.241007194244604,
      "grad_norm": 3.7455391883850098,
      "learning_rate": 4.892676767676768e-06,
      "loss": 0.0027,
      "step": 3125
    },
    {
      "epoch": 11.33093525179856,
      "grad_norm": 0.2693164348602295,
      "learning_rate": 4.891414141414142e-06,
      "loss": 0.002,
      "step": 3150
    },
    {
      "epoch": 11.420863309352518,
      "grad_norm": 0.8100782632827759,
      "learning_rate": 4.890151515151515e-06,
      "loss": 0.0033,
      "step": 3175
    },
    {
      "epoch": 11.510791366906474,
      "grad_norm": 0.30300647020339966,
      "learning_rate": 4.888888888888889e-06,
      "loss": 0.0025,
      "step": 3200
    },
    {
      "epoch": 11.600719424460431,
      "grad_norm": 0.49988773465156555,
      "learning_rate": 4.887626262626263e-06,
      "loss": 0.002,
      "step": 3225
    },
    {
      "epoch": 11.690647482014388,
      "grad_norm": 0.2162599414587021,
      "learning_rate": 4.8863636363636365e-06,
      "loss": 0.0024,
      "step": 3250
    },
    {
      "epoch": 11.780575539568346,
      "grad_norm": 2.3612468242645264,
      "learning_rate": 4.8851010101010105e-06,
      "loss": 0.0045,
      "step": 3275
    },
    {
      "epoch": 11.870503597122303,
      "grad_norm": 0.4287119209766388,
      "learning_rate": 4.883838383838384e-06,
      "loss": 0.0051,
      "step": 3300
    },
    {
      "epoch": 11.96043165467626,
      "grad_norm": 0.46471118927001953,
      "learning_rate": 4.8825757575757585e-06,
      "loss": 0.0036,
      "step": 3325
    },
    {
      "epoch": 12.050359712230216,
      "grad_norm": 0.4310344159603119,
      "learning_rate": 4.881313131313132e-06,
      "loss": 0.0031,
      "step": 3350
    },
    {
      "epoch": 12.140287769784173,
      "grad_norm": 0.8054510951042175,
      "learning_rate": 4.880050505050506e-06,
      "loss": 0.0036,
      "step": 3375
    },
    {
      "epoch": 12.23021582733813,
      "grad_norm": 0.5783084630966187,
      "learning_rate": 4.878787878787879e-06,
      "loss": 0.0023,
      "step": 3400
    },
    {
      "epoch": 12.320143884892087,
      "grad_norm": 0.1537202149629593,
      "learning_rate": 4.877525252525253e-06,
      "loss": 0.0031,
      "step": 3425
    },
    {
      "epoch": 12.410071942446043,
      "grad_norm": 0.25773826241493225,
      "learning_rate": 4.876262626262627e-06,
      "loss": 0.0029,
      "step": 3450
    },
    {
      "epoch": 12.5,
      "grad_norm": 1.0221893787384033,
      "learning_rate": 4.875e-06,
      "loss": 0.003,
      "step": 3475
    },
    {
      "epoch": 12.589928057553957,
      "grad_norm": 0.2363336831331253,
      "learning_rate": 4.873737373737374e-06,
      "loss": 0.0036,
      "step": 3500
    },
    {
      "epoch": 12.679856115107913,
      "grad_norm": 0.9339852333068848,
      "learning_rate": 4.872474747474748e-06,
      "loss": 0.004,
      "step": 3525
    },
    {
      "epoch": 12.76978417266187,
      "grad_norm": 0.6633305549621582,
      "learning_rate": 4.871212121212122e-06,
      "loss": 0.0032,
      "step": 3550
    },
    {
      "epoch": 12.859712230215827,
      "grad_norm": 0.7261077761650085,
      "learning_rate": 4.869949494949495e-06,
      "loss": 0.0028,
      "step": 3575
    },
    {
      "epoch": 12.949640287769784,
      "grad_norm": 0.6666585803031921,
      "learning_rate": 4.868686868686869e-06,
      "loss": 0.0031,
      "step": 3600
    },
    {
      "epoch": 13.03956834532374,
      "grad_norm": 0.42198774218559265,
      "learning_rate": 4.867424242424243e-06,
      "loss": 0.0023,
      "step": 3625
    },
    {
      "epoch": 13.129496402877697,
      "grad_norm": 0.1100483238697052,
      "learning_rate": 4.866161616161616e-06,
      "loss": 0.002,
      "step": 3650
    },
    {
      "epoch": 13.219424460431656,
      "grad_norm": 0.5182665586471558,
      "learning_rate": 4.86489898989899e-06,
      "loss": 0.003,
      "step": 3675
    },
    {
      "epoch": 13.309352517985612,
      "grad_norm": 0.10821045190095901,
      "learning_rate": 4.863636363636364e-06,
      "loss": 0.0024,
      "step": 3700
    },
    {
      "epoch": 13.399280575539569,
      "grad_norm": 0.302943617105484,
      "learning_rate": 4.862373737373738e-06,
      "loss": 0.0022,
      "step": 3725
    },
    {
      "epoch": 13.489208633093526,
      "grad_norm": 0.34953269362449646,
      "learning_rate": 4.861111111111111e-06,
      "loss": 0.0024,
      "step": 3750
    },
    {
      "epoch": 13.579136690647482,
      "grad_norm": 0.3864242732524872,
      "learning_rate": 4.859848484848485e-06,
      "loss": 0.0025,
      "step": 3775
    },
    {
      "epoch": 13.66906474820144,
      "grad_norm": 0.23528048396110535,
      "learning_rate": 4.858585858585859e-06,
      "loss": 0.0028,
      "step": 3800
    },
    {
      "epoch": 13.758992805755396,
      "grad_norm": 0.31728431582450867,
      "learning_rate": 4.8573232323232325e-06,
      "loss": 0.0041,
      "step": 3825
    },
    {
      "epoch": 13.848920863309353,
      "grad_norm": 0.5803298950195312,
      "learning_rate": 4.8560606060606065e-06,
      "loss": 0.0028,
      "step": 3850
    },
    {
      "epoch": 13.93884892086331,
      "grad_norm": 0.30145183205604553,
      "learning_rate": 4.85479797979798e-06,
      "loss": 0.0022,
      "step": 3875
    },
    {
      "epoch": 14.028776978417266,
      "grad_norm": 0.43851757049560547,
      "learning_rate": 4.8535353535353545e-06,
      "loss": 0.0024,
      "step": 3900
    },
    {
      "epoch": 14.118705035971223,
      "grad_norm": 0.7910506725311279,
      "learning_rate": 4.852272727272728e-06,
      "loss": 0.0033,
      "step": 3925
    },
    {
      "epoch": 14.20863309352518,
      "grad_norm": 0.3168434500694275,
      "learning_rate": 4.851010101010102e-06,
      "loss": 0.0028,
      "step": 3950
    },
    {
      "epoch": 14.298561151079136,
      "grad_norm": 0.7242361307144165,
      "learning_rate": 4.849747474747475e-06,
      "loss": 0.0031,
      "step": 3975
    },
    {
      "epoch": 14.388489208633093,
      "grad_norm": 0.7368125319480896,
      "learning_rate": 4.848484848484849e-06,
      "loss": 0.0027,
      "step": 4000
    },
    {
      "epoch": 14.388489208633093,
      "eval_loss": 0.09274967014789581,
      "eval_runtime": 1343.7242,
      "eval_samples_per_second": 1.654,
      "eval_steps_per_second": 0.103,
      "eval_wer": 9.375694290157742,
      "step": 4000
    },
    {
      "epoch": 14.47841726618705,
      "grad_norm": 0.420599102973938,
      "learning_rate": 4.847222222222223e-06,
      "loss": 0.0028,
      "step": 4025
    },
    {
      "epoch": 14.568345323741006,
      "grad_norm": 0.3025602698326111,
      "learning_rate": 4.845959595959596e-06,
      "loss": 0.0028,
      "step": 4050
    },
    {
      "epoch": 14.658273381294965,
      "grad_norm": 0.7078948020935059,
      "learning_rate": 4.84469696969697e-06,
      "loss": 0.003,
      "step": 4075
    },
    {
      "epoch": 14.748201438848922,
      "grad_norm": 0.5534040331840515,
      "learning_rate": 4.843434343434344e-06,
      "loss": 0.0031,
      "step": 4100
    },
    {
      "epoch": 14.838129496402878,
      "grad_norm": 0.28715190291404724,
      "learning_rate": 4.842171717171718e-06,
      "loss": 0.0028,
      "step": 4125
    },
    {
      "epoch": 14.928057553956835,
      "grad_norm": 0.5861944556236267,
      "learning_rate": 4.840909090909091e-06,
      "loss": 0.0028,
      "step": 4150
    },
    {
      "epoch": 15.017985611510792,
      "grad_norm": 0.102662093937397,
      "learning_rate": 4.839646464646465e-06,
      "loss": 0.0057,
      "step": 4175
    },
    {
      "epoch": 15.107913669064748,
      "grad_norm": 0.15230265259742737,
      "learning_rate": 4.838383838383839e-06,
      "loss": 0.0023,
      "step": 4200
    },
    {
      "epoch": 15.197841726618705,
      "grad_norm": 0.12530238926410675,
      "learning_rate": 4.837121212121212e-06,
      "loss": 0.0017,
      "step": 4225
    },
    {
      "epoch": 15.287769784172662,
      "grad_norm": 0.09885858744382858,
      "learning_rate": 4.835858585858586e-06,
      "loss": 0.0022,
      "step": 4250
    },
    {
      "epoch": 15.377697841726619,
      "grad_norm": 0.1105910986661911,
      "learning_rate": 4.83459595959596e-06,
      "loss": 0.0026,
      "step": 4275
    },
    {
      "epoch": 15.467625899280575,
      "grad_norm": 0.3952260911464691,
      "learning_rate": 4.833333333333333e-06,
      "loss": 0.0021,
      "step": 4300
    },
    {
      "epoch": 15.557553956834532,
      "grad_norm": 0.6049605011940002,
      "learning_rate": 4.832070707070707e-06,
      "loss": 0.0021,
      "step": 4325
    },
    {
      "epoch": 15.647482014388489,
      "grad_norm": 0.7125779986381531,
      "learning_rate": 4.830808080808081e-06,
      "loss": 0.0015,
      "step": 4350
    },
    {
      "epoch": 15.737410071942445,
      "grad_norm": 0.16274645924568176,
      "learning_rate": 4.829545454545455e-06,
      "loss": 0.0019,
      "step": 4375
    },
    {
      "epoch": 15.827338129496402,
      "grad_norm": 0.6492106318473816,
      "learning_rate": 4.8282828282828285e-06,
      "loss": 0.0019,
      "step": 4400
    },
    {
      "epoch": 15.917266187050359,
      "grad_norm": 0.9411545991897583,
      "learning_rate": 4.8270202020202025e-06,
      "loss": 0.003,
      "step": 4425
    },
    {
      "epoch": 16.007194244604317,
      "grad_norm": 0.03323192521929741,
      "learning_rate": 4.8257575757575765e-06,
      "loss": 0.0018,
      "step": 4450
    },
    {
      "epoch": 16.097122302158272,
      "grad_norm": 0.1154596135020256,
      "learning_rate": 4.82449494949495e-06,
      "loss": 0.0015,
      "step": 4475
    },
    {
      "epoch": 16.18705035971223,
      "grad_norm": 0.41669028997421265,
      "learning_rate": 4.823232323232324e-06,
      "loss": 0.0016,
      "step": 4500
    },
    {
      "epoch": 16.276978417266186,
      "grad_norm": 0.25636962056159973,
      "learning_rate": 4.821969696969697e-06,
      "loss": 0.0014,
      "step": 4525
    },
    {
      "epoch": 16.366906474820144,
      "grad_norm": 3.250777244567871,
      "learning_rate": 4.820707070707072e-06,
      "loss": 0.0027,
      "step": 4550
    },
    {
      "epoch": 16.4568345323741,
      "grad_norm": 1.1029988527297974,
      "learning_rate": 4.819444444444445e-06,
      "loss": 0.0028,
      "step": 4575
    },
    {
      "epoch": 16.546762589928058,
      "grad_norm": 0.3530588150024414,
      "learning_rate": 4.818181818181819e-06,
      "loss": 0.0015,
      "step": 4600
    },
    {
      "epoch": 16.636690647482013,
      "grad_norm": 0.0861181914806366,
      "learning_rate": 4.816919191919192e-06,
      "loss": 0.0023,
      "step": 4625
    },
    {
      "epoch": 16.72661870503597,
      "grad_norm": 0.44006574153900146,
      "learning_rate": 4.815656565656566e-06,
      "loss": 0.0021,
      "step": 4650
    },
    {
      "epoch": 16.81654676258993,
      "grad_norm": 0.9688239097595215,
      "learning_rate": 4.81439393939394e-06,
      "loss": 0.0014,
      "step": 4675
    },
    {
      "epoch": 16.906474820143885,
      "grad_norm": 0.848913311958313,
      "learning_rate": 4.813131313131313e-06,
      "loss": 0.0021,
      "step": 4700
    },
    {
      "epoch": 16.996402877697843,
      "grad_norm": 0.14554986357688904,
      "learning_rate": 4.811868686868687e-06,
      "loss": 0.0013,
      "step": 4725
    },
    {
      "epoch": 17.086330935251798,
      "grad_norm": 0.31808871030807495,
      "learning_rate": 4.810606060606061e-06,
      "loss": 0.0019,
      "step": 4750
    },
    {
      "epoch": 17.176258992805757,
      "grad_norm": 0.2081349641084671,
      "learning_rate": 4.809343434343435e-06,
      "loss": 0.0018,
      "step": 4775
    },
    {
      "epoch": 17.26618705035971,
      "grad_norm": 0.0817071720957756,
      "learning_rate": 4.808080808080808e-06,
      "loss": 0.0011,
      "step": 4800
    },
    {
      "epoch": 17.35611510791367,
      "grad_norm": 0.148326575756073,
      "learning_rate": 4.806818181818182e-06,
      "loss": 0.0011,
      "step": 4825
    },
    {
      "epoch": 17.446043165467625,
      "grad_norm": 1.1114903688430786,
      "learning_rate": 4.805555555555556e-06,
      "loss": 0.0012,
      "step": 4850
    },
    {
      "epoch": 17.535971223021583,
      "grad_norm": 0.5132379531860352,
      "learning_rate": 4.804292929292929e-06,
      "loss": 0.0015,
      "step": 4875
    },
    {
      "epoch": 17.62589928057554,
      "grad_norm": 0.5439797043800354,
      "learning_rate": 4.803030303030303e-06,
      "loss": 0.0019,
      "step": 4900
    },
    {
      "epoch": 17.715827338129497,
      "grad_norm": 0.4897061586380005,
      "learning_rate": 4.801767676767677e-06,
      "loss": 0.0022,
      "step": 4925
    },
    {
      "epoch": 17.805755395683452,
      "grad_norm": 0.13605351746082306,
      "learning_rate": 4.800505050505051e-06,
      "loss": 0.0017,
      "step": 4950
    },
    {
      "epoch": 17.89568345323741,
      "grad_norm": 0.6285837888717651,
      "learning_rate": 4.7992424242424245e-06,
      "loss": 0.0014,
      "step": 4975
    },
    {
      "epoch": 17.985611510791365,
      "grad_norm": 0.04884183779358864,
      "learning_rate": 4.7979797979797985e-06,
      "loss": 0.0011,
      "step": 5000
    },
    {
      "epoch": 17.985611510791365,
      "eval_loss": 0.09266538918018341,
      "eval_runtime": 1344.6458,
      "eval_samples_per_second": 1.652,
      "eval_steps_per_second": 0.103,
      "eval_wer": 8.835073687328741,
      "step": 5000
    },
    {
      "epoch": 18.075539568345324,
      "grad_norm": 0.036710768938064575,
      "learning_rate": 4.7967171717171725e-06,
      "loss": 0.0024,
      "step": 5025
    },
    {
      "epoch": 18.165467625899282,
      "grad_norm": 0.41920551657676697,
      "learning_rate": 4.795454545454546e-06,
      "loss": 0.0011,
      "step": 5050
    },
    {
      "epoch": 18.255395683453237,
      "grad_norm": 0.2354598492383957,
      "learning_rate": 4.79419191919192e-06,
      "loss": 0.0018,
      "step": 5075
    },
    {
      "epoch": 18.345323741007196,
      "grad_norm": 0.4095918536186218,
      "learning_rate": 4.792929292929293e-06,
      "loss": 0.0015,
      "step": 5100
    },
    {
      "epoch": 18.43525179856115,
      "grad_norm": 0.03964778780937195,
      "learning_rate": 4.791666666666668e-06,
      "loss": 0.0019,
      "step": 5125
    },
    {
      "epoch": 18.52517985611511,
      "grad_norm": 0.9322590827941895,
      "learning_rate": 4.790404040404041e-06,
      "loss": 0.0014,
      "step": 5150
    },
    {
      "epoch": 18.615107913669064,
      "grad_norm": 0.11062884330749512,
      "learning_rate": 4.789141414141415e-06,
      "loss": 0.0015,
      "step": 5175
    },
    {
      "epoch": 18.705035971223023,
      "grad_norm": 0.4186955690383911,
      "learning_rate": 4.787878787878788e-06,
      "loss": 0.0013,
      "step": 5200
    },
    {
      "epoch": 18.794964028776977,
      "grad_norm": 0.40554943680763245,
      "learning_rate": 4.786616161616162e-06,
      "loss": 0.0017,
      "step": 5225
    },
    {
      "epoch": 18.884892086330936,
      "grad_norm": 0.4156556725502014,
      "learning_rate": 4.785353535353536e-06,
      "loss": 0.0016,
      "step": 5250
    },
    {
      "epoch": 18.97482014388489,
      "grad_norm": 0.8705348968505859,
      "learning_rate": 4.784090909090909e-06,
      "loss": 0.003,
      "step": 5275
    },
    {
      "epoch": 19.06474820143885,
      "grad_norm": 0.47541674971580505,
      "learning_rate": 4.782828282828283e-06,
      "loss": 0.0026,
      "step": 5300
    },
    {
      "epoch": 19.154676258992804,
      "grad_norm": 0.3221082389354706,
      "learning_rate": 4.781565656565657e-06,
      "loss": 0.0014,
      "step": 5325
    },
    {
      "epoch": 19.244604316546763,
      "grad_norm": 0.26767319440841675,
      "learning_rate": 4.78030303030303e-06,
      "loss": 0.0015,
      "step": 5350
    },
    {
      "epoch": 19.334532374100718,
      "grad_norm": 0.41984379291534424,
      "learning_rate": 4.779040404040404e-06,
      "loss": 0.0026,
      "step": 5375
    },
    {
      "epoch": 19.424460431654676,
      "grad_norm": 0.6067033410072327,
      "learning_rate": 4.777777777777778e-06,
      "loss": 0.0031,
      "step": 5400
    },
    {
      "epoch": 19.514388489208635,
      "grad_norm": 0.23113247752189636,
      "learning_rate": 4.776515151515152e-06,
      "loss": 0.0027,
      "step": 5425
    },
    {
      "epoch": 19.60431654676259,
      "grad_norm": 0.7052062153816223,
      "learning_rate": 4.775252525252525e-06,
      "loss": 0.0038,
      "step": 5450
    },
    {
      "epoch": 19.694244604316548,
      "grad_norm": 1.4232673645019531,
      "learning_rate": 4.773989898989899e-06,
      "loss": 0.0024,
      "step": 5475
    },
    {
      "epoch": 19.784172661870503,
      "grad_norm": 0.12078073620796204,
      "learning_rate": 4.772727272727273e-06,
      "loss": 0.0014,
      "step": 5500
    },
    {
      "epoch": 19.87410071942446,
      "grad_norm": 1.296155333518982,
      "learning_rate": 4.7714646464646465e-06,
      "loss": 0.0028,
      "step": 5525
    },
    {
      "epoch": 19.964028776978417,
      "grad_norm": 0.4774380922317505,
      "learning_rate": 4.7702020202020205e-06,
      "loss": 0.0039,
      "step": 5550
    },
    {
      "epoch": 20.053956834532375,
      "grad_norm": 0.7243533134460449,
      "learning_rate": 4.768939393939394e-06,
      "loss": 0.0038,
      "step": 5575
    },
    {
      "epoch": 20.14388489208633,
      "grad_norm": 0.03761635348200798,
      "learning_rate": 4.7676767676767685e-06,
      "loss": 0.0028,
      "step": 5600
    },
    {
      "epoch": 20.23381294964029,
      "grad_norm": 0.3167934715747833,
      "learning_rate": 4.766414141414142e-06,
      "loss": 0.0023,
      "step": 5625
    },
    {
      "epoch": 20.323741007194243,
      "grad_norm": 0.08072912693023682,
      "learning_rate": 4.765151515151516e-06,
      "loss": 0.0021,
      "step": 5650
    },
    {
      "epoch": 20.413669064748202,
      "grad_norm": 0.0809144377708435,
      "learning_rate": 4.763888888888889e-06,
      "loss": 0.0033,
      "step": 5675
    },
    {
      "epoch": 20.503597122302157,
      "grad_norm": 0.021725259721279144,
      "learning_rate": 4.762626262626263e-06,
      "loss": 0.0022,
      "step": 5700
    },
    {
      "epoch": 20.593525179856115,
      "grad_norm": 0.79271399974823,
      "learning_rate": 4.761363636363637e-06,
      "loss": 0.0015,
      "step": 5725
    },
    {
      "epoch": 20.68345323741007,
      "grad_norm": 0.10382846742868423,
      "learning_rate": 4.76010101010101e-06,
      "loss": 0.0019,
      "step": 5750
    },
    {
      "epoch": 20.77338129496403,
      "grad_norm": 0.03259812295436859,
      "learning_rate": 4.758838383838385e-06,
      "loss": 0.002,
      "step": 5775
    },
    {
      "epoch": 20.863309352517987,
      "grad_norm": 0.6223962306976318,
      "learning_rate": 4.757575757575758e-06,
      "loss": 0.0036,
      "step": 5800
    },
    {
      "epoch": 20.953237410071942,
      "grad_norm": 1.0351557731628418,
      "learning_rate": 4.756313131313132e-06,
      "loss": 0.0022,
      "step": 5825
    },
    {
      "epoch": 21.0431654676259,
      "grad_norm": 0.8662335276603699,
      "learning_rate": 4.755050505050505e-06,
      "loss": 0.0028,
      "step": 5850
    },
    {
      "epoch": 21.133093525179856,
      "grad_norm": 0.13104894757270813,
      "learning_rate": 4.753787878787879e-06,
      "loss": 0.0028,
      "step": 5875
    },
    {
      "epoch": 21.223021582733814,
      "grad_norm": 0.8010006546974182,
      "learning_rate": 4.752525252525253e-06,
      "loss": 0.0021,
      "step": 5900
    },
    {
      "epoch": 21.31294964028777,
      "grad_norm": 0.7761834263801575,
      "learning_rate": 4.751262626262626e-06,
      "loss": 0.0035,
      "step": 5925
    },
    {
      "epoch": 21.402877697841728,
      "grad_norm": 0.05642890930175781,
      "learning_rate": 4.75e-06,
      "loss": 0.0015,
      "step": 5950
    },
    {
      "epoch": 21.492805755395683,
      "grad_norm": 0.2215975672006607,
      "learning_rate": 4.748737373737374e-06,
      "loss": 0.0011,
      "step": 5975
    },
    {
      "epoch": 21.58273381294964,
      "grad_norm": 0.5649552345275879,
      "learning_rate": 4.747474747474748e-06,
      "loss": 0.0017,
      "step": 6000
    },
    {
      "epoch": 21.58273381294964,
      "eval_loss": 0.08750007301568985,
      "eval_runtime": 1349.1716,
      "eval_samples_per_second": 1.647,
      "eval_steps_per_second": 0.103,
      "eval_wer": 7.657557579797082,
      "step": 6000
    },
    {
      "epoch": 21.672661870503596,
      "grad_norm": 0.3567905128002167,
      "learning_rate": 4.746212121212121e-06,
      "loss": 0.0023,
      "step": 6025
    },
    {
      "epoch": 21.762589928057555,
      "grad_norm": 0.7165196537971497,
      "learning_rate": 4.744949494949495e-06,
      "loss": 0.0019,
      "step": 6050
    },
    {
      "epoch": 21.85251798561151,
      "grad_norm": 0.9009844660758972,
      "learning_rate": 4.743686868686869e-06,
      "loss": 0.0022,
      "step": 6075
    },
    {
      "epoch": 21.942446043165468,
      "grad_norm": 0.7037338614463806,
      "learning_rate": 4.7424242424242426e-06,
      "loss": 0.0026,
      "step": 6100
    },
    {
      "epoch": 22.032374100719423,
      "grad_norm": 0.2905846834182739,
      "learning_rate": 4.7411616161616166e-06,
      "loss": 0.002,
      "step": 6125
    },
    {
      "epoch": 22.12230215827338,
      "grad_norm": 0.7335506677627563,
      "learning_rate": 4.7398989898989905e-06,
      "loss": 0.0019,
      "step": 6150
    },
    {
      "epoch": 22.21223021582734,
      "grad_norm": 0.3520030677318573,
      "learning_rate": 4.7386363636363645e-06,
      "loss": 0.0016,
      "step": 6175
    },
    {
      "epoch": 22.302158273381295,
      "grad_norm": 0.3580196797847748,
      "learning_rate": 4.737373737373738e-06,
      "loss": 0.0014,
      "step": 6200
    },
    {
      "epoch": 22.392086330935253,
      "grad_norm": 0.19062575697898865,
      "learning_rate": 4.736111111111112e-06,
      "loss": 0.002,
      "step": 6225
    },
    {
      "epoch": 22.48201438848921,
      "grad_norm": 0.6567767858505249,
      "learning_rate": 4.734848484848486e-06,
      "loss": 0.0021,
      "step": 6250
    },
    {
      "epoch": 22.571942446043167,
      "grad_norm": 0.24819691479206085,
      "learning_rate": 4.733585858585859e-06,
      "loss": 0.0019,
      "step": 6275
    },
    {
      "epoch": 22.66187050359712,
      "grad_norm": 0.47786185145378113,
      "learning_rate": 4.732323232323233e-06,
      "loss": 0.0014,
      "step": 6300
    },
    {
      "epoch": 22.75179856115108,
      "grad_norm": 0.05066821351647377,
      "learning_rate": 4.731060606060606e-06,
      "loss": 0.0018,
      "step": 6325
    },
    {
      "epoch": 22.841726618705035,
      "grad_norm": 0.33751770853996277,
      "learning_rate": 4.72979797979798e-06,
      "loss": 0.0028,
      "step": 6350
    },
    {
      "epoch": 22.931654676258994,
      "grad_norm": 0.03158155083656311,
      "learning_rate": 4.728535353535354e-06,
      "loss": 0.0013,
      "step": 6375
    },
    {
      "epoch": 23.02158273381295,
      "grad_norm": 0.05814801901578903,
      "learning_rate": 4.727272727272728e-06,
      "loss": 0.0021,
      "step": 6400
    },
    {
      "epoch": 23.111510791366907,
      "grad_norm": 0.031183883547782898,
      "learning_rate": 4.726010101010101e-06,
      "loss": 0.0011,
      "step": 6425
    },
    {
      "epoch": 23.201438848920862,
      "grad_norm": 0.539813756942749,
      "learning_rate": 4.724747474747475e-06,
      "loss": 0.0009,
      "step": 6450
    },
    {
      "epoch": 23.29136690647482,
      "grad_norm": 0.14558178186416626,
      "learning_rate": 4.723484848484849e-06,
      "loss": 0.0018,
      "step": 6475
    },
    {
      "epoch": 23.381294964028775,
      "grad_norm": 0.10804769396781921,
      "learning_rate": 4.722222222222222e-06,
      "loss": 0.0013,
      "step": 6500
    },
    {
      "epoch": 23.471223021582734,
      "grad_norm": 0.3211396038532257,
      "learning_rate": 4.720959595959596e-06,
      "loss": 0.0015,
      "step": 6525
    },
    {
      "epoch": 23.56115107913669,
      "grad_norm": 0.16721013188362122,
      "learning_rate": 4.71969696969697e-06,
      "loss": 0.0027,
      "step": 6550
    },
    {
      "epoch": 23.651079136690647,
      "grad_norm": 0.3473891019821167,
      "learning_rate": 4.7184343434343434e-06,
      "loss": 0.0014,
      "step": 6575
    },
    {
      "epoch": 23.741007194244606,
      "grad_norm": 0.04464249685406685,
      "learning_rate": 4.717171717171717e-06,
      "loss": 0.0013,
      "step": 6600
    },
    {
      "epoch": 23.83093525179856,
      "grad_norm": 0.21577273309230804,
      "learning_rate": 4.715909090909091e-06,
      "loss": 0.0025,
      "step": 6625
    },
    {
      "epoch": 23.92086330935252,
      "grad_norm": 1.0553650856018066,
      "learning_rate": 4.714646464646465e-06,
      "loss": 0.0012,
      "step": 6650
    },
    {
      "epoch": 24.010791366906474,
      "grad_norm": 0.015737203881144524,
      "learning_rate": 4.7133838383838386e-06,
      "loss": 0.0018,
      "step": 6675
    },
    {
      "epoch": 24.100719424460433,
      "grad_norm": 0.08808793127536774,
      "learning_rate": 4.7121212121212126e-06,
      "loss": 0.0008,
      "step": 6700
    },
    {
      "epoch": 24.190647482014388,
      "grad_norm": 0.01893734373152256,
      "learning_rate": 4.7108585858585866e-06,
      "loss": 0.0008,
      "step": 6725
    },
    {
      "epoch": 24.280575539568346,
      "grad_norm": 0.032726775854825974,
      "learning_rate": 4.70959595959596e-06,
      "loss": 0.0011,
      "step": 6750
    },
    {
      "epoch": 24.3705035971223,
      "grad_norm": 1.2210007905960083,
      "learning_rate": 4.708333333333334e-06,
      "loss": 0.0014,
      "step": 6775
    },
    {
      "epoch": 24.46043165467626,
      "grad_norm": 0.21317902207374573,
      "learning_rate": 4.707070707070707e-06,
      "loss": 0.0008,
      "step": 6800
    },
    {
      "epoch": 24.550359712230215,
      "grad_norm": 0.02254541404545307,
      "learning_rate": 4.705808080808082e-06,
      "loss": 0.0008,
      "step": 6825
    },
    {
      "epoch": 24.640287769784173,
      "grad_norm": 0.19283901154994965,
      "learning_rate": 4.704545454545455e-06,
      "loss": 0.0006,
      "step": 6850
    },
    {
      "epoch": 24.730215827338128,
      "grad_norm": 0.1615646928548813,
      "learning_rate": 4.703282828282829e-06,
      "loss": 0.0011,
      "step": 6875
    },
    {
      "epoch": 24.820143884892087,
      "grad_norm": 0.04525255784392357,
      "learning_rate": 4.702020202020202e-06,
      "loss": 0.0006,
      "step": 6900
    },
    {
      "epoch": 24.91007194244604,
      "grad_norm": 0.17892493307590485,
      "learning_rate": 4.700757575757576e-06,
      "loss": 0.0011,
      "step": 6925
    },
    {
      "epoch": 25.0,
      "grad_norm": 1.5881894826889038,
      "learning_rate": 4.69949494949495e-06,
      "loss": 0.0009,
      "step": 6950
    },
    {
      "epoch": 25.08992805755396,
      "grad_norm": 0.028072576969861984,
      "learning_rate": 4.698232323232323e-06,
      "loss": 0.001,
      "step": 6975
    },
    {
      "epoch": 25.179856115107913,
      "grad_norm": 0.034753262996673584,
      "learning_rate": 4.696969696969698e-06,
      "loss": 0.001,
      "step": 7000
    },
    {
      "epoch": 25.179856115107913,
      "eval_loss": 0.08996064960956573,
      "eval_runtime": 1372.6865,
      "eval_samples_per_second": 1.619,
      "eval_steps_per_second": 0.101,
      "eval_wer": 6.591127897504258,
      "step": 7000
    },
    {
      "epoch": 25.269784172661872,
      "grad_norm": 0.047846052795648575,
      "learning_rate": 4.695707070707071e-06,
      "loss": 0.0017,
      "step": 7025
    },
    {
      "epoch": 25.359712230215827,
      "grad_norm": 0.08721514046192169,
      "learning_rate": 4.694444444444445e-06,
      "loss": 0.0012,
      "step": 7050
    },
    {
      "epoch": 25.449640287769785,
      "grad_norm": 0.488505095243454,
      "learning_rate": 4.693181818181818e-06,
      "loss": 0.001,
      "step": 7075
    },
    {
      "epoch": 25.53956834532374,
      "grad_norm": 0.3541705012321472,
      "learning_rate": 4.691919191919192e-06,
      "loss": 0.0009,
      "step": 7100
    },
    {
      "epoch": 25.6294964028777,
      "grad_norm": 1.2867228984832764,
      "learning_rate": 4.690656565656566e-06,
      "loss": 0.0009,
      "step": 7125
    },
    {
      "epoch": 25.719424460431654,
      "grad_norm": 0.06602492183446884,
      "learning_rate": 4.6893939393939394e-06,
      "loss": 0.001,
      "step": 7150
    },
    {
      "epoch": 25.809352517985612,
      "grad_norm": 0.03555336222052574,
      "learning_rate": 4.6881313131313134e-06,
      "loss": 0.0016,
      "step": 7175
    },
    {
      "epoch": 25.899280575539567,
      "grad_norm": 0.1011524349451065,
      "learning_rate": 4.6868686868686874e-06,
      "loss": 0.0028,
      "step": 7200
    },
    {
      "epoch": 25.989208633093526,
      "grad_norm": 0.14894358813762665,
      "learning_rate": 4.6856060606060614e-06,
      "loss": 0.0026,
      "step": 7225
    },
    {
      "epoch": 26.07913669064748,
      "grad_norm": 0.944786787033081,
      "learning_rate": 4.684343434343435e-06,
      "loss": 0.0014,
      "step": 7250
    },
    {
      "epoch": 26.16906474820144,
      "grad_norm": 0.4678920805454254,
      "learning_rate": 4.683080808080809e-06,
      "loss": 0.0016,
      "step": 7275
    },
    {
      "epoch": 26.258992805755394,
      "grad_norm": 0.0241763386875391,
      "learning_rate": 4.681818181818183e-06,
      "loss": 0.0018,
      "step": 7300
    },
    {
      "epoch": 26.348920863309353,
      "grad_norm": 0.1959693878889084,
      "learning_rate": 4.680555555555556e-06,
      "loss": 0.0014,
      "step": 7325
    },
    {
      "epoch": 26.43884892086331,
      "grad_norm": 0.05353585258126259,
      "learning_rate": 4.67929292929293e-06,
      "loss": 0.001,
      "step": 7350
    },
    {
      "epoch": 26.528776978417266,
      "grad_norm": 0.022708551958203316,
      "learning_rate": 4.678030303030303e-06,
      "loss": 0.0008,
      "step": 7375
    },
    {
      "epoch": 26.618705035971225,
      "grad_norm": 0.28148502111434937,
      "learning_rate": 4.676767676767677e-06,
      "loss": 0.0012,
      "step": 7400
    },
    {
      "epoch": 26.70863309352518,
      "grad_norm": 0.0556604228913784,
      "learning_rate": 4.675505050505051e-06,
      "loss": 0.0018,
      "step": 7425
    },
    {
      "epoch": 26.798561151079138,
      "grad_norm": 0.03789166733622551,
      "learning_rate": 4.674242424242425e-06,
      "loss": 0.0008,
      "step": 7450
    },
    {
      "epoch": 26.888489208633093,
      "grad_norm": 0.18029791116714478,
      "learning_rate": 4.672979797979799e-06,
      "loss": 0.001,
      "step": 7475
    },
    {
      "epoch": 26.97841726618705,
      "grad_norm": 0.27599871158599854,
      "learning_rate": 4.671717171717172e-06,
      "loss": 0.0008,
      "step": 7500
    },
    {
      "epoch": 27.068345323741006,
      "grad_norm": 0.4067777693271637,
      "learning_rate": 4.670454545454546e-06,
      "loss": 0.0017,
      "step": 7525
    },
    {
      "epoch": 27.158273381294965,
      "grad_norm": 0.36876606941223145,
      "learning_rate": 4.669191919191919e-06,
      "loss": 0.0011,
      "step": 7550
    },
    {
      "epoch": 27.24820143884892,
      "grad_norm": 0.2605381906032562,
      "learning_rate": 4.667929292929293e-06,
      "loss": 0.0014,
      "step": 7575
    },
    {
      "epoch": 27.33812949640288,
      "grad_norm": 0.02853270247578621,
      "learning_rate": 4.666666666666667e-06,
      "loss": 0.0008,
      "step": 7600
    },
    {
      "epoch": 27.428057553956833,
      "grad_norm": 0.055020011961460114,
      "learning_rate": 4.66540404040404e-06,
      "loss": 0.0009,
      "step": 7625
    },
    {
      "epoch": 27.51798561151079,
      "grad_norm": 0.30874237418174744,
      "learning_rate": 4.664141414141414e-06,
      "loss": 0.0018,
      "step": 7650
    },
    {
      "epoch": 27.607913669064747,
      "grad_norm": 0.09795974940061569,
      "learning_rate": 4.662878787878788e-06,
      "loss": 0.0014,
      "step": 7675
    },
    {
      "epoch": 27.697841726618705,
      "grad_norm": 0.04705384001135826,
      "learning_rate": 4.661616161616162e-06,
      "loss": 0.0015,
      "step": 7700
    },
    {
      "epoch": 27.78776978417266,
      "grad_norm": 0.058379877358675,
      "learning_rate": 4.6603535353535355e-06,
      "loss": 0.0008,
      "step": 7725
    },
    {
      "epoch": 27.87769784172662,
      "grad_norm": 0.047014497220516205,
      "learning_rate": 4.6590909090909095e-06,
      "loss": 0.0016,
      "step": 7750
    },
    {
      "epoch": 27.967625899280577,
      "grad_norm": 0.6353835463523865,
      "learning_rate": 4.6578282828282835e-06,
      "loss": 0.0012,
      "step": 7775
    },
    {
      "epoch": 28.057553956834532,
      "grad_norm": 0.13249577581882477,
      "learning_rate": 4.656565656565657e-06,
      "loss": 0.0007,
      "step": 7800
    },
    {
      "epoch": 28.14748201438849,
      "grad_norm": 0.16413046419620514,
      "learning_rate": 4.655303030303031e-06,
      "loss": 0.0009,
      "step": 7825
    },
    {
      "epoch": 28.237410071942445,
      "grad_norm": 0.21356362104415894,
      "learning_rate": 4.654040404040405e-06,
      "loss": 0.0007,
      "step": 7850
    },
    {
      "epoch": 28.327338129496404,
      "grad_norm": 0.0190277099609375,
      "learning_rate": 4.652777777777779e-06,
      "loss": 0.0007,
      "step": 7875
    },
    {
      "epoch": 28.41726618705036,
      "grad_norm": 0.12108524143695831,
      "learning_rate": 4.651515151515152e-06,
      "loss": 0.0009,
      "step": 7900
    },
    {
      "epoch": 28.507194244604317,
      "grad_norm": 0.026057908311486244,
      "learning_rate": 4.650252525252526e-06,
      "loss": 0.0007,
      "step": 7925
    },
    {
      "epoch": 28.597122302158272,
      "grad_norm": 0.09515079110860825,
      "learning_rate": 4.6489898989899e-06,
      "loss": 0.0008,
      "step": 7950
    },
    {
      "epoch": 28.68705035971223,
      "grad_norm": 0.48142778873443604,
      "learning_rate": 4.647727272727273e-06,
      "loss": 0.0007,
      "step": 7975
    },
    {
      "epoch": 28.776978417266186,
      "grad_norm": 0.46795013546943665,
      "learning_rate": 4.646464646464647e-06,
      "loss": 0.0014,
      "step": 8000
    },
    {
      "epoch": 28.776978417266186,
      "eval_loss": 0.09178629517555237,
      "eval_runtime": 1347.1747,
      "eval_samples_per_second": 1.649,
      "eval_steps_per_second": 0.103,
      "eval_wer": 7.139154262015849,
      "step": 8000
    },
    {
      "epoch": 28.866906474820144,
      "grad_norm": 0.5243809223175049,
      "learning_rate": 4.64520202020202e-06,
      "loss": 0.0007,
      "step": 8025
    },
    {
      "epoch": 28.9568345323741,
      "grad_norm": 0.3461306095123291,
      "learning_rate": 4.643939393939395e-06,
      "loss": 0.001,
      "step": 8050
    },
    {
      "epoch": 29.046762589928058,
      "grad_norm": 0.2795426845550537,
      "learning_rate": 4.642676767676768e-06,
      "loss": 0.0014,
      "step": 8075
    },
    {
      "epoch": 29.136690647482013,
      "grad_norm": 0.05419691279530525,
      "learning_rate": 4.641414141414142e-06,
      "loss": 0.0014,
      "step": 8100
    },
    {
      "epoch": 29.22661870503597,
      "grad_norm": 0.08857329189777374,
      "learning_rate": 4.640151515151515e-06,
      "loss": 0.0016,
      "step": 8125
    },
    {
      "epoch": 29.31654676258993,
      "grad_norm": 0.05129173770546913,
      "learning_rate": 4.638888888888889e-06,
      "loss": 0.0011,
      "step": 8150
    },
    {
      "epoch": 29.406474820143885,
      "grad_norm": 1.0032382011413574,
      "learning_rate": 4.637626262626263e-06,
      "loss": 0.0023,
      "step": 8175
    },
    {
      "epoch": 29.496402877697843,
      "grad_norm": 0.4335207939147949,
      "learning_rate": 4.636363636363636e-06,
      "loss": 0.0028,
      "step": 8200
    },
    {
      "epoch": 29.586330935251798,
      "grad_norm": 0.15561847388744354,
      "learning_rate": 4.63510101010101e-06,
      "loss": 0.0028,
      "step": 8225
    },
    {
      "epoch": 29.676258992805757,
      "grad_norm": 0.24305035173892975,
      "learning_rate": 4.633838383838384e-06,
      "loss": 0.0024,
      "step": 8250
    },
    {
      "epoch": 29.76618705035971,
      "grad_norm": 1.3689900636672974,
      "learning_rate": 4.632575757575758e-06,
      "loss": 0.0036,
      "step": 8275
    },
    {
      "epoch": 29.85611510791367,
      "grad_norm": 0.6511125564575195,
      "learning_rate": 4.6313131313131315e-06,
      "loss": 0.0025,
      "step": 8300
    },
    {
      "epoch": 29.946043165467625,
      "grad_norm": 0.8534782528877258,
      "learning_rate": 4.6300505050505055e-06,
      "loss": 0.0029,
      "step": 8325
    },
    {
      "epoch": 30.035971223021583,
      "grad_norm": 0.3412608504295349,
      "learning_rate": 4.6287878787878795e-06,
      "loss": 0.0028,
      "step": 8350
    },
    {
      "epoch": 30.12589928057554,
      "grad_norm": 0.16232311725616455,
      "learning_rate": 4.627525252525253e-06,
      "loss": 0.0023,
      "step": 8375
    },
    {
      "epoch": 30.215827338129497,
      "grad_norm": 0.08357956260442734,
      "learning_rate": 4.626262626262627e-06,
      "loss": 0.0019,
      "step": 8400
    },
    {
      "epoch": 30.305755395683452,
      "grad_norm": 0.412728488445282,
      "learning_rate": 4.625000000000001e-06,
      "loss": 0.0015,
      "step": 8425
    },
    {
      "epoch": 30.39568345323741,
      "grad_norm": 0.9784059524536133,
      "learning_rate": 4.623737373737375e-06,
      "loss": 0.0025,
      "step": 8450
    },
    {
      "epoch": 30.485611510791365,
      "grad_norm": 0.38275232911109924,
      "learning_rate": 4.622474747474748e-06,
      "loss": 0.0016,
      "step": 8475
    },
    {
      "epoch": 30.575539568345324,
      "grad_norm": 0.3518912196159363,
      "learning_rate": 4.621212121212122e-06,
      "loss": 0.0024,
      "step": 8500
    },
    {
      "epoch": 30.665467625899282,
      "grad_norm": 0.8633609414100647,
      "learning_rate": 4.619949494949496e-06,
      "loss": 0.0022,
      "step": 8525
    },
    {
      "epoch": 30.755395683453237,
      "grad_norm": 0.23257087171077728,
      "learning_rate": 4.618686868686869e-06,
      "loss": 0.0016,
      "step": 8550
    },
    {
      "epoch": 30.845323741007196,
      "grad_norm": 1.2157853841781616,
      "learning_rate": 4.617424242424243e-06,
      "loss": 0.0013,
      "step": 8575
    },
    {
      "epoch": 30.93525179856115,
      "grad_norm": 0.6692176461219788,
      "learning_rate": 4.616161616161616e-06,
      "loss": 0.0025,
      "step": 8600
    },
    {
      "epoch": 31.02517985611511,
      "grad_norm": 0.08320923149585724,
      "learning_rate": 4.61489898989899e-06,
      "loss": 0.0015,
      "step": 8625
    },
    {
      "epoch": 31.115107913669064,
      "grad_norm": 0.03867033123970032,
      "learning_rate": 4.613636363636364e-06,
      "loss": 0.0011,
      "step": 8650
    },
    {
      "epoch": 31.205035971223023,
      "grad_norm": 0.37571918964385986,
      "learning_rate": 4.612373737373737e-06,
      "loss": 0.002,
      "step": 8675
    },
    {
      "epoch": 31.294964028776977,
      "grad_norm": 0.023200325667858124,
      "learning_rate": 4.611111111111112e-06,
      "loss": 0.0017,
      "step": 8700
    },
    {
      "epoch": 31.384892086330936,
      "grad_norm": 0.025962859392166138,
      "learning_rate": 4.609848484848485e-06,
      "loss": 0.0025,
      "step": 8725
    },
    {
      "epoch": 31.47482014388489,
      "grad_norm": 0.07832462340593338,
      "learning_rate": 4.608585858585859e-06,
      "loss": 0.002,
      "step": 8750
    },
    {
      "epoch": 31.56474820143885,
      "grad_norm": 0.5365622043609619,
      "learning_rate": 4.607323232323232e-06,
      "loss": 0.0019,
      "step": 8775
    },
    {
      "epoch": 31.654676258992804,
      "grad_norm": 0.042796701192855835,
      "learning_rate": 4.606060606060606e-06,
      "loss": 0.0012,
      "step": 8800
    },
    {
      "epoch": 31.744604316546763,
      "grad_norm": 0.2298709750175476,
      "learning_rate": 4.60479797979798e-06,
      "loss": 0.0015,
      "step": 8825
    },
    {
      "epoch": 31.834532374100718,
      "grad_norm": 0.7432539463043213,
      "learning_rate": 4.6035353535353535e-06,
      "loss": 0.002,
      "step": 8850
    },
    {
      "epoch": 31.924460431654676,
      "grad_norm": 0.05896187201142311,
      "learning_rate": 4.6022727272727275e-06,
      "loss": 0.0017,
      "step": 8875
    },
    {
      "epoch": 32.014388489208635,
      "grad_norm": 0.6994006633758545,
      "learning_rate": 4.6010101010101015e-06,
      "loss": 0.0019,
      "step": 8900
    },
    {
      "epoch": 32.10431654676259,
      "grad_norm": 0.6547738909721375,
      "learning_rate": 4.5997474747474755e-06,
      "loss": 0.0016,
      "step": 8925
    },
    {
      "epoch": 32.194244604316545,
      "grad_norm": 0.13888348639011383,
      "learning_rate": 4.598484848484849e-06,
      "loss": 0.0014,
      "step": 8950
    },
    {
      "epoch": 32.28417266187051,
      "grad_norm": 0.09715843945741653,
      "learning_rate": 4.597222222222223e-06,
      "loss": 0.001,
      "step": 8975
    },
    {
      "epoch": 32.37410071942446,
      "grad_norm": 0.05904947221279144,
      "learning_rate": 4.595959595959597e-06,
      "loss": 0.0014,
      "step": 9000
    },
    {
      "epoch": 32.37410071942446,
      "eval_loss": 0.08943528681993484,
      "eval_runtime": 1353.2653,
      "eval_samples_per_second": 1.642,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.739243131156039,
      "step": 9000
    },
    {
      "epoch": 32.46402877697842,
      "grad_norm": 1.000013828277588,
      "learning_rate": 4.59469696969697e-06,
      "loss": 0.0012,
      "step": 9025
    },
    {
      "epoch": 32.55395683453237,
      "grad_norm": 0.031857941299676895,
      "learning_rate": 4.593434343434344e-06,
      "loss": 0.0011,
      "step": 9050
    },
    {
      "epoch": 32.643884892086334,
      "grad_norm": 0.18854251503944397,
      "learning_rate": 4.592171717171717e-06,
      "loss": 0.0011,
      "step": 9075
    },
    {
      "epoch": 32.73381294964029,
      "grad_norm": 0.06311248987913132,
      "learning_rate": 4.590909090909092e-06,
      "loss": 0.0009,
      "step": 9100
    },
    {
      "epoch": 32.82374100719424,
      "grad_norm": 0.02462015673518181,
      "learning_rate": 4.589646464646465e-06,
      "loss": 0.0023,
      "step": 9125
    },
    {
      "epoch": 32.9136690647482,
      "grad_norm": 0.5756279826164246,
      "learning_rate": 4.588383838383839e-06,
      "loss": 0.0014,
      "step": 9150
    },
    {
      "epoch": 33.00359712230216,
      "grad_norm": 0.39254868030548096,
      "learning_rate": 4.587121212121213e-06,
      "loss": 0.0012,
      "step": 9175
    },
    {
      "epoch": 33.093525179856115,
      "grad_norm": 0.05750317871570587,
      "learning_rate": 4.585858585858586e-06,
      "loss": 0.0016,
      "step": 9200
    },
    {
      "epoch": 33.18345323741007,
      "grad_norm": 0.456665962934494,
      "learning_rate": 4.58459595959596e-06,
      "loss": 0.0005,
      "step": 9225
    },
    {
      "epoch": 33.273381294964025,
      "grad_norm": 0.05247064307332039,
      "learning_rate": 4.583333333333333e-06,
      "loss": 0.0007,
      "step": 9250
    },
    {
      "epoch": 33.36330935251799,
      "grad_norm": 0.1745249629020691,
      "learning_rate": 4.582070707070708e-06,
      "loss": 0.0011,
      "step": 9275
    },
    {
      "epoch": 33.45323741007194,
      "grad_norm": 0.1702817678451538,
      "learning_rate": 4.580808080808081e-06,
      "loss": 0.0011,
      "step": 9300
    },
    {
      "epoch": 33.5431654676259,
      "grad_norm": 0.5600733757019043,
      "learning_rate": 4.579545454545455e-06,
      "loss": 0.0017,
      "step": 9325
    },
    {
      "epoch": 33.63309352517986,
      "grad_norm": 0.042534805834293365,
      "learning_rate": 4.578282828282828e-06,
      "loss": 0.002,
      "step": 9350
    },
    {
      "epoch": 33.723021582733814,
      "grad_norm": 0.025305964052677155,
      "learning_rate": 4.577020202020202e-06,
      "loss": 0.0014,
      "step": 9375
    },
    {
      "epoch": 33.81294964028777,
      "grad_norm": 0.05213531106710434,
      "learning_rate": 4.575757575757576e-06,
      "loss": 0.001,
      "step": 9400
    },
    {
      "epoch": 33.902877697841724,
      "grad_norm": 0.02446218766272068,
      "learning_rate": 4.5744949494949495e-06,
      "loss": 0.0006,
      "step": 9425
    },
    {
      "epoch": 33.992805755395686,
      "grad_norm": 0.009959193877875805,
      "learning_rate": 4.5732323232323235e-06,
      "loss": 0.0009,
      "step": 9450
    },
    {
      "epoch": 34.08273381294964,
      "grad_norm": 0.4287709891796112,
      "learning_rate": 4.5719696969696975e-06,
      "loss": 0.0007,
      "step": 9475
    },
    {
      "epoch": 34.172661870503596,
      "grad_norm": 0.011952442117035389,
      "learning_rate": 4.5707070707070715e-06,
      "loss": 0.0004,
      "step": 9500
    },
    {
      "epoch": 34.26258992805755,
      "grad_norm": 0.1948029100894928,
      "learning_rate": 4.569444444444445e-06,
      "loss": 0.0007,
      "step": 9525
    },
    {
      "epoch": 34.35251798561151,
      "grad_norm": 0.03538801521062851,
      "learning_rate": 4.568181818181819e-06,
      "loss": 0.0007,
      "step": 9550
    },
    {
      "epoch": 34.44244604316547,
      "grad_norm": 0.03204001113772392,
      "learning_rate": 4.566919191919193e-06,
      "loss": 0.0006,
      "step": 9575
    },
    {
      "epoch": 34.53237410071942,
      "grad_norm": 0.12747210264205933,
      "learning_rate": 4.565656565656566e-06,
      "loss": 0.0008,
      "step": 9600
    },
    {
      "epoch": 34.62230215827338,
      "grad_norm": 0.009002352133393288,
      "learning_rate": 4.56439393939394e-06,
      "loss": 0.0003,
      "step": 9625
    },
    {
      "epoch": 34.71223021582734,
      "grad_norm": 0.057965803891420364,
      "learning_rate": 4.563131313131314e-06,
      "loss": 0.0009,
      "step": 9650
    },
    {
      "epoch": 34.802158273381295,
      "grad_norm": 0.07385562360286713,
      "learning_rate": 4.561868686868687e-06,
      "loss": 0.0007,
      "step": 9675
    },
    {
      "epoch": 34.89208633093525,
      "grad_norm": 0.010685013607144356,
      "learning_rate": 4.560606060606061e-06,
      "loss": 0.0008,
      "step": 9700
    },
    {
      "epoch": 34.98201438848921,
      "grad_norm": 0.038797181099653244,
      "learning_rate": 4.559343434343435e-06,
      "loss": 0.0003,
      "step": 9725
    },
    {
      "epoch": 35.07194244604317,
      "grad_norm": 0.016779489815235138,
      "learning_rate": 4.558080808080809e-06,
      "loss": 0.0011,
      "step": 9750
    },
    {
      "epoch": 35.16187050359712,
      "grad_norm": 0.01562959887087345,
      "learning_rate": 4.556818181818182e-06,
      "loss": 0.0007,
      "step": 9775
    },
    {
      "epoch": 35.25179856115108,
      "grad_norm": 0.025731824338436127,
      "learning_rate": 4.555555555555556e-06,
      "loss": 0.0005,
      "step": 9800
    },
    {
      "epoch": 35.34172661870504,
      "grad_norm": 0.0950327217578888,
      "learning_rate": 4.554292929292929e-06,
      "loss": 0.0014,
      "step": 9825
    },
    {
      "epoch": 35.431654676258994,
      "grad_norm": 0.015813730657100677,
      "learning_rate": 4.553030303030303e-06,
      "loss": 0.0011,
      "step": 9850
    },
    {
      "epoch": 35.52158273381295,
      "grad_norm": 0.07395196706056595,
      "learning_rate": 4.551767676767677e-06,
      "loss": 0.0006,
      "step": 9875
    },
    {
      "epoch": 35.611510791366904,
      "grad_norm": 0.3815157413482666,
      "learning_rate": 4.55050505050505e-06,
      "loss": 0.001,
      "step": 9900
    },
    {
      "epoch": 35.701438848920866,
      "grad_norm": 0.028180675581097603,
      "learning_rate": 4.549242424242424e-06,
      "loss": 0.0007,
      "step": 9925
    },
    {
      "epoch": 35.79136690647482,
      "grad_norm": 0.022708212956786156,
      "learning_rate": 4.547979797979798e-06,
      "loss": 0.0007,
      "step": 9950
    },
    {
      "epoch": 35.881294964028775,
      "grad_norm": 0.37191152572631836,
      "learning_rate": 4.546717171717172e-06,
      "loss": 0.0006,
      "step": 9975
    },
    {
      "epoch": 35.97122302158273,
      "grad_norm": 0.045804716646671295,
      "learning_rate": 4.5454545454545455e-06,
      "loss": 0.0005,
      "step": 10000
    },
    {
      "epoch": 35.97122302158273,
      "eval_loss": 0.08962783217430115,
      "eval_runtime": 1349.7416,
      "eval_samples_per_second": 1.646,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.25786862178775,
      "step": 10000
    },
    {
      "epoch": 36.06115107913669,
      "grad_norm": 0.016676392406225204,
      "learning_rate": 4.5441919191919195e-06,
      "loss": 0.0003,
      "step": 10025
    },
    {
      "epoch": 36.15107913669065,
      "grad_norm": 0.15673214197158813,
      "learning_rate": 4.5429292929292935e-06,
      "loss": 0.0009,
      "step": 10050
    },
    {
      "epoch": 36.2410071942446,
      "grad_norm": 0.032344311475753784,
      "learning_rate": 4.541666666666667e-06,
      "loss": 0.0015,
      "step": 10075
    },
    {
      "epoch": 36.330935251798564,
      "grad_norm": 0.5042840242385864,
      "learning_rate": 4.540404040404041e-06,
      "loss": 0.0014,
      "step": 10100
    },
    {
      "epoch": 36.42086330935252,
      "grad_norm": 0.02287839725613594,
      "learning_rate": 4.539141414141415e-06,
      "loss": 0.0013,
      "step": 10125
    },
    {
      "epoch": 36.510791366906474,
      "grad_norm": 0.30796897411346436,
      "learning_rate": 4.537878787878789e-06,
      "loss": 0.0025,
      "step": 10150
    },
    {
      "epoch": 36.60071942446043,
      "grad_norm": 0.11940345168113708,
      "learning_rate": 4.536616161616162e-06,
      "loss": 0.0009,
      "step": 10175
    },
    {
      "epoch": 36.69064748201439,
      "grad_norm": 0.12890297174453735,
      "learning_rate": 4.535353535353536e-06,
      "loss": 0.001,
      "step": 10200
    },
    {
      "epoch": 36.780575539568346,
      "grad_norm": 0.016430262476205826,
      "learning_rate": 4.53409090909091e-06,
      "loss": 0.0012,
      "step": 10225
    },
    {
      "epoch": 36.8705035971223,
      "grad_norm": 0.08656007796525955,
      "learning_rate": 4.532828282828283e-06,
      "loss": 0.0015,
      "step": 10250
    },
    {
      "epoch": 36.960431654676256,
      "grad_norm": 0.0869501456618309,
      "learning_rate": 4.531565656565657e-06,
      "loss": 0.0018,
      "step": 10275
    },
    {
      "epoch": 37.05035971223022,
      "grad_norm": 0.4101605713367462,
      "learning_rate": 4.53030303030303e-06,
      "loss": 0.0015,
      "step": 10300
    },
    {
      "epoch": 37.14028776978417,
      "grad_norm": 0.0797925516963005,
      "learning_rate": 4.529040404040405e-06,
      "loss": 0.0007,
      "step": 10325
    },
    {
      "epoch": 37.23021582733813,
      "grad_norm": 0.025322135537862778,
      "learning_rate": 4.527777777777778e-06,
      "loss": 0.0006,
      "step": 10350
    },
    {
      "epoch": 37.32014388489208,
      "grad_norm": 0.059909917414188385,
      "learning_rate": 4.526515151515152e-06,
      "loss": 0.0012,
      "step": 10375
    },
    {
      "epoch": 37.410071942446045,
      "grad_norm": 0.062007270753383636,
      "learning_rate": 4.525252525252526e-06,
      "loss": 0.0012,
      "step": 10400
    },
    {
      "epoch": 37.5,
      "grad_norm": 0.35286614298820496,
      "learning_rate": 4.523989898989899e-06,
      "loss": 0.0016,
      "step": 10425
    },
    {
      "epoch": 37.589928057553955,
      "grad_norm": 0.1300862431526184,
      "learning_rate": 4.522727272727273e-06,
      "loss": 0.0006,
      "step": 10450
    },
    {
      "epoch": 37.67985611510792,
      "grad_norm": 0.13838863372802734,
      "learning_rate": 4.521464646464646e-06,
      "loss": 0.0006,
      "step": 10475
    },
    {
      "epoch": 37.76978417266187,
      "grad_norm": 0.6767460703849792,
      "learning_rate": 4.520202020202021e-06,
      "loss": 0.0006,
      "step": 10500
    },
    {
      "epoch": 37.85971223021583,
      "grad_norm": 0.03494667634367943,
      "learning_rate": 4.518939393939394e-06,
      "loss": 0.0013,
      "step": 10525
    },
    {
      "epoch": 37.94964028776978,
      "grad_norm": 0.14763426780700684,
      "learning_rate": 4.517676767676768e-06,
      "loss": 0.0022,
      "step": 10550
    },
    {
      "epoch": 38.039568345323744,
      "grad_norm": 0.15873517096042633,
      "learning_rate": 4.5164141414141415e-06,
      "loss": 0.0019,
      "step": 10575
    },
    {
      "epoch": 38.1294964028777,
      "grad_norm": 0.048420246690511703,
      "learning_rate": 4.5151515151515155e-06,
      "loss": 0.001,
      "step": 10600
    },
    {
      "epoch": 38.219424460431654,
      "grad_norm": 0.038138266652822495,
      "learning_rate": 4.5138888888888895e-06,
      "loss": 0.0004,
      "step": 10625
    },
    {
      "epoch": 38.30935251798561,
      "grad_norm": 0.024455932900309563,
      "learning_rate": 4.512626262626263e-06,
      "loss": 0.0007,
      "step": 10650
    },
    {
      "epoch": 38.39928057553957,
      "grad_norm": 0.29704517126083374,
      "learning_rate": 4.511363636363637e-06,
      "loss": 0.0012,
      "step": 10675
    },
    {
      "epoch": 38.489208633093526,
      "grad_norm": 0.23077060282230377,
      "learning_rate": 4.510101010101011e-06,
      "loss": 0.0006,
      "step": 10700
    },
    {
      "epoch": 38.57913669064748,
      "grad_norm": 0.04493401572108269,
      "learning_rate": 4.508838383838384e-06,
      "loss": 0.0007,
      "step": 10725
    },
    {
      "epoch": 38.669064748201436,
      "grad_norm": 0.01225815899670124,
      "learning_rate": 4.507575757575758e-06,
      "loss": 0.0004,
      "step": 10750
    },
    {
      "epoch": 38.7589928057554,
      "grad_norm": 0.19539327919483185,
      "learning_rate": 4.506313131313132e-06,
      "loss": 0.0012,
      "step": 10775
    },
    {
      "epoch": 38.84892086330935,
      "grad_norm": 0.4501245319843292,
      "learning_rate": 4.505050505050506e-06,
      "loss": 0.0016,
      "step": 10800
    },
    {
      "epoch": 38.93884892086331,
      "grad_norm": 0.955757200717926,
      "learning_rate": 4.503787878787879e-06,
      "loss": 0.002,
      "step": 10825
    },
    {
      "epoch": 39.02877697841727,
      "grad_norm": 0.4927741587162018,
      "learning_rate": 4.502525252525253e-06,
      "loss": 0.0009,
      "step": 10850
    },
    {
      "epoch": 39.118705035971225,
      "grad_norm": 0.5250554084777832,
      "learning_rate": 4.501262626262627e-06,
      "loss": 0.0018,
      "step": 10875
    },
    {
      "epoch": 39.20863309352518,
      "grad_norm": 0.5786688327789307,
      "learning_rate": 4.5e-06,
      "loss": 0.0013,
      "step": 10900
    },
    {
      "epoch": 39.298561151079134,
      "grad_norm": 0.015845810994505882,
      "learning_rate": 4.498737373737374e-06,
      "loss": 0.0009,
      "step": 10925
    },
    {
      "epoch": 39.388489208633096,
      "grad_norm": 0.01820209249854088,
      "learning_rate": 4.497474747474747e-06,
      "loss": 0.001,
      "step": 10950
    },
    {
      "epoch": 39.47841726618705,
      "grad_norm": 0.026294970884919167,
      "learning_rate": 4.496212121212122e-06,
      "loss": 0.0018,
      "step": 10975
    },
    {
      "epoch": 39.568345323741006,
      "grad_norm": 0.4651360511779785,
      "learning_rate": 4.494949494949495e-06,
      "loss": 0.0016,
      "step": 11000
    },
    {
      "epoch": 39.568345323741006,
      "eval_loss": 0.09019309282302856,
      "eval_runtime": 1345.7556,
      "eval_samples_per_second": 1.651,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.331926238613642,
      "step": 11000
    },
    {
      "epoch": 39.65827338129496,
      "grad_norm": 0.29995694756507874,
      "learning_rate": 4.493686868686869e-06,
      "loss": 0.0015,
      "step": 11025
    },
    {
      "epoch": 39.74820143884892,
      "grad_norm": 0.3291122019290924,
      "learning_rate": 4.492424242424242e-06,
      "loss": 0.0015,
      "step": 11050
    },
    {
      "epoch": 39.83812949640288,
      "grad_norm": 0.1785033792257309,
      "learning_rate": 4.491161616161616e-06,
      "loss": 0.0006,
      "step": 11075
    },
    {
      "epoch": 39.92805755395683,
      "grad_norm": 0.020028244704008102,
      "learning_rate": 4.48989898989899e-06,
      "loss": 0.002,
      "step": 11100
    },
    {
      "epoch": 40.01798561151079,
      "grad_norm": 0.08107150346040726,
      "learning_rate": 4.4886363636363636e-06,
      "loss": 0.0014,
      "step": 11125
    },
    {
      "epoch": 40.10791366906475,
      "grad_norm": 0.012092849239706993,
      "learning_rate": 4.4873737373737375e-06,
      "loss": 0.0018,
      "step": 11150
    },
    {
      "epoch": 40.197841726618705,
      "grad_norm": 0.163823664188385,
      "learning_rate": 4.4861111111111115e-06,
      "loss": 0.0014,
      "step": 11175
    },
    {
      "epoch": 40.28776978417266,
      "grad_norm": 0.07797440141439438,
      "learning_rate": 4.4848484848484855e-06,
      "loss": 0.0022,
      "step": 11200
    },
    {
      "epoch": 40.37769784172662,
      "grad_norm": 0.07735186815261841,
      "learning_rate": 4.483585858585859e-06,
      "loss": 0.0018,
      "step": 11225
    },
    {
      "epoch": 40.46762589928058,
      "grad_norm": 0.3801431953907013,
      "learning_rate": 4.482323232323233e-06,
      "loss": 0.0013,
      "step": 11250
    },
    {
      "epoch": 40.55755395683453,
      "grad_norm": 0.02574390545487404,
      "learning_rate": 4.481060606060607e-06,
      "loss": 0.0008,
      "step": 11275
    },
    {
      "epoch": 40.64748201438849,
      "grad_norm": 0.06015799939632416,
      "learning_rate": 4.47979797979798e-06,
      "loss": 0.0007,
      "step": 11300
    },
    {
      "epoch": 40.73741007194245,
      "grad_norm": 0.011081011034548283,
      "learning_rate": 4.478535353535354e-06,
      "loss": 0.0009,
      "step": 11325
    },
    {
      "epoch": 40.827338129496404,
      "grad_norm": 0.14023222029209137,
      "learning_rate": 4.477272727272728e-06,
      "loss": 0.0009,
      "step": 11350
    },
    {
      "epoch": 40.91726618705036,
      "grad_norm": 1.1734967231750488,
      "learning_rate": 4.476010101010102e-06,
      "loss": 0.0034,
      "step": 11375
    },
    {
      "epoch": 41.007194244604314,
      "grad_norm": 0.018789170309901237,
      "learning_rate": 4.474747474747475e-06,
      "loss": 0.0012,
      "step": 11400
    },
    {
      "epoch": 41.097122302158276,
      "grad_norm": 0.5469329953193665,
      "learning_rate": 4.473484848484849e-06,
      "loss": 0.0012,
      "step": 11425
    },
    {
      "epoch": 41.18705035971223,
      "grad_norm": 1.0320335626602173,
      "learning_rate": 4.472222222222223e-06,
      "loss": 0.0022,
      "step": 11450
    },
    {
      "epoch": 41.276978417266186,
      "grad_norm": 0.13018514215946198,
      "learning_rate": 4.470959595959596e-06,
      "loss": 0.001,
      "step": 11475
    },
    {
      "epoch": 41.36690647482014,
      "grad_norm": 0.764275848865509,
      "learning_rate": 4.46969696969697e-06,
      "loss": 0.0017,
      "step": 11500
    },
    {
      "epoch": 41.4568345323741,
      "grad_norm": 0.037678878754377365,
      "learning_rate": 4.468434343434343e-06,
      "loss": 0.0012,
      "step": 11525
    },
    {
      "epoch": 41.54676258992806,
      "grad_norm": 0.0776861384510994,
      "learning_rate": 4.467171717171718e-06,
      "loss": 0.0012,
      "step": 11550
    },
    {
      "epoch": 41.63669064748201,
      "grad_norm": 0.1435922086238861,
      "learning_rate": 4.465909090909091e-06,
      "loss": 0.0014,
      "step": 11575
    },
    {
      "epoch": 41.726618705035975,
      "grad_norm": 0.2661900520324707,
      "learning_rate": 4.464646464646465e-06,
      "loss": 0.0014,
      "step": 11600
    },
    {
      "epoch": 41.81654676258993,
      "grad_norm": 0.014804186299443245,
      "learning_rate": 4.463383838383838e-06,
      "loss": 0.0013,
      "step": 11625
    },
    {
      "epoch": 41.906474820143885,
      "grad_norm": 0.5918655395507812,
      "learning_rate": 4.462121212121212e-06,
      "loss": 0.001,
      "step": 11650
    },
    {
      "epoch": 41.99640287769784,
      "grad_norm": 0.2970104217529297,
      "learning_rate": 4.460858585858586e-06,
      "loss": 0.0014,
      "step": 11675
    },
    {
      "epoch": 42.0863309352518,
      "grad_norm": 0.24786308407783508,
      "learning_rate": 4.4595959595959596e-06,
      "loss": 0.0005,
      "step": 11700
    },
    {
      "epoch": 42.17625899280576,
      "grad_norm": 0.39591023325920105,
      "learning_rate": 4.4583333333333336e-06,
      "loss": 0.0012,
      "step": 11725
    },
    {
      "epoch": 42.26618705035971,
      "grad_norm": 0.014619703404605389,
      "learning_rate": 4.4570707070707076e-06,
      "loss": 0.0009,
      "step": 11750
    },
    {
      "epoch": 42.356115107913666,
      "grad_norm": 0.014031196013092995,
      "learning_rate": 4.4558080808080816e-06,
      "loss": 0.0005,
      "step": 11775
    },
    {
      "epoch": 42.44604316546763,
      "grad_norm": 0.0157134011387825,
      "learning_rate": 4.454545454545455e-06,
      "loss": 0.0005,
      "step": 11800
    },
    {
      "epoch": 42.53597122302158,
      "grad_norm": 0.5443057417869568,
      "learning_rate": 4.453282828282829e-06,
      "loss": 0.0005,
      "step": 11825
    },
    {
      "epoch": 42.62589928057554,
      "grad_norm": 0.17728668451309204,
      "learning_rate": 4.452020202020203e-06,
      "loss": 0.001,
      "step": 11850
    },
    {
      "epoch": 42.71582733812949,
      "grad_norm": 0.06720776110887527,
      "learning_rate": 4.450757575757576e-06,
      "loss": 0.0008,
      "step": 11875
    },
    {
      "epoch": 42.805755395683455,
      "grad_norm": 0.020302429795265198,
      "learning_rate": 4.44949494949495e-06,
      "loss": 0.0005,
      "step": 11900
    },
    {
      "epoch": 42.89568345323741,
      "grad_norm": 0.02236667089164257,
      "learning_rate": 4.448232323232324e-06,
      "loss": 0.0008,
      "step": 11925
    },
    {
      "epoch": 42.985611510791365,
      "grad_norm": 0.3039033114910126,
      "learning_rate": 4.446969696969697e-06,
      "loss": 0.0007,
      "step": 11950
    },
    {
      "epoch": 43.07553956834533,
      "grad_norm": 0.019936522468924522,
      "learning_rate": 4.445707070707071e-06,
      "loss": 0.0004,
      "step": 11975
    },
    {
      "epoch": 43.16546762589928,
      "grad_norm": 0.006646598689258099,
      "learning_rate": 4.444444444444444e-06,
      "loss": 0.0007,
      "step": 12000
    },
    {
      "epoch": 43.16546762589928,
      "eval_loss": 0.09005734324455261,
      "eval_runtime": 1349.9657,
      "eval_samples_per_second": 1.646,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.2208398133748055,
      "step": 12000
    },
    {
      "epoch": 43.25539568345324,
      "grad_norm": 0.06663926690816879,
      "learning_rate": 4.443181818181819e-06,
      "loss": 0.0003,
      "step": 12025
    },
    {
      "epoch": 43.34532374100719,
      "grad_norm": 0.7015880346298218,
      "learning_rate": 4.441919191919192e-06,
      "loss": 0.0013,
      "step": 12050
    },
    {
      "epoch": 43.435251798561154,
      "grad_norm": 0.09495950490236282,
      "learning_rate": 4.440656565656566e-06,
      "loss": 0.0009,
      "step": 12075
    },
    {
      "epoch": 43.52517985611511,
      "grad_norm": 0.010513260029256344,
      "learning_rate": 4.43939393939394e-06,
      "loss": 0.0007,
      "step": 12100
    },
    {
      "epoch": 43.615107913669064,
      "grad_norm": 0.08924310654401779,
      "learning_rate": 4.438131313131313e-06,
      "loss": 0.0004,
      "step": 12125
    },
    {
      "epoch": 43.70503597122302,
      "grad_norm": 0.015554459765553474,
      "learning_rate": 4.436868686868687e-06,
      "loss": 0.0005,
      "step": 12150
    },
    {
      "epoch": 43.79496402877698,
      "grad_norm": 0.02140822261571884,
      "learning_rate": 4.4356060606060604e-06,
      "loss": 0.0012,
      "step": 12175
    },
    {
      "epoch": 43.884892086330936,
      "grad_norm": 0.2149767279624939,
      "learning_rate": 4.434343434343435e-06,
      "loss": 0.0005,
      "step": 12200
    },
    {
      "epoch": 43.97482014388489,
      "grad_norm": 0.009459302760660648,
      "learning_rate": 4.4330808080808084e-06,
      "loss": 0.0012,
      "step": 12225
    },
    {
      "epoch": 44.064748201438846,
      "grad_norm": 0.05037049949169159,
      "learning_rate": 4.4318181818181824e-06,
      "loss": 0.0004,
      "step": 12250
    },
    {
      "epoch": 44.15467625899281,
      "grad_norm": 0.006279121618717909,
      "learning_rate": 4.430555555555556e-06,
      "loss": 0.0006,
      "step": 12275
    },
    {
      "epoch": 44.24460431654676,
      "grad_norm": 0.03591470420360565,
      "learning_rate": 4.42929292929293e-06,
      "loss": 0.0006,
      "step": 12300
    },
    {
      "epoch": 44.33453237410072,
      "grad_norm": 0.013430873863399029,
      "learning_rate": 4.428030303030304e-06,
      "loss": 0.0015,
      "step": 12325
    },
    {
      "epoch": 44.42446043165468,
      "grad_norm": 0.01713446155190468,
      "learning_rate": 4.426767676767677e-06,
      "loss": 0.0011,
      "step": 12350
    },
    {
      "epoch": 44.514388489208635,
      "grad_norm": 0.6338793039321899,
      "learning_rate": 4.425505050505051e-06,
      "loss": 0.0023,
      "step": 12375
    },
    {
      "epoch": 44.60431654676259,
      "grad_norm": 0.19725088775157928,
      "learning_rate": 4.424242424242425e-06,
      "loss": 0.0015,
      "step": 12400
    },
    {
      "epoch": 44.694244604316545,
      "grad_norm": 0.034790072590112686,
      "learning_rate": 4.422979797979799e-06,
      "loss": 0.0011,
      "step": 12425
    },
    {
      "epoch": 44.78417266187051,
      "grad_norm": 2.0450031757354736,
      "learning_rate": 4.421717171717172e-06,
      "loss": 0.0012,
      "step": 12450
    },
    {
      "epoch": 44.87410071942446,
      "grad_norm": 0.25726571679115295,
      "learning_rate": 4.420454545454546e-06,
      "loss": 0.0008,
      "step": 12475
    },
    {
      "epoch": 44.96402877697842,
      "grad_norm": 0.14911916851997375,
      "learning_rate": 4.41919191919192e-06,
      "loss": 0.002,
      "step": 12500
    },
    {
      "epoch": 45.05395683453237,
      "grad_norm": 0.5396764278411865,
      "learning_rate": 4.417929292929293e-06,
      "loss": 0.0018,
      "step": 12525
    },
    {
      "epoch": 45.143884892086334,
      "grad_norm": 0.21499969065189362,
      "learning_rate": 4.416666666666667e-06,
      "loss": 0.0008,
      "step": 12550
    },
    {
      "epoch": 45.23381294964029,
      "grad_norm": 0.12975308299064636,
      "learning_rate": 4.415404040404041e-06,
      "loss": 0.0011,
      "step": 12575
    },
    {
      "epoch": 45.32374100719424,
      "grad_norm": 0.03521961346268654,
      "learning_rate": 4.414141414141415e-06,
      "loss": 0.0009,
      "step": 12600
    },
    {
      "epoch": 45.4136690647482,
      "grad_norm": 0.3964645564556122,
      "learning_rate": 4.412878787878788e-06,
      "loss": 0.0009,
      "step": 12625
    },
    {
      "epoch": 45.50359712230216,
      "grad_norm": 0.04135512188076973,
      "learning_rate": 4.411616161616162e-06,
      "loss": 0.0007,
      "step": 12650
    },
    {
      "epoch": 45.593525179856115,
      "grad_norm": 0.11724065244197845,
      "learning_rate": 4.410353535353536e-06,
      "loss": 0.0013,
      "step": 12675
    },
    {
      "epoch": 45.68345323741007,
      "grad_norm": 0.3066418170928955,
      "learning_rate": 4.409090909090909e-06,
      "loss": 0.002,
      "step": 12700
    },
    {
      "epoch": 45.773381294964025,
      "grad_norm": 0.020460475236177444,
      "learning_rate": 4.407828282828283e-06,
      "loss": 0.0004,
      "step": 12725
    },
    {
      "epoch": 45.86330935251799,
      "grad_norm": 0.021625172346830368,
      "learning_rate": 4.4065656565656565e-06,
      "loss": 0.0008,
      "step": 12750
    },
    {
      "epoch": 45.95323741007194,
      "grad_norm": 0.01973818428814411,
      "learning_rate": 4.4053030303030305e-06,
      "loss": 0.0005,
      "step": 12775
    },
    {
      "epoch": 46.0431654676259,
      "grad_norm": 0.3055168092250824,
      "learning_rate": 4.4040404040404044e-06,
      "loss": 0.0004,
      "step": 12800
    },
    {
      "epoch": 46.13309352517986,
      "grad_norm": 0.11869470030069351,
      "learning_rate": 4.4027777777777784e-06,
      "loss": 0.0012,
      "step": 12825
    },
    {
      "epoch": 46.223021582733814,
      "grad_norm": 0.5959618091583252,
      "learning_rate": 4.401515151515152e-06,
      "loss": 0.0007,
      "step": 12850
    },
    {
      "epoch": 46.31294964028777,
      "grad_norm": 0.08037717640399933,
      "learning_rate": 4.400252525252526e-06,
      "loss": 0.0006,
      "step": 12875
    },
    {
      "epoch": 46.402877697841724,
      "grad_norm": 0.017363494262099266,
      "learning_rate": 4.3989898989899e-06,
      "loss": 0.0008,
      "step": 12900
    },
    {
      "epoch": 46.492805755395686,
      "grad_norm": 0.028551748022437096,
      "learning_rate": 4.397727272727273e-06,
      "loss": 0.001,
      "step": 12925
    },
    {
      "epoch": 46.58273381294964,
      "grad_norm": 0.08840727061033249,
      "learning_rate": 4.396464646464647e-06,
      "loss": 0.0007,
      "step": 12950
    },
    {
      "epoch": 46.672661870503596,
      "grad_norm": 0.023021990433335304,
      "learning_rate": 4.395202020202021e-06,
      "loss": 0.0018,
      "step": 12975
    },
    {
      "epoch": 46.76258992805755,
      "grad_norm": 0.05099537596106529,
      "learning_rate": 4.393939393939394e-06,
      "loss": 0.001,
      "step": 13000
    },
    {
      "epoch": 46.76258992805755,
      "eval_loss": 0.08809197694063187,
      "eval_runtime": 1348.5762,
      "eval_samples_per_second": 1.648,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.154187958231504,
      "step": 13000
    },
    {
      "epoch": 46.85251798561151,
      "grad_norm": 0.02734680473804474,
      "learning_rate": 4.392676767676768e-06,
      "loss": 0.0006,
      "step": 13025
    },
    {
      "epoch": 46.94244604316547,
      "grad_norm": 0.012311214581131935,
      "learning_rate": 4.391414141414142e-06,
      "loss": 0.0004,
      "step": 13050
    },
    {
      "epoch": 47.03237410071942,
      "grad_norm": 1.1471985578536987,
      "learning_rate": 4.390151515151516e-06,
      "loss": 0.0006,
      "step": 13075
    },
    {
      "epoch": 47.12230215827338,
      "grad_norm": 0.04378161579370499,
      "learning_rate": 4.388888888888889e-06,
      "loss": 0.0009,
      "step": 13100
    },
    {
      "epoch": 47.21223021582734,
      "grad_norm": 0.014206623658537865,
      "learning_rate": 4.387626262626263e-06,
      "loss": 0.0006,
      "step": 13125
    },
    {
      "epoch": 47.302158273381295,
      "grad_norm": 0.12384720891714096,
      "learning_rate": 4.386363636363637e-06,
      "loss": 0.0008,
      "step": 13150
    },
    {
      "epoch": 47.39208633093525,
      "grad_norm": 0.12384091317653656,
      "learning_rate": 4.38510101010101e-06,
      "loss": 0.0006,
      "step": 13175
    },
    {
      "epoch": 47.48201438848921,
      "grad_norm": 0.05459749698638916,
      "learning_rate": 4.383838383838384e-06,
      "loss": 0.0017,
      "step": 13200
    },
    {
      "epoch": 47.57194244604317,
      "grad_norm": 0.06376705318689346,
      "learning_rate": 4.382575757575757e-06,
      "loss": 0.0012,
      "step": 13225
    },
    {
      "epoch": 47.66187050359712,
      "grad_norm": 0.09516707807779312,
      "learning_rate": 4.381313131313132e-06,
      "loss": 0.0005,
      "step": 13250
    },
    {
      "epoch": 47.75179856115108,
      "grad_norm": 0.035159386694431305,
      "learning_rate": 4.380050505050505e-06,
      "loss": 0.0009,
      "step": 13275
    },
    {
      "epoch": 47.84172661870504,
      "grad_norm": 0.13273297250270844,
      "learning_rate": 4.378787878787879e-06,
      "loss": 0.0011,
      "step": 13300
    },
    {
      "epoch": 47.931654676258994,
      "grad_norm": 0.6526914834976196,
      "learning_rate": 4.3775252525252525e-06,
      "loss": 0.0017,
      "step": 13325
    },
    {
      "epoch": 48.02158273381295,
      "grad_norm": 0.10989696532487869,
      "learning_rate": 4.3762626262626265e-06,
      "loss": 0.0013,
      "step": 13350
    },
    {
      "epoch": 48.111510791366904,
      "grad_norm": 0.12258470058441162,
      "learning_rate": 4.3750000000000005e-06,
      "loss": 0.001,
      "step": 13375
    },
    {
      "epoch": 48.201438848920866,
      "grad_norm": 0.04794065281748772,
      "learning_rate": 4.373737373737374e-06,
      "loss": 0.0006,
      "step": 13400
    },
    {
      "epoch": 48.29136690647482,
      "grad_norm": 0.18742027878761292,
      "learning_rate": 4.3724747474747485e-06,
      "loss": 0.001,
      "step": 13425
    },
    {
      "epoch": 48.381294964028775,
      "grad_norm": 0.047946684062480927,
      "learning_rate": 4.371212121212122e-06,
      "loss": 0.0008,
      "step": 13450
    },
    {
      "epoch": 48.47122302158273,
      "grad_norm": 0.011459482833743095,
      "learning_rate": 4.369949494949496e-06,
      "loss": 0.0004,
      "step": 13475
    },
    {
      "epoch": 48.56115107913669,
      "grad_norm": 0.0178390983492136,
      "learning_rate": 4.368686868686869e-06,
      "loss": 0.0005,
      "step": 13500
    },
    {
      "epoch": 48.65107913669065,
      "grad_norm": 0.02639496698975563,
      "learning_rate": 4.367424242424243e-06,
      "loss": 0.0006,
      "step": 13525
    },
    {
      "epoch": 48.7410071942446,
      "grad_norm": 0.9992175698280334,
      "learning_rate": 4.366161616161617e-06,
      "loss": 0.0006,
      "step": 13550
    },
    {
      "epoch": 48.830935251798564,
      "grad_norm": 0.12613770365715027,
      "learning_rate": 4.36489898989899e-06,
      "loss": 0.0003,
      "step": 13575
    },
    {
      "epoch": 48.92086330935252,
      "grad_norm": 0.008718474768102169,
      "learning_rate": 4.363636363636364e-06,
      "loss": 0.0006,
      "step": 13600
    },
    {
      "epoch": 49.010791366906474,
      "grad_norm": 0.09226574003696442,
      "learning_rate": 4.362373737373738e-06,
      "loss": 0.001,
      "step": 13625
    },
    {
      "epoch": 49.10071942446043,
      "grad_norm": 0.01371210440993309,
      "learning_rate": 4.361111111111112e-06,
      "loss": 0.0005,
      "step": 13650
    },
    {
      "epoch": 49.19064748201439,
      "grad_norm": 0.8040596842765808,
      "learning_rate": 4.359848484848485e-06,
      "loss": 0.0014,
      "step": 13675
    },
    {
      "epoch": 49.280575539568346,
      "grad_norm": 0.2569543123245239,
      "learning_rate": 4.358585858585859e-06,
      "loss": 0.0004,
      "step": 13700
    },
    {
      "epoch": 49.3705035971223,
      "grad_norm": 0.04654459282755852,
      "learning_rate": 4.357323232323233e-06,
      "loss": 0.0003,
      "step": 13725
    },
    {
      "epoch": 49.460431654676256,
      "grad_norm": 0.03116775117814541,
      "learning_rate": 4.356060606060606e-06,
      "loss": 0.0006,
      "step": 13750
    },
    {
      "epoch": 49.55035971223022,
      "grad_norm": 0.013714387081563473,
      "learning_rate": 4.35479797979798e-06,
      "loss": 0.0005,
      "step": 13775
    },
    {
      "epoch": 49.64028776978417,
      "grad_norm": 0.012171006761491299,
      "learning_rate": 4.353535353535353e-06,
      "loss": 0.0005,
      "step": 13800
    },
    {
      "epoch": 49.73021582733813,
      "grad_norm": 0.39719274640083313,
      "learning_rate": 4.352272727272727e-06,
      "loss": 0.0002,
      "step": 13825
    },
    {
      "epoch": 49.82014388489208,
      "grad_norm": 0.009979949332773685,
      "learning_rate": 4.351010101010101e-06,
      "loss": 0.0002,
      "step": 13850
    },
    {
      "epoch": 49.910071942446045,
      "grad_norm": 0.010056397877633572,
      "learning_rate": 4.349747474747475e-06,
      "loss": 0.0001,
      "step": 13875
    },
    {
      "epoch": 50.0,
      "grad_norm": 1.2399721145629883,
      "learning_rate": 4.348484848484849e-06,
      "loss": 0.0003,
      "step": 13900
    },
    {
      "epoch": 50.089928057553955,
      "grad_norm": 0.008993759751319885,
      "learning_rate": 4.3472222222222225e-06,
      "loss": 0.0003,
      "step": 13925
    },
    {
      "epoch": 50.17985611510792,
      "grad_norm": 0.0040525756776332855,
      "learning_rate": 4.3459595959595965e-06,
      "loss": 0.0001,
      "step": 13950
    },
    {
      "epoch": 50.26978417266187,
      "grad_norm": 0.037480395287275314,
      "learning_rate": 4.34469696969697e-06,
      "loss": 0.0006,
      "step": 13975
    },
    {
      "epoch": 50.35971223021583,
      "grad_norm": 0.011341557838022709,
      "learning_rate": 4.343434343434344e-06,
      "loss": 0.0001,
      "step": 14000
    },
    {
      "epoch": 50.35971223021583,
      "eval_loss": 0.0883052721619606,
      "eval_runtime": 1347.8354,
      "eval_samples_per_second": 1.649,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.161593719914093,
      "step": 14000
    },
    {
      "epoch": 50.44964028776978,
      "grad_norm": 0.097772017121315,
      "learning_rate": 4.342171717171718e-06,
      "loss": 0.0003,
      "step": 14025
    },
    {
      "epoch": 50.539568345323744,
      "grad_norm": 0.22011174261569977,
      "learning_rate": 4.340909090909091e-06,
      "loss": 0.0004,
      "step": 14050
    },
    {
      "epoch": 50.6294964028777,
      "grad_norm": 0.004608627874404192,
      "learning_rate": 4.339646464646465e-06,
      "loss": 0.002,
      "step": 14075
    },
    {
      "epoch": 50.719424460431654,
      "grad_norm": 0.02777382917702198,
      "learning_rate": 4.338383838383839e-06,
      "loss": 0.0009,
      "step": 14100
    },
    {
      "epoch": 50.80935251798561,
      "grad_norm": 0.3765215277671814,
      "learning_rate": 4.337121212121213e-06,
      "loss": 0.0015,
      "step": 14125
    },
    {
      "epoch": 50.89928057553957,
      "grad_norm": 0.014906881377100945,
      "learning_rate": 4.335858585858586e-06,
      "loss": 0.0019,
      "step": 14150
    },
    {
      "epoch": 50.989208633093526,
      "grad_norm": 0.07598377764225006,
      "learning_rate": 4.33459595959596e-06,
      "loss": 0.0011,
      "step": 14175
    },
    {
      "epoch": 51.07913669064748,
      "grad_norm": 0.04858017340302467,
      "learning_rate": 4.333333333333334e-06,
      "loss": 0.002,
      "step": 14200
    },
    {
      "epoch": 51.169064748201436,
      "grad_norm": 0.00848084781318903,
      "learning_rate": 4.332070707070707e-06,
      "loss": 0.0015,
      "step": 14225
    },
    {
      "epoch": 51.2589928057554,
      "grad_norm": 0.192399799823761,
      "learning_rate": 4.330808080808081e-06,
      "loss": 0.0014,
      "step": 14250
    },
    {
      "epoch": 51.34892086330935,
      "grad_norm": 0.17804254591464996,
      "learning_rate": 4.329545454545455e-06,
      "loss": 0.0009,
      "step": 14275
    },
    {
      "epoch": 51.43884892086331,
      "grad_norm": 0.9404972791671753,
      "learning_rate": 4.328282828282829e-06,
      "loss": 0.0022,
      "step": 14300
    },
    {
      "epoch": 51.52877697841727,
      "grad_norm": 0.06042027473449707,
      "learning_rate": 4.327020202020202e-06,
      "loss": 0.0009,
      "step": 14325
    },
    {
      "epoch": 51.618705035971225,
      "grad_norm": 0.11593267321586609,
      "learning_rate": 4.325757575757576e-06,
      "loss": 0.001,
      "step": 14350
    },
    {
      "epoch": 51.70863309352518,
      "grad_norm": 0.042370762676000595,
      "learning_rate": 4.32449494949495e-06,
      "loss": 0.0009,
      "step": 14375
    },
    {
      "epoch": 51.798561151079134,
      "grad_norm": 0.06264758855104446,
      "learning_rate": 4.323232323232323e-06,
      "loss": 0.0011,
      "step": 14400
    },
    {
      "epoch": 51.888489208633096,
      "grad_norm": 0.419005811214447,
      "learning_rate": 4.321969696969697e-06,
      "loss": 0.0013,
      "step": 14425
    },
    {
      "epoch": 51.97841726618705,
      "grad_norm": 0.025492649525403976,
      "learning_rate": 4.3207070707070705e-06,
      "loss": 0.0008,
      "step": 14450
    },
    {
      "epoch": 52.068345323741006,
      "grad_norm": 0.1695825606584549,
      "learning_rate": 4.319444444444445e-06,
      "loss": 0.001,
      "step": 14475
    },
    {
      "epoch": 52.15827338129496,
      "grad_norm": 0.21136726438999176,
      "learning_rate": 4.3181818181818185e-06,
      "loss": 0.0004,
      "step": 14500
    },
    {
      "epoch": 52.24820143884892,
      "grad_norm": 0.00583269540220499,
      "learning_rate": 4.3169191919191925e-06,
      "loss": 0.0003,
      "step": 14525
    },
    {
      "epoch": 52.33812949640288,
      "grad_norm": 0.05031251907348633,
      "learning_rate": 4.315656565656566e-06,
      "loss": 0.0005,
      "step": 14550
    },
    {
      "epoch": 52.42805755395683,
      "grad_norm": 1.4654878377914429,
      "learning_rate": 4.31439393939394e-06,
      "loss": 0.0011,
      "step": 14575
    },
    {
      "epoch": 52.51798561151079,
      "grad_norm": 0.05035277083516121,
      "learning_rate": 4.313131313131314e-06,
      "loss": 0.0008,
      "step": 14600
    },
    {
      "epoch": 52.60791366906475,
      "grad_norm": 0.3283204138278961,
      "learning_rate": 4.311868686868687e-06,
      "loss": 0.0024,
      "step": 14625
    },
    {
      "epoch": 52.697841726618705,
      "grad_norm": 0.09352482855319977,
      "learning_rate": 4.310606060606061e-06,
      "loss": 0.0013,
      "step": 14650
    },
    {
      "epoch": 52.78776978417266,
      "grad_norm": 0.4381198287010193,
      "learning_rate": 4.309343434343435e-06,
      "loss": 0.0014,
      "step": 14675
    },
    {
      "epoch": 52.87769784172662,
      "grad_norm": 0.4195464551448822,
      "learning_rate": 4.308080808080809e-06,
      "loss": 0.0006,
      "step": 14700
    },
    {
      "epoch": 52.96762589928058,
      "grad_norm": 0.037935055792331696,
      "learning_rate": 4.306818181818182e-06,
      "loss": 0.0005,
      "step": 14725
    },
    {
      "epoch": 53.05755395683453,
      "grad_norm": 0.0057031637988984585,
      "learning_rate": 4.305555555555556e-06,
      "loss": 0.0011,
      "step": 14750
    },
    {
      "epoch": 53.14748201438849,
      "grad_norm": 0.09235268831253052,
      "learning_rate": 4.30429292929293e-06,
      "loss": 0.0012,
      "step": 14775
    },
    {
      "epoch": 53.23741007194245,
      "grad_norm": 0.4533500075340271,
      "learning_rate": 4.303030303030303e-06,
      "loss": 0.0013,
      "step": 14800
    },
    {
      "epoch": 53.327338129496404,
      "grad_norm": 0.14968417584896088,
      "learning_rate": 4.301767676767677e-06,
      "loss": 0.0009,
      "step": 14825
    },
    {
      "epoch": 53.41726618705036,
      "grad_norm": 0.016032686457037926,
      "learning_rate": 4.300505050505051e-06,
      "loss": 0.0003,
      "step": 14850
    },
    {
      "epoch": 53.507194244604314,
      "grad_norm": 0.04255020618438721,
      "learning_rate": 4.299242424242425e-06,
      "loss": 0.0002,
      "step": 14875
    },
    {
      "epoch": 53.597122302158276,
      "grad_norm": 0.01301508117467165,
      "learning_rate": 4.297979797979798e-06,
      "loss": 0.0003,
      "step": 14900
    },
    {
      "epoch": 53.68705035971223,
      "grad_norm": 0.007252383045852184,
      "learning_rate": 4.296717171717172e-06,
      "loss": 0.0005,
      "step": 14925
    },
    {
      "epoch": 53.776978417266186,
      "grad_norm": 0.13183751702308655,
      "learning_rate": 4.295454545454546e-06,
      "loss": 0.002,
      "step": 14950
    },
    {
      "epoch": 53.86690647482014,
      "grad_norm": 0.028183195739984512,
      "learning_rate": 4.294191919191919e-06,
      "loss": 0.0015,
      "step": 14975
    },
    {
      "epoch": 53.9568345323741,
      "grad_norm": 0.1370900571346283,
      "learning_rate": 4.292929292929293e-06,
      "loss": 0.0007,
      "step": 15000
    },
    {
      "epoch": 53.9568345323741,
      "eval_loss": 0.08864730596542358,
      "eval_runtime": 1347.6756,
      "eval_samples_per_second": 1.649,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.391172332074353,
      "step": 15000
    },
    {
      "epoch": 54.04676258992806,
      "grad_norm": 0.01960013061761856,
      "learning_rate": 4.2916666666666665e-06,
      "loss": 0.0016,
      "step": 15025
    },
    {
      "epoch": 54.13669064748201,
      "grad_norm": 0.13105234503746033,
      "learning_rate": 4.2904040404040405e-06,
      "loss": 0.0003,
      "step": 15050
    },
    {
      "epoch": 54.226618705035975,
      "grad_norm": 2.309511423110962,
      "learning_rate": 4.2891414141414145e-06,
      "loss": 0.0009,
      "step": 15075
    },
    {
      "epoch": 54.31654676258993,
      "grad_norm": 0.018184732645750046,
      "learning_rate": 4.287878787878788e-06,
      "loss": 0.001,
      "step": 15100
    },
    {
      "epoch": 54.406474820143885,
      "grad_norm": 0.05596456304192543,
      "learning_rate": 4.2866161616161625e-06,
      "loss": 0.0012,
      "step": 15125
    },
    {
      "epoch": 54.49640287769784,
      "grad_norm": 0.735536515712738,
      "learning_rate": 4.285353535353536e-06,
      "loss": 0.0014,
      "step": 15150
    },
    {
      "epoch": 54.5863309352518,
      "grad_norm": 0.641944169998169,
      "learning_rate": 4.28409090909091e-06,
      "loss": 0.0017,
      "step": 15175
    },
    {
      "epoch": 54.67625899280576,
      "grad_norm": 0.02818766050040722,
      "learning_rate": 4.282828282828283e-06,
      "loss": 0.0013,
      "step": 15200
    },
    {
      "epoch": 54.76618705035971,
      "grad_norm": 0.04384085536003113,
      "learning_rate": 4.281565656565657e-06,
      "loss": 0.0012,
      "step": 15225
    },
    {
      "epoch": 54.856115107913666,
      "grad_norm": 0.5741293430328369,
      "learning_rate": 4.280303030303031e-06,
      "loss": 0.0012,
      "step": 15250
    },
    {
      "epoch": 54.94604316546763,
      "grad_norm": 0.5108962059020996,
      "learning_rate": 4.279040404040404e-06,
      "loss": 0.0013,
      "step": 15275
    },
    {
      "epoch": 55.03597122302158,
      "grad_norm": 0.09613129496574402,
      "learning_rate": 4.277777777777778e-06,
      "loss": 0.0011,
      "step": 15300
    },
    {
      "epoch": 55.12589928057554,
      "grad_norm": 0.2453729510307312,
      "learning_rate": 4.276515151515152e-06,
      "loss": 0.0016,
      "step": 15325
    },
    {
      "epoch": 55.21582733812949,
      "grad_norm": 0.03533944860100746,
      "learning_rate": 4.275252525252526e-06,
      "loss": 0.0013,
      "step": 15350
    },
    {
      "epoch": 55.305755395683455,
      "grad_norm": 0.02793753705918789,
      "learning_rate": 4.273989898989899e-06,
      "loss": 0.0011,
      "step": 15375
    },
    {
      "epoch": 55.39568345323741,
      "grad_norm": 0.11208122968673706,
      "learning_rate": 4.272727272727273e-06,
      "loss": 0.0014,
      "step": 15400
    },
    {
      "epoch": 55.485611510791365,
      "grad_norm": 0.23727653920650482,
      "learning_rate": 4.271464646464647e-06,
      "loss": 0.0007,
      "step": 15425
    },
    {
      "epoch": 55.57553956834532,
      "grad_norm": 0.1095881313085556,
      "learning_rate": 4.27020202020202e-06,
      "loss": 0.0006,
      "step": 15450
    },
    {
      "epoch": 55.66546762589928,
      "grad_norm": 0.026398301124572754,
      "learning_rate": 4.268939393939394e-06,
      "loss": 0.0003,
      "step": 15475
    },
    {
      "epoch": 55.75539568345324,
      "grad_norm": 0.3764269948005676,
      "learning_rate": 4.267676767676767e-06,
      "loss": 0.0007,
      "step": 15500
    },
    {
      "epoch": 55.84532374100719,
      "grad_norm": 0.710081160068512,
      "learning_rate": 4.266414141414142e-06,
      "loss": 0.0006,
      "step": 15525
    },
    {
      "epoch": 55.935251798561154,
      "grad_norm": 0.01405036449432373,
      "learning_rate": 4.265151515151515e-06,
      "loss": 0.0009,
      "step": 15550
    },
    {
      "epoch": 56.02517985611511,
      "grad_norm": 0.011654024943709373,
      "learning_rate": 4.263888888888889e-06,
      "loss": 0.0011,
      "step": 15575
    },
    {
      "epoch": 56.115107913669064,
      "grad_norm": 0.8455324172973633,
      "learning_rate": 4.262626262626263e-06,
      "loss": 0.0006,
      "step": 15600
    },
    {
      "epoch": 56.20503597122302,
      "grad_norm": 0.7859840989112854,
      "learning_rate": 4.2613636363636365e-06,
      "loss": 0.0005,
      "step": 15625
    },
    {
      "epoch": 56.29496402877698,
      "grad_norm": 0.012887760065495968,
      "learning_rate": 4.2601010101010105e-06,
      "loss": 0.0003,
      "step": 15650
    },
    {
      "epoch": 56.384892086330936,
      "grad_norm": 0.27630236744880676,
      "learning_rate": 4.258838383838384e-06,
      "loss": 0.0005,
      "step": 15675
    },
    {
      "epoch": 56.47482014388489,
      "grad_norm": 0.23494713008403778,
      "learning_rate": 4.2575757575757585e-06,
      "loss": 0.0003,
      "step": 15700
    },
    {
      "epoch": 56.564748201438846,
      "grad_norm": 0.04018251597881317,
      "learning_rate": 4.256313131313132e-06,
      "loss": 0.0009,
      "step": 15725
    },
    {
      "epoch": 56.65467625899281,
      "grad_norm": 0.29447436332702637,
      "learning_rate": 4.255050505050506e-06,
      "loss": 0.0002,
      "step": 15750
    },
    {
      "epoch": 56.74460431654676,
      "grad_norm": 0.048734016716480255,
      "learning_rate": 4.253787878787879e-06,
      "loss": 0.0008,
      "step": 15775
    },
    {
      "epoch": 56.83453237410072,
      "grad_norm": 0.00981312245130539,
      "learning_rate": 4.252525252525253e-06,
      "loss": 0.0003,
      "step": 15800
    },
    {
      "epoch": 56.92446043165468,
      "grad_norm": 0.029217666015028954,
      "learning_rate": 4.251262626262627e-06,
      "loss": 0.0002,
      "step": 15825
    },
    {
      "epoch": 57.014388489208635,
      "grad_norm": 0.0892946720123291,
      "learning_rate": 4.25e-06,
      "loss": 0.0008,
      "step": 15850
    },
    {
      "epoch": 57.10431654676259,
      "grad_norm": 0.0070861089043319225,
      "learning_rate": 4.248737373737374e-06,
      "loss": 0.0003,
      "step": 15875
    },
    {
      "epoch": 57.194244604316545,
      "grad_norm": 0.5670444965362549,
      "learning_rate": 4.247474747474748e-06,
      "loss": 0.0005,
      "step": 15900
    },
    {
      "epoch": 57.28417266187051,
      "grad_norm": 0.4061719477176666,
      "learning_rate": 4.246212121212122e-06,
      "loss": 0.0009,
      "step": 15925
    },
    {
      "epoch": 57.37410071942446,
      "grad_norm": 0.2658737897872925,
      "learning_rate": 4.244949494949495e-06,
      "loss": 0.0011,
      "step": 15950
    },
    {
      "epoch": 57.46402877697842,
      "grad_norm": 0.06908473372459412,
      "learning_rate": 4.243686868686869e-06,
      "loss": 0.0012,
      "step": 15975
    },
    {
      "epoch": 57.55395683453237,
      "grad_norm": 0.12484970688819885,
      "learning_rate": 4.242424242424243e-06,
      "loss": 0.0008,
      "step": 16000
    },
    {
      "epoch": 57.55395683453237,
      "eval_loss": 0.09175190329551697,
      "eval_runtime": 1351.6711,
      "eval_samples_per_second": 1.644,
      "eval_steps_per_second": 0.103,
      "eval_wer": 6.391172332074353,
      "step": 16000
    },
    {
      "epoch": 57.643884892086334,
      "grad_norm": 0.10532079637050629,
      "learning_rate": 4.241161616161616e-06,
      "loss": 0.0009,
      "step": 16025
    },
    {
      "epoch": 57.73381294964029,
      "grad_norm": 0.0082013588398695,
      "learning_rate": 4.23989898989899e-06,
      "loss": 0.0009,
      "step": 16050
    },
    {
      "epoch": 57.82374100719424,
      "grad_norm": 0.8880343437194824,
      "learning_rate": 4.238636363636364e-06,
      "loss": 0.0012,
      "step": 16075
    },
    {
      "epoch": 57.9136690647482,
      "grad_norm": 0.04694369435310364,
      "learning_rate": 4.237373737373737e-06,
      "loss": 0.0011,
      "step": 16100
    },
    {
      "epoch": 58.00359712230216,
      "grad_norm": 0.4175935387611389,
      "learning_rate": 4.236111111111111e-06,
      "loss": 0.0007,
      "step": 16125
    },
    {
      "epoch": 58.093525179856115,
      "grad_norm": 0.0991375669836998,
      "learning_rate": 4.234848484848485e-06,
      "loss": 0.0008,
      "step": 16150
    },
    {
      "epoch": 58.18345323741007,
      "grad_norm": 0.05238619074225426,
      "learning_rate": 4.233585858585859e-06,
      "loss": 0.0009,
      "step": 16175
    },
    {
      "epoch": 58.273381294964025,
      "grad_norm": 0.024060403928160667,
      "learning_rate": 4.2323232323232325e-06,
      "loss": 0.0005,
      "step": 16200
    },
    {
      "epoch": 58.36330935251799,
      "grad_norm": 0.514026939868927,
      "learning_rate": 4.2310606060606065e-06,
      "loss": 0.0017,
      "step": 16225
    },
    {
      "epoch": 58.45323741007194,
      "grad_norm": 0.9123257994651794,
      "learning_rate": 4.22979797979798e-06,
      "loss": 0.0009,
      "step": 16250
    },
    {
      "epoch": 58.5431654676259,
      "grad_norm": 0.034488383680582047,
      "learning_rate": 4.228535353535354e-06,
      "loss": 0.0005,
      "step": 16275
    },
    {
      "epoch": 58.63309352517986,
      "grad_norm": 0.08020392805337906,
      "learning_rate": 4.227272727272728e-06,
      "loss": 0.0021,
      "step": 16300
    },
    {
      "epoch": 58.723021582733814,
      "grad_norm": 0.011538870632648468,
      "learning_rate": 4.226010101010101e-06,
      "loss": 0.001,
      "step": 16325
    },
    {
      "epoch": 58.81294964028777,
      "grad_norm": 0.4130057692527771,
      "learning_rate": 4.224747474747475e-06,
      "loss": 0.0009,
      "step": 16350
    },
    {
      "epoch": 58.902877697841724,
      "grad_norm": 0.018940504640340805,
      "learning_rate": 4.223484848484849e-06,
      "loss": 0.0008,
      "step": 16375
    },
    {
      "epoch": 58.992805755395686,
      "grad_norm": 0.09760510176420212,
      "learning_rate": 4.222222222222223e-06,
      "loss": 0.0009,
      "step": 16400
    },
    {
      "epoch": 59.08273381294964,
      "grad_norm": 0.6728724241256714,
      "learning_rate": 4.220959595959596e-06,
      "loss": 0.0015,
      "step": 16425
    },
    {
      "epoch": 59.172661870503596,
      "grad_norm": 0.01400268916040659,
      "learning_rate": 4.21969696969697e-06,
      "loss": 0.0006,
      "step": 16450
    },
    {
      "epoch": 59.26258992805755,
      "grad_norm": 0.027168823406100273,
      "learning_rate": 4.218434343434344e-06,
      "loss": 0.0003,
      "step": 16475
    },
    {
      "epoch": 59.35251798561151,
      "grad_norm": 0.025733735412359238,
      "learning_rate": 4.217171717171717e-06,
      "loss": 0.0003,
      "step": 16500
    },
    {
      "epoch": 59.44244604316547,
      "grad_norm": 0.012072687968611717,
      "learning_rate": 4.215909090909091e-06,
      "loss": 0.0004,
      "step": 16525
    },
    {
      "epoch": 59.53237410071942,
      "grad_norm": 0.03630650043487549,
      "learning_rate": 4.214646464646465e-06,
      "loss": 0.0013,
      "step": 16550
    },
    {
      "epoch": 59.62230215827338,
      "grad_norm": 0.13875187933444977,
      "learning_rate": 4.213383838383839e-06,
      "loss": 0.0008,
      "step": 16575
    },
    {
      "epoch": 59.71223021582734,
      "grad_norm": 0.06004035472869873,
      "learning_rate": 4.212121212121212e-06,
      "loss": 0.0004,
      "step": 16600
    },
    {
      "epoch": 59.802158273381295,
      "grad_norm": 0.024319609627127647,
      "learning_rate": 4.210858585858586e-06,
      "loss": 0.0006,
      "step": 16625
    },
    {
      "epoch": 59.89208633093525,
      "grad_norm": 0.0957476794719696,
      "learning_rate": 4.20959595959596e-06,
      "loss": 0.0016,
      "step": 16650
    },
    {
      "epoch": 59.98201438848921,
      "grad_norm": 0.014447568915784359,
      "learning_rate": 4.208333333333333e-06,
      "loss": 0.0007,
      "step": 16675
    },
    {
      "epoch": 60.07194244604317,
      "grad_norm": 0.0760221779346466,
      "learning_rate": 4.207070707070707e-06,
      "loss": 0.0007,
      "step": 16700
    },
    {
      "epoch": 60.16187050359712,
      "grad_norm": 0.08783930540084839,
      "learning_rate": 4.2058080808080806e-06,
      "loss": 0.0006,
      "step": 16725
    },
    {
      "epoch": 60.25179856115108,
      "grad_norm": 0.020011553540825844,
      "learning_rate": 4.204545454545455e-06,
      "loss": 0.0002,
      "step": 16750
    },
    {
      "epoch": 60.34172661870504,
      "grad_norm": 0.004587370436638594,
      "learning_rate": 4.2032828282828286e-06,
      "loss": 0.0001,
      "step": 16775
    },
    {
      "epoch": 60.431654676258994,
      "grad_norm": 0.05192629247903824,
      "learning_rate": 4.2020202020202026e-06,
      "loss": 0.0007,
      "step": 16800
    },
    {
      "epoch": 60.52158273381295,
      "grad_norm": 0.0028184789698570967,
      "learning_rate": 4.2007575757575766e-06,
      "loss": 0.0001,
      "step": 16825
    },
    {
      "epoch": 60.611510791366904,
      "grad_norm": 0.11263082921504974,
      "learning_rate": 4.19949494949495e-06,
      "loss": 0.0004,
      "step": 16850
    },
    {
      "epoch": 60.701438848920866,
      "grad_norm": 0.020229890942573547,
      "learning_rate": 4.198232323232324e-06,
      "loss": 0.0002,
      "step": 16875
    },
    {
      "epoch": 60.79136690647482,
      "grad_norm": 0.004258246161043644,
      "learning_rate": 4.196969696969697e-06,
      "loss": 0.0004,
      "step": 16900
    },
    {
      "epoch": 60.881294964028775,
      "grad_norm": 0.005619137082248926,
      "learning_rate": 4.195707070707072e-06,
      "loss": 0.0001,
      "step": 16925
    },
    {
      "epoch": 60.97122302158273,
      "grad_norm": 0.005032286513596773,
      "learning_rate": 4.194444444444445e-06,
      "loss": 0.0002,
      "step": 16950
    },
    {
      "epoch": 61.06115107913669,
      "grad_norm": 0.02484523132443428,
      "learning_rate": 4.193181818181819e-06,
      "loss": 0.0003,
      "step": 16975
    },
    {
      "epoch": 61.15107913669065,
      "grad_norm": 0.0017194038955494761,
      "learning_rate": 4.191919191919192e-06,
      "loss": 0.0002,
      "step": 17000
    },
    {
      "epoch": 61.15107913669065,
      "eval_loss": 0.09027338027954102,
      "eval_runtime": 1359.5537,
      "eval_samples_per_second": 1.634,
      "eval_steps_per_second": 0.102,
      "eval_wer": 5.909797822706065,
      "step": 17000
    },
    {
      "epoch": 61.2410071942446,
      "grad_norm": 0.0024019062984734774,
      "learning_rate": 4.190656565656566e-06,
      "loss": 0.0002,
      "step": 17025
    },
    {
      "epoch": 61.330935251798564,
      "grad_norm": 0.004478455055505037,
      "learning_rate": 4.18939393939394e-06,
      "loss": 0.0003,
      "step": 17050
    },
    {
      "epoch": 61.42086330935252,
      "grad_norm": 0.0044603836722671986,
      "learning_rate": 4.188131313131313e-06,
      "loss": 0.0004,
      "step": 17075
    },
    {
      "epoch": 61.510791366906474,
      "grad_norm": 0.08818788081407547,
      "learning_rate": 4.186868686868687e-06,
      "loss": 0.0009,
      "step": 17100
    },
    {
      "epoch": 61.60071942446043,
      "grad_norm": 0.0027286384720355272,
      "learning_rate": 4.185606060606061e-06,
      "loss": 0.0002,
      "step": 17125
    },
    {
      "epoch": 61.69064748201439,
      "grad_norm": 0.0037345695309340954,
      "learning_rate": 4.184343434343434e-06,
      "loss": 0.0003,
      "step": 17150
    },
    {
      "epoch": 61.780575539568346,
      "grad_norm": 0.014616015367209911,
      "learning_rate": 4.183080808080808e-06,
      "loss": 0.0004,
      "step": 17175
    },
    {
      "epoch": 61.8705035971223,
      "grad_norm": 0.007769573014229536,
      "learning_rate": 4.181818181818182e-06,
      "loss": 0.0003,
      "step": 17200
    },
    {
      "epoch": 61.960431654676256,
      "grad_norm": 0.008359814994037151,
      "learning_rate": 4.180555555555556e-06,
      "loss": 0.0005,
      "step": 17225
    },
    {
      "epoch": 62.05035971223022,
      "grad_norm": 0.0051100486889481544,
      "learning_rate": 4.1792929292929294e-06,
      "loss": 0.0005,
      "step": 17250
    },
    {
      "epoch": 62.14028776978417,
      "grad_norm": 0.0029563389252871275,
      "learning_rate": 4.1780303030303034e-06,
      "loss": 0.0001,
      "step": 17275
    },
    {
      "epoch": 62.23021582733813,
      "grad_norm": 0.0030668089166283607,
      "learning_rate": 4.1767676767676774e-06,
      "loss": 0.0001,
      "step": 17300
    },
    {
      "epoch": 62.32014388489208,
      "grad_norm": 0.02710825577378273,
      "learning_rate": 4.175505050505051e-06,
      "loss": 0.0006,
      "step": 17325
    },
    {
      "epoch": 62.410071942446045,
      "grad_norm": 0.0027756947092711926,
      "learning_rate": 4.1742424242424246e-06,
      "loss": 0.0001,
      "step": 17350
    },
    {
      "epoch": 62.5,
      "grad_norm": 0.09106307476758957,
      "learning_rate": 4.172979797979798e-06,
      "loss": 0.0003,
      "step": 17375
    },
    {
      "epoch": 62.589928057553955,
      "grad_norm": 0.005363088101148605,
      "learning_rate": 4.1717171717171726e-06,
      "loss": 0.0001,
      "step": 17400
    },
    {
      "epoch": 62.67985611510792,
      "grad_norm": 0.005525332409888506,
      "learning_rate": 4.170454545454546e-06,
      "loss": 0.0001,
      "step": 17425
    },
    {
      "epoch": 62.76978417266187,
      "grad_norm": 0.007496482692658901,
      "learning_rate": 4.16919191919192e-06,
      "loss": 0.0001,
      "step": 17450
    },
    {
      "epoch": 62.85971223021583,
      "grad_norm": 0.026290051639080048,
      "learning_rate": 4.167929292929293e-06,
      "loss": 0.0001,
      "step": 17475
    },
    {
      "epoch": 62.94964028776978,
      "grad_norm": 0.006395560223609209,
      "learning_rate": 4.166666666666667e-06,
      "loss": 0.0001,
      "step": 17500
    },
    {
      "epoch": 63.039568345323744,
      "grad_norm": 0.004197731614112854,
      "learning_rate": 4.165404040404041e-06,
      "loss": 0.0001,
      "step": 17525
    },
    {
      "epoch": 63.1294964028777,
      "grad_norm": 0.002505301032215357,
      "learning_rate": 4.164141414141414e-06,
      "loss": 0.0,
      "step": 17550
    },
    {
      "epoch": 63.219424460431654,
      "grad_norm": 0.0022915108129382133,
      "learning_rate": 4.162878787878788e-06,
      "loss": 0.0001,
      "step": 17575
    },
    {
      "epoch": 63.30935251798561,
      "grad_norm": 0.0019390948582440615,
      "learning_rate": 4.161616161616162e-06,
      "loss": 0.0,
      "step": 17600
    },
    {
      "epoch": 63.39928057553957,
      "grad_norm": 0.001307799364440143,
      "learning_rate": 4.160353535353536e-06,
      "loss": 0.0001,
      "step": 17625
    },
    {
      "epoch": 63.489208633093526,
      "grad_norm": 0.0016936671454459429,
      "learning_rate": 4.159090909090909e-06,
      "loss": 0.0,
      "step": 17650
    },
    {
      "epoch": 63.57913669064748,
      "grad_norm": 0.0017974688671529293,
      "learning_rate": 4.157828282828283e-06,
      "loss": 0.0,
      "step": 17675
    },
    {
      "epoch": 63.669064748201436,
      "grad_norm": 0.0027852486819028854,
      "learning_rate": 4.156565656565657e-06,
      "loss": 0.0,
      "step": 17700
    },
    {
      "epoch": 63.7589928057554,
      "grad_norm": 0.0017096559749916196,
      "learning_rate": 4.15530303030303e-06,
      "loss": 0.0,
      "step": 17725
    },
    {
      "epoch": 63.84892086330935,
      "grad_norm": 0.0019876237493008375,
      "learning_rate": 4.154040404040404e-06,
      "loss": 0.0,
      "step": 17750
    },
    {
      "epoch": 63.93884892086331,
      "grad_norm": 0.0011115281376987696,
      "learning_rate": 4.152777777777778e-06,
      "loss": 0.0,
      "step": 17775
    },
    {
      "epoch": 64.02877697841727,
      "grad_norm": 0.0017126763705164194,
      "learning_rate": 4.151515151515152e-06,
      "loss": 0.0,
      "step": 17800
    },
    {
      "epoch": 64.11870503597122,
      "grad_norm": 0.0011258955346420407,
      "learning_rate": 4.1502525252525254e-06,
      "loss": 0.0,
      "step": 17825
    },
    {
      "epoch": 64.20863309352518,
      "grad_norm": 0.0015615399461239576,
      "learning_rate": 4.1489898989898994e-06,
      "loss": 0.0,
      "step": 17850
    },
    {
      "epoch": 64.29856115107914,
      "grad_norm": 0.001990539487451315,
      "learning_rate": 4.1477272727272734e-06,
      "loss": 0.0,
      "step": 17875
    },
    {
      "epoch": 64.38848920863309,
      "grad_norm": 0.0013739466667175293,
      "learning_rate": 4.146464646464647e-06,
      "loss": 0.0,
      "step": 17900
    },
    {
      "epoch": 64.47841726618705,
      "grad_norm": 0.0017153042135760188,
      "learning_rate": 4.145202020202021e-06,
      "loss": 0.0,
      "step": 17925
    },
    {
      "epoch": 64.56834532374101,
      "grad_norm": 0.0013855737634003162,
      "learning_rate": 4.143939393939394e-06,
      "loss": 0.0,
      "step": 17950
    },
    {
      "epoch": 64.65827338129496,
      "grad_norm": 0.0023376569151878357,
      "learning_rate": 4.142676767676769e-06,
      "loss": 0.0001,
      "step": 17975
    },
    {
      "epoch": 64.74820143884892,
      "grad_norm": 0.0007114307954907417,
      "learning_rate": 4.141414141414142e-06,
      "loss": 0.0,
      "step": 18000
    },
    {
      "epoch": 64.74820143884892,
      "eval_loss": 0.09263601154088974,
      "eval_runtime": 1339.2527,
      "eval_samples_per_second": 1.659,
      "eval_steps_per_second": 0.104,
      "eval_wer": 5.658001925498037,
      "step": 18000
    },
    {
      "epoch": 64.83812949640287,
      "grad_norm": 0.0010609790915623307,
      "learning_rate": 4.140151515151516e-06,
      "loss": 0.0,
      "step": 18025
    },
    {
      "epoch": 64.92805755395683,
      "grad_norm": 0.0020956743974238634,
      "learning_rate": 4.138888888888889e-06,
      "loss": 0.0,
      "step": 18050
    },
    {
      "epoch": 65.0179856115108,
      "grad_norm": 0.0013533415040001273,
      "learning_rate": 4.137626262626263e-06,
      "loss": 0.0001,
      "step": 18075
    },
    {
      "epoch": 65.10791366906474,
      "grad_norm": 0.0010088173439726233,
      "learning_rate": 4.136363636363637e-06,
      "loss": 0.0001,
      "step": 18100
    },
    {
      "epoch": 65.1978417266187,
      "grad_norm": 0.001570379245094955,
      "learning_rate": 4.13510101010101e-06,
      "loss": 0.0,
      "step": 18125
    },
    {
      "epoch": 65.28776978417267,
      "grad_norm": 0.0016373491380363703,
      "learning_rate": 4.133838383838384e-06,
      "loss": 0.0,
      "step": 18150
    },
    {
      "epoch": 65.37769784172662,
      "grad_norm": 0.0015006172470748425,
      "learning_rate": 4.132575757575758e-06,
      "loss": 0.0,
      "step": 18175
    },
    {
      "epoch": 65.46762589928058,
      "grad_norm": 0.0011033018818125129,
      "learning_rate": 4.131313131313132e-06,
      "loss": 0.0,
      "step": 18200
    },
    {
      "epoch": 65.55755395683454,
      "grad_norm": 0.0013498698826879263,
      "learning_rate": 4.130050505050505e-06,
      "loss": 0.0,
      "step": 18225
    },
    {
      "epoch": 65.64748201438849,
      "grad_norm": 0.0013445069780573249,
      "learning_rate": 4.128787878787879e-06,
      "loss": 0.0,
      "step": 18250
    },
    {
      "epoch": 65.73741007194245,
      "grad_norm": 0.0017605924513190985,
      "learning_rate": 4.127525252525253e-06,
      "loss": 0.0,
      "step": 18275
    },
    {
      "epoch": 65.8273381294964,
      "grad_norm": 0.0018534163245931268,
      "learning_rate": 4.126262626262626e-06,
      "loss": 0.0,
      "step": 18300
    },
    {
      "epoch": 65.91726618705036,
      "grad_norm": 0.000884951208718121,
      "learning_rate": 4.125e-06,
      "loss": 0.0,
      "step": 18325
    },
    {
      "epoch": 66.00719424460432,
      "grad_norm": 0.0011815873440355062,
      "learning_rate": 4.123737373737374e-06,
      "loss": 0.0001,
      "step": 18350
    },
    {
      "epoch": 66.09712230215827,
      "grad_norm": 0.001126173185184598,
      "learning_rate": 4.1224747474747475e-06,
      "loss": 0.0,
      "step": 18375
    },
    {
      "epoch": 66.18705035971223,
      "grad_norm": 0.0011552530340850353,
      "learning_rate": 4.1212121212121215e-06,
      "loss": 0.0,
      "step": 18400
    },
    {
      "epoch": 66.27697841726619,
      "grad_norm": 0.001199888065457344,
      "learning_rate": 4.119949494949495e-06,
      "loss": 0.0,
      "step": 18425
    },
    {
      "epoch": 66.36690647482014,
      "grad_norm": 0.0007247981848195195,
      "learning_rate": 4.1186868686868695e-06,
      "loss": 0.0,
      "step": 18450
    },
    {
      "epoch": 66.4568345323741,
      "grad_norm": 0.001124533242546022,
      "learning_rate": 4.117424242424243e-06,
      "loss": 0.0001,
      "step": 18475
    },
    {
      "epoch": 66.54676258992805,
      "grad_norm": 0.0009603950311429799,
      "learning_rate": 4.116161616161617e-06,
      "loss": 0.0,
      "step": 18500
    },
    {
      "epoch": 66.63669064748201,
      "grad_norm": 0.0016920759808272123,
      "learning_rate": 4.114898989898991e-06,
      "loss": 0.0001,
      "step": 18525
    },
    {
      "epoch": 66.72661870503597,
      "grad_norm": 0.0007674341322854161,
      "learning_rate": 4.113636363636364e-06,
      "loss": 0.0,
      "step": 18550
    },
    {
      "epoch": 66.81654676258992,
      "grad_norm": 0.000895792618393898,
      "learning_rate": 4.112373737373738e-06,
      "loss": 0.0,
      "step": 18575
    },
    {
      "epoch": 66.90647482014388,
      "grad_norm": 0.0009227583650499582,
      "learning_rate": 4.111111111111111e-06,
      "loss": 0.0,
      "step": 18600
    },
    {
      "epoch": 66.99640287769785,
      "grad_norm": 0.0019231617916375399,
      "learning_rate": 4.109848484848486e-06,
      "loss": 0.0,
      "step": 18625
    },
    {
      "epoch": 67.0863309352518,
      "grad_norm": 0.0010071933502331376,
      "learning_rate": 4.108585858585859e-06,
      "loss": 0.0,
      "step": 18650
    },
    {
      "epoch": 67.17625899280576,
      "grad_norm": 0.0009304916602559388,
      "learning_rate": 4.107323232323233e-06,
      "loss": 0.0002,
      "step": 18675
    },
    {
      "epoch": 67.26618705035972,
      "grad_norm": 0.0008229652885347605,
      "learning_rate": 4.106060606060606e-06,
      "loss": 0.0,
      "step": 18700
    },
    {
      "epoch": 67.35611510791367,
      "grad_norm": 0.0006714012124575675,
      "learning_rate": 4.10479797979798e-06,
      "loss": 0.0,
      "step": 18725
    },
    {
      "epoch": 67.44604316546763,
      "grad_norm": 0.0009734642808325589,
      "learning_rate": 4.103535353535354e-06,
      "loss": 0.0,
      "step": 18750
    },
    {
      "epoch": 67.53597122302158,
      "grad_norm": 0.0007786314818076789,
      "learning_rate": 4.102272727272727e-06,
      "loss": 0.0,
      "step": 18775
    },
    {
      "epoch": 67.62589928057554,
      "grad_norm": 0.001005512080155313,
      "learning_rate": 4.101010101010101e-06,
      "loss": 0.0,
      "step": 18800
    },
    {
      "epoch": 67.7158273381295,
      "grad_norm": 0.001331688603386283,
      "learning_rate": 4.099747474747475e-06,
      "loss": 0.0,
      "step": 18825
    },
    {
      "epoch": 67.80575539568345,
      "grad_norm": 0.000987470499239862,
      "learning_rate": 4.098484848484849e-06,
      "loss": 0.0,
      "step": 18850
    },
    {
      "epoch": 67.89568345323741,
      "grad_norm": 0.0008799554198049009,
      "learning_rate": 4.097222222222222e-06,
      "loss": 0.0001,
      "step": 18875
    },
    {
      "epoch": 67.98561151079137,
      "grad_norm": 0.0009637974435463548,
      "learning_rate": 4.095959595959596e-06,
      "loss": 0.0,
      "step": 18900
    },
    {
      "epoch": 68.07553956834532,
      "grad_norm": 0.0006672360468655825,
      "learning_rate": 4.09469696969697e-06,
      "loss": 0.0,
      "step": 18925
    },
    {
      "epoch": 68.16546762589928,
      "grad_norm": 0.0008431566529907286,
      "learning_rate": 4.0934343434343435e-06,
      "loss": 0.0001,
      "step": 18950
    },
    {
      "epoch": 68.25539568345324,
      "grad_norm": 0.0010287058539688587,
      "learning_rate": 4.0921717171717175e-06,
      "loss": 0.0,
      "step": 18975
    },
    {
      "epoch": 68.34532374100719,
      "grad_norm": 0.0007457846077159047,
      "learning_rate": 4.0909090909090915e-06,
      "loss": 0.0,
      "step": 19000
    },
    {
      "epoch": 68.34532374100719,
      "eval_loss": 0.09562169760465622,
      "eval_runtime": 1339.1079,
      "eval_samples_per_second": 1.659,
      "eval_steps_per_second": 0.104,
      "eval_wer": 5.583944308672146,
      "step": 19000
    },
    {
      "epoch": 68.43525179856115,
      "grad_norm": 0.0009193470468744636,
      "learning_rate": 4.0896464646464655e-06,
      "loss": 0.0,
      "step": 19025
    },
    {
      "epoch": 68.5251798561151,
      "grad_norm": 0.0008717461605556309,
      "learning_rate": 4.088383838383839e-06,
      "loss": 0.0,
      "step": 19050
    },
    {
      "epoch": 68.61510791366906,
      "grad_norm": 0.0008119108970277011,
      "learning_rate": 4.087121212121213e-06,
      "loss": 0.0,
      "step": 19075
    },
    {
      "epoch": 68.70503597122303,
      "grad_norm": 0.0010454319417476654,
      "learning_rate": 4.085858585858587e-06,
      "loss": 0.0001,
      "step": 19100
    },
    {
      "epoch": 68.79496402877697,
      "grad_norm": 0.0012115614954382181,
      "learning_rate": 4.08459595959596e-06,
      "loss": 0.0,
      "step": 19125
    },
    {
      "epoch": 68.88489208633094,
      "grad_norm": 0.001058676978573203,
      "learning_rate": 4.083333333333334e-06,
      "loss": 0.0,
      "step": 19150
    },
    {
      "epoch": 68.9748201438849,
      "grad_norm": 0.0009722402319312096,
      "learning_rate": 4.082070707070707e-06,
      "loss": 0.0,
      "step": 19175
    },
    {
      "epoch": 69.06474820143885,
      "grad_norm": 0.0006609881529584527,
      "learning_rate": 4.080808080808081e-06,
      "loss": 0.0,
      "step": 19200
    },
    {
      "epoch": 69.15467625899281,
      "grad_norm": 0.0007030842243693769,
      "learning_rate": 4.079545454545455e-06,
      "loss": 0.0,
      "step": 19225
    },
    {
      "epoch": 69.24460431654676,
      "grad_norm": 0.0006842823349870741,
      "learning_rate": 4.078282828282829e-06,
      "loss": 0.0001,
      "step": 19250
    },
    {
      "epoch": 69.33453237410072,
      "grad_norm": 0.000651550421025604,
      "learning_rate": 4.077020202020202e-06,
      "loss": 0.0,
      "step": 19275
    },
    {
      "epoch": 69.42446043165468,
      "grad_norm": 0.0006407879409380257,
      "learning_rate": 4.075757575757576e-06,
      "loss": 0.0001,
      "step": 19300
    },
    {
      "epoch": 69.51438848920863,
      "grad_norm": 0.0010551882442086935,
      "learning_rate": 4.07449494949495e-06,
      "loss": 0.0,
      "step": 19325
    },
    {
      "epoch": 69.60431654676259,
      "grad_norm": 0.0008015549392439425,
      "learning_rate": 4.073232323232323e-06,
      "loss": 0.0,
      "step": 19350
    },
    {
      "epoch": 69.69424460431655,
      "grad_norm": 0.0008218359434977174,
      "learning_rate": 4.071969696969697e-06,
      "loss": 0.0,
      "step": 19375
    },
    {
      "epoch": 69.7841726618705,
      "grad_norm": 0.0009953822009265423,
      "learning_rate": 4.070707070707071e-06,
      "loss": 0.0,
      "step": 19400
    },
    {
      "epoch": 69.87410071942446,
      "grad_norm": 0.0008482063421979547,
      "learning_rate": 4.069444444444444e-06,
      "loss": 0.0,
      "step": 19425
    },
    {
      "epoch": 69.96402877697842,
      "grad_norm": 0.0008491966291330755,
      "learning_rate": 4.068181818181818e-06,
      "loss": 0.0,
      "step": 19450
    },
    {
      "epoch": 70.05395683453237,
      "grad_norm": 0.000667088374029845,
      "learning_rate": 4.066919191919192e-06,
      "loss": 0.0001,
      "step": 19475
    },
    {
      "epoch": 70.14388489208633,
      "grad_norm": 0.0006748430896550417,
      "learning_rate": 4.065656565656566e-06,
      "loss": 0.0,
      "step": 19500
    },
    {
      "epoch": 70.23381294964028,
      "grad_norm": 0.0006421016296371818,
      "learning_rate": 4.0643939393939395e-06,
      "loss": 0.0,
      "step": 19525
    },
    {
      "epoch": 70.32374100719424,
      "grad_norm": 0.0009323668200522661,
      "learning_rate": 4.0631313131313135e-06,
      "loss": 0.0,
      "step": 19550
    },
    {
      "epoch": 70.4136690647482,
      "grad_norm": 0.0008588407654315233,
      "learning_rate": 4.0618686868686875e-06,
      "loss": 0.0,
      "step": 19575
    },
    {
      "epoch": 70.50359712230215,
      "grad_norm": 0.0006930006784386933,
      "learning_rate": 4.060606060606061e-06,
      "loss": 0.0,
      "step": 19600
    },
    {
      "epoch": 70.59352517985612,
      "grad_norm": 0.000734307337552309,
      "learning_rate": 4.059343434343435e-06,
      "loss": 0.0,
      "step": 19625
    },
    {
      "epoch": 70.68345323741008,
      "grad_norm": 0.0007306214538402855,
      "learning_rate": 4.058080808080808e-06,
      "loss": 0.0001,
      "step": 19650
    },
    {
      "epoch": 70.77338129496403,
      "grad_norm": 0.0005738097243010998,
      "learning_rate": 4.056818181818183e-06,
      "loss": 0.0,
      "step": 19675
    },
    {
      "epoch": 70.86330935251799,
      "grad_norm": 0.00065003422787413,
      "learning_rate": 4.055555555555556e-06,
      "loss": 0.0,
      "step": 19700
    },
    {
      "epoch": 70.95323741007195,
      "grad_norm": 0.0006234170868992805,
      "learning_rate": 4.05429292929293e-06,
      "loss": 0.0,
      "step": 19725
    },
    {
      "epoch": 71.0431654676259,
      "grad_norm": 0.000607940077316016,
      "learning_rate": 4.053030303030303e-06,
      "loss": 0.0,
      "step": 19750
    },
    {
      "epoch": 71.13309352517986,
      "grad_norm": 0.0005851531168445945,
      "learning_rate": 4.051767676767677e-06,
      "loss": 0.0,
      "step": 19775
    },
    {
      "epoch": 71.22302158273381,
      "grad_norm": 0.0009296953212469816,
      "learning_rate": 4.050505050505051e-06,
      "loss": 0.0,
      "step": 19800
    },
    {
      "epoch": 71.31294964028777,
      "grad_norm": 0.0006304428679868579,
      "learning_rate": 4.049242424242424e-06,
      "loss": 0.0001,
      "step": 19825
    },
    {
      "epoch": 71.40287769784173,
      "grad_norm": 0.000664900871925056,
      "learning_rate": 4.047979797979799e-06,
      "loss": 0.0,
      "step": 19850
    },
    {
      "epoch": 71.49280575539568,
      "grad_norm": 0.0003695714403875172,
      "learning_rate": 4.046717171717172e-06,
      "loss": 0.0,
      "step": 19875
    },
    {
      "epoch": 71.58273381294964,
      "grad_norm": 0.000516809755936265,
      "learning_rate": 4.045454545454546e-06,
      "loss": 0.0,
      "step": 19900
    },
    {
      "epoch": 71.6726618705036,
      "grad_norm": 0.0006113911513239145,
      "learning_rate": 4.044191919191919e-06,
      "loss": 0.0,
      "step": 19925
    },
    {
      "epoch": 71.76258992805755,
      "grad_norm": 0.000814276107121259,
      "learning_rate": 4.042929292929293e-06,
      "loss": 0.0,
      "step": 19950
    },
    {
      "epoch": 71.85251798561151,
      "grad_norm": 0.0007162923575378954,
      "learning_rate": 4.041666666666667e-06,
      "loss": 0.0,
      "step": 19975
    },
    {
      "epoch": 71.94244604316546,
      "grad_norm": 0.000519581779371947,
      "learning_rate": 4.04040404040404e-06,
      "loss": 0.0,
      "step": 20000
    },
    {
      "epoch": 71.94244604316546,
      "eval_loss": 0.0976732075214386,
      "eval_runtime": 1338.7066,
      "eval_samples_per_second": 1.66,
      "eval_steps_per_second": 0.104,
      "eval_wer": 5.539509738576612,
      "step": 20000
    },
    {
      "epoch": 72.03237410071942,
      "grad_norm": 0.0013573451433330774,
      "learning_rate": 4.039141414141414e-06,
      "loss": 0.0001,
      "step": 20025
    },
    {
      "epoch": 72.12230215827338,
      "grad_norm": 0.0006321736145764589,
      "learning_rate": 4.037878787878788e-06,
      "loss": 0.0,
      "step": 20050
    },
    {
      "epoch": 72.21223021582733,
      "grad_norm": 0.00046551282866857946,
      "learning_rate": 4.036616161616162e-06,
      "loss": 0.0,
      "step": 20075
    },
    {
      "epoch": 72.3021582733813,
      "grad_norm": 0.00047266227193176746,
      "learning_rate": 4.0353535353535355e-06,
      "loss": 0.0,
      "step": 20100
    },
    {
      "epoch": 72.39208633093526,
      "grad_norm": 0.0004692314541898668,
      "learning_rate": 4.0340909090909095e-06,
      "loss": 0.0,
      "step": 20125
    },
    {
      "epoch": 72.4820143884892,
      "grad_norm": 0.0005892490735277534,
      "learning_rate": 4.0328282828282835e-06,
      "loss": 0.0,
      "step": 20150
    },
    {
      "epoch": 72.57194244604317,
      "grad_norm": 0.0005393667961470783,
      "learning_rate": 4.031565656565657e-06,
      "loss": 0.0001,
      "step": 20175
    },
    {
      "epoch": 72.66187050359713,
      "grad_norm": 0.0007663563592359424,
      "learning_rate": 4.030303030303031e-06,
      "loss": 0.0,
      "step": 20200
    },
    {
      "epoch": 72.75179856115108,
      "grad_norm": 0.0005675546126440167,
      "learning_rate": 4.029040404040405e-06,
      "loss": 0.0,
      "step": 20225
    },
    {
      "epoch": 72.84172661870504,
      "grad_norm": 0.0006041157757863402,
      "learning_rate": 4.027777777777779e-06,
      "loss": 0.0,
      "step": 20250
    },
    {
      "epoch": 72.93165467625899,
      "grad_norm": 0.0006022896850481629,
      "learning_rate": 4.026515151515152e-06,
      "loss": 0.0001,
      "step": 20275
    },
    {
      "epoch": 73.02158273381295,
      "grad_norm": 0.0005813241587020457,
      "learning_rate": 4.025252525252526e-06,
      "loss": 0.0,
      "step": 20300
    },
    {
      "epoch": 73.11151079136691,
      "grad_norm": 0.0006358566461130977,
      "learning_rate": 4.0239898989899e-06,
      "loss": 0.0,
      "step": 20325
    },
    {
      "epoch": 73.20143884892086,
      "grad_norm": 0.0006074347766116261,
      "learning_rate": 4.022727272727273e-06,
      "loss": 0.0,
      "step": 20350
    },
    {
      "epoch": 73.29136690647482,
      "grad_norm": 0.0005062387208454311,
      "learning_rate": 4.021464646464647e-06,
      "loss": 0.0003,
      "step": 20375
    },
    {
      "epoch": 73.38129496402878,
      "grad_norm": 0.0010172536130994558,
      "learning_rate": 4.02020202020202e-06,
      "loss": 0.0,
      "step": 20400
    },
    {
      "epoch": 73.47122302158273,
      "grad_norm": 0.0006235135952010751,
      "learning_rate": 4.018939393939394e-06,
      "loss": 0.0,
      "step": 20425
    },
    {
      "epoch": 73.56115107913669,
      "grad_norm": 0.0009783974383026361,
      "learning_rate": 4.017676767676768e-06,
      "loss": 0.0,
      "step": 20450
    },
    {
      "epoch": 73.65107913669064,
      "grad_norm": 0.0005355635657906532,
      "learning_rate": 4.016414141414141e-06,
      "loss": 0.0,
      "step": 20475
    },
    {
      "epoch": 73.7410071942446,
      "grad_norm": 0.0004634314973372966,
      "learning_rate": 4.015151515151515e-06,
      "loss": 0.0,
      "step": 20500
    },
    {
      "epoch": 73.83093525179856,
      "grad_norm": 0.0005511495401151478,
      "learning_rate": 4.013888888888889e-06,
      "loss": 0.0,
      "step": 20525
    },
    {
      "epoch": 73.92086330935251,
      "grad_norm": 0.0010061068460345268,
      "learning_rate": 4.012626262626263e-06,
      "loss": 0.0,
      "step": 20550
    },
    {
      "epoch": 74.01079136690647,
      "grad_norm": 0.3256176710128784,
      "learning_rate": 4.011363636363636e-06,
      "loss": 0.0007,
      "step": 20575
    },
    {
      "epoch": 74.10071942446044,
      "grad_norm": 0.17023605108261108,
      "learning_rate": 4.01010101010101e-06,
      "loss": 0.0008,
      "step": 20600
    },
    {
      "epoch": 74.19064748201438,
      "grad_norm": 0.8051077723503113,
      "learning_rate": 4.008838383838384e-06,
      "loss": 0.0078,
      "step": 20625
    },
    {
      "epoch": 74.28057553956835,
      "grad_norm": 0.4720918536186218,
      "learning_rate": 4.0075757575757575e-06,
      "loss": 0.0062,
      "step": 20650
    },
    {
      "epoch": 74.37050359712231,
      "grad_norm": 0.4814521074295044,
      "learning_rate": 4.0063131313131315e-06,
      "loss": 0.0061,
      "step": 20675
    },
    {
      "epoch": 74.46043165467626,
      "grad_norm": 0.7329695820808411,
      "learning_rate": 4.0050505050505055e-06,
      "loss": 0.0069,
      "step": 20700
    },
    {
      "epoch": 74.55035971223022,
      "grad_norm": 0.713927686214447,
      "learning_rate": 4.0037878787878795e-06,
      "loss": 0.0061,
      "step": 20725
    },
    {
      "epoch": 74.64028776978417,
      "grad_norm": 0.6485239863395691,
      "learning_rate": 4.002525252525253e-06,
      "loss": 0.0064,
      "step": 20750
    },
    {
      "epoch": 74.73021582733813,
      "grad_norm": 0.8775496482849121,
      "learning_rate": 4.001262626262627e-06,
      "loss": 0.0048,
      "step": 20775
    },
    {
      "epoch": 74.82014388489209,
      "grad_norm": 0.2677914798259735,
      "learning_rate": 4.000000000000001e-06,
      "loss": 0.004,
      "step": 20800
    },
    {
      "epoch": 74.91007194244604,
      "grad_norm": 0.38305044174194336,
      "learning_rate": 3.998737373737374e-06,
      "loss": 0.0028,
      "step": 20825
    },
    {
      "epoch": 75.0,
      "grad_norm": 0.05106651037931442,
      "learning_rate": 3.997474747474748e-06,
      "loss": 0.0021,
      "step": 20850
    },
    {
      "epoch": 75.08992805755396,
      "grad_norm": 0.01168102491647005,
      "learning_rate": 3.996212121212121e-06,
      "loss": 0.0012,
      "step": 20875
    },
    {
      "epoch": 75.17985611510791,
      "grad_norm": 0.22549034655094147,
      "learning_rate": 3.994949494949496e-06,
      "loss": 0.0015,
      "step": 20900
    },
    {
      "epoch": 75.26978417266187,
      "grad_norm": 0.022075073793530464,
      "learning_rate": 3.993686868686869e-06,
      "loss": 0.0026,
      "step": 20925
    },
    {
      "epoch": 75.35971223021583,
      "grad_norm": 0.0188248660415411,
      "learning_rate": 3.992424242424243e-06,
      "loss": 0.0017,
      "step": 20950
    },
    {
      "epoch": 75.44964028776978,
      "grad_norm": 0.47026434540748596,
      "learning_rate": 3.991161616161616e-06,
      "loss": 0.0026,
      "step": 20975
    },
    {
      "epoch": 75.53956834532374,
      "grad_norm": 0.2045595496892929,
      "learning_rate": 3.98989898989899e-06,
      "loss": 0.0019,
      "step": 21000
    },
    {
      "epoch": 75.53956834532374,
      "eval_loss": 0.08847362548112869,
      "eval_runtime": 1337.9238,
      "eval_samples_per_second": 1.661,
      "eval_steps_per_second": 0.104,
      "eval_wer": 6.294897430200697,
      "step": 21000
    },
    {
      "epoch": 75.62949640287769,
      "grad_norm": 0.0665188655257225,
      "learning_rate": 3.988636363636364e-06,
      "loss": 0.0014,
      "step": 21025
    },
    {
      "epoch": 75.71942446043165,
      "grad_norm": 0.33609738945961,
      "learning_rate": 3.987373737373737e-06,
      "loss": 0.0011,
      "step": 21050
    },
    {
      "epoch": 75.80935251798562,
      "grad_norm": 0.4631134867668152,
      "learning_rate": 3.986111111111112e-06,
      "loss": 0.0023,
      "step": 21075
    },
    {
      "epoch": 75.89928057553956,
      "grad_norm": 0.26408031582832336,
      "learning_rate": 3.984848484848485e-06,
      "loss": 0.0019,
      "step": 21100
    },
    {
      "epoch": 75.98920863309353,
      "grad_norm": 0.3067505657672882,
      "learning_rate": 3.983585858585859e-06,
      "loss": 0.0021,
      "step": 21125
    },
    {
      "epoch": 76.07913669064749,
      "grad_norm": 0.0688316822052002,
      "learning_rate": 3.982323232323232e-06,
      "loss": 0.0024,
      "step": 21150
    },
    {
      "epoch": 76.16906474820144,
      "grad_norm": 1.5255663394927979,
      "learning_rate": 3.981060606060606e-06,
      "loss": 0.0012,
      "step": 21175
    },
    {
      "epoch": 76.2589928057554,
      "grad_norm": 0.368730753660202,
      "learning_rate": 3.97979797979798e-06,
      "loss": 0.001,
      "step": 21200
    },
    {
      "epoch": 76.34892086330935,
      "grad_norm": 0.019969308748841286,
      "learning_rate": 3.9785353535353535e-06,
      "loss": 0.0006,
      "step": 21225
    },
    {
      "epoch": 76.43884892086331,
      "grad_norm": 0.070771723985672,
      "learning_rate": 3.9772727272727275e-06,
      "loss": 0.0004,
      "step": 21250
    },
    {
      "epoch": 76.52877697841727,
      "grad_norm": 0.023271985352039337,
      "learning_rate": 3.9760101010101015e-06,
      "loss": 0.0007,
      "step": 21275
    },
    {
      "epoch": 76.61870503597122,
      "grad_norm": 0.027517560869455338,
      "learning_rate": 3.9747474747474755e-06,
      "loss": 0.0004,
      "step": 21300
    },
    {
      "epoch": 76.70863309352518,
      "grad_norm": 0.009323998354375362,
      "learning_rate": 3.973484848484849e-06,
      "loss": 0.0007,
      "step": 21325
    },
    {
      "epoch": 76.79856115107914,
      "grad_norm": 0.007815494202077389,
      "learning_rate": 3.972222222222223e-06,
      "loss": 0.0007,
      "step": 21350
    },
    {
      "epoch": 76.88848920863309,
      "grad_norm": 0.06828250735998154,
      "learning_rate": 3.970959595959597e-06,
      "loss": 0.0004,
      "step": 21375
    },
    {
      "epoch": 76.97841726618705,
      "grad_norm": 0.4169680178165436,
      "learning_rate": 3.96969696969697e-06,
      "loss": 0.0007,
      "step": 21400
    },
    {
      "epoch": 77.06834532374101,
      "grad_norm": 0.010289140976965427,
      "learning_rate": 3.968434343434344e-06,
      "loss": 0.0003,
      "step": 21425
    },
    {
      "epoch": 77.15827338129496,
      "grad_norm": 0.02134793810546398,
      "learning_rate": 3.967171717171717e-06,
      "loss": 0.0003,
      "step": 21450
    },
    {
      "epoch": 77.24820143884892,
      "grad_norm": 0.005463853012770414,
      "learning_rate": 3.965909090909091e-06,
      "loss": 0.0001,
      "step": 21475
    },
    {
      "epoch": 77.33812949640287,
      "grad_norm": 0.0035135000944137573,
      "learning_rate": 3.964646464646465e-06,
      "loss": 0.0001,
      "step": 21500
    },
    {
      "epoch": 77.42805755395683,
      "grad_norm": 0.01657390221953392,
      "learning_rate": 3.963383838383839e-06,
      "loss": 0.0001,
      "step": 21525
    },
    {
      "epoch": 77.5179856115108,
      "grad_norm": 0.1767745018005371,
      "learning_rate": 3.962121212121213e-06,
      "loss": 0.0007,
      "step": 21550
    },
    {
      "epoch": 77.60791366906474,
      "grad_norm": 0.016838785260915756,
      "learning_rate": 3.960858585858586e-06,
      "loss": 0.0001,
      "step": 21575
    },
    {
      "epoch": 77.6978417266187,
      "grad_norm": 0.0039493367075920105,
      "learning_rate": 3.95959595959596e-06,
      "loss": 0.0001,
      "step": 21600
    },
    {
      "epoch": 77.78776978417267,
      "grad_norm": 0.0031421987805515528,
      "learning_rate": 3.958333333333333e-06,
      "loss": 0.0003,
      "step": 21625
    },
    {
      "epoch": 77.87769784172662,
      "grad_norm": 0.0026466776616871357,
      "learning_rate": 3.957070707070707e-06,
      "loss": 0.0003,
      "step": 21650
    },
    {
      "epoch": 77.96762589928058,
      "grad_norm": 0.009947208687663078,
      "learning_rate": 3.955808080808081e-06,
      "loss": 0.0002,
      "step": 21675
    },
    {
      "epoch": 78.05755395683454,
      "grad_norm": 0.1049116924405098,
      "learning_rate": 3.954545454545454e-06,
      "loss": 0.0002,
      "step": 21700
    },
    {
      "epoch": 78.14748201438849,
      "grad_norm": 0.0023068960290402174,
      "learning_rate": 3.953282828282828e-06,
      "loss": 0.0001,
      "step": 21725
    },
    {
      "epoch": 78.23741007194245,
      "grad_norm": 0.003103764960542321,
      "learning_rate": 3.952020202020202e-06,
      "loss": 0.0001,
      "step": 21750
    },
    {
      "epoch": 78.3273381294964,
      "grad_norm": 0.002706879284232855,
      "learning_rate": 3.950757575757576e-06,
      "loss": 0.0001,
      "step": 21775
    },
    {
      "epoch": 78.41726618705036,
      "grad_norm": 0.004320697858929634,
      "learning_rate": 3.9494949494949496e-06,
      "loss": 0.0001,
      "step": 21800
    },
    {
      "epoch": 78.50719424460432,
      "grad_norm": 0.005596183240413666,
      "learning_rate": 3.9482323232323236e-06,
      "loss": 0.0002,
      "step": 21825
    },
    {
      "epoch": 78.59712230215827,
      "grad_norm": 0.0037838639691472054,
      "learning_rate": 3.9469696969696976e-06,
      "loss": 0.0003,
      "step": 21850
    },
    {
      "epoch": 78.68705035971223,
      "grad_norm": 0.00796448066830635,
      "learning_rate": 3.945707070707071e-06,
      "loss": 0.0001,
      "step": 21875
    },
    {
      "epoch": 78.77697841726619,
      "grad_norm": 0.003022188087925315,
      "learning_rate": 3.944444444444445e-06,
      "loss": 0.0001,
      "step": 21900
    },
    {
      "epoch": 78.86690647482014,
      "grad_norm": 0.0022381923627108335,
      "learning_rate": 3.943181818181819e-06,
      "loss": 0.0002,
      "step": 21925
    },
    {
      "epoch": 78.9568345323741,
      "grad_norm": 0.0027954999823123217,
      "learning_rate": 3.941919191919193e-06,
      "loss": 0.0001,
      "step": 21950
    },
    {
      "epoch": 79.04676258992805,
      "grad_norm": 0.0016978129278868437,
      "learning_rate": 3.940656565656566e-06,
      "loss": 0.0001,
      "step": 21975
    },
    {
      "epoch": 79.13669064748201,
      "grad_norm": 0.0017409235006198287,
      "learning_rate": 3.93939393939394e-06,
      "loss": 0.0003,
      "step": 22000
    },
    {
      "epoch": 79.13669064748201,
      "eval_loss": 0.0888415277004242,
      "eval_runtime": 1337.7919,
      "eval_samples_per_second": 1.661,
      "eval_steps_per_second": 0.104,
      "eval_wer": 5.598755832037325,
      "step": 22000
    }
  ],
  "logging_steps": 25,
  "max_steps": 100000,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 360,
  "save_steps": 1000,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 4.777235958847242e+21,
  "train_batch_size": 64,
  "trial_name": null,
  "trial_params": null
}