{"train/loss": 4.2839, "train/grad_norm": 35.7153434753418, "train/learning_rate": 1.2e-05, "train/epoch": 0.02, "train/global_step": 240, "_timestamp": 1712907948.6374013, "_runtime": 304.1296832561493, "_step": 11}