{"train/loss": 3.8248, "train/grad_norm": 23.113840103149414, "train/learning_rate": 2.8e-05, "train/epoch": 0.04, "train/global_step": 560, "_timestamp": 1712908354.1302218, "_runtime": 709.6225037574768, "_step": 27}