File size: 1,964 Bytes
68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 1d5514d 3c2e5b7 1d5514d c537bc2 3c2e5b7 c537bc2 3c2e5b7 c537bc2 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 3c2e5b7 68c0706 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 |
{
"best_metric": null,
"best_model_checkpoint": null,
"epoch": 0.6666666666666666,
"eval_steps": 2,
"global_step": 4,
"is_hyper_param_search": false,
"is_local_process_zero": true,
"is_world_process_zero": true,
"log_history": [
{
"epoch": 0.16666666666666666,
"grad_norm": NaN,
"learning_rate": 0.0,
"loss": 1.3997,
"step": 1
},
{
"epoch": 0.16666666666666666,
"eval_loss": 1.4973297119140625,
"eval_runtime": 0.2886,
"eval_samples_per_second": 10.395,
"eval_steps_per_second": 6.93,
"step": 1
},
{
"epoch": 0.3333333333333333,
"grad_norm": 5.478867530822754,
"learning_rate": 2e-05,
"loss": 1.4535,
"step": 2
},
{
"epoch": 0.3333333333333333,
"eval_loss": 1.4973297119140625,
"eval_runtime": 0.284,
"eval_samples_per_second": 10.565,
"eval_steps_per_second": 7.043,
"step": 2
},
{
"epoch": 0.5,
"grad_norm": 5.20695686340332,
"learning_rate": 4e-05,
"loss": 1.5303,
"step": 3
},
{
"epoch": 0.6666666666666666,
"grad_norm": 4.481665134429932,
"learning_rate": 6e-05,
"loss": 1.394,
"step": 4
},
{
"epoch": 0.6666666666666666,
"eval_loss": 1.2689329385757446,
"eval_runtime": 0.3021,
"eval_samples_per_second": 9.93,
"eval_steps_per_second": 6.62,
"step": 4
}
],
"logging_steps": 1,
"max_steps": 6,
"num_input_tokens_seen": 0,
"num_train_epochs": 1,
"save_steps": 2,
"stateful_callbacks": {
"TrainerControl": {
"args": {
"should_epoch_stop": false,
"should_evaluate": false,
"should_log": false,
"should_save": true,
"should_training_stop": false
},
"attributes": {}
}
},
"total_flos": 1479651398516736.0,
"train_batch_size": 1,
"trial_name": null,
"trial_params": null
}
|