ZeroUniqueness
/

qlora-llama-2-13b-code

Model card Files Files and versions Community

qlora-llama-2-13b-code / checkpoint-400 /trainer_state.json

ZeroUniqueness's picture

Training in progress, step 400

c42280a over 1 year ago

1.33 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 0.15509887553315238,
	"global_step": 400,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.02,
	"learning_rate": 0.0001999867761371633,
	"loss": 1.0435,
	"step": 50
	},
	{
	"epoch": 0.04,
	"learning_rate": 0.00019993306018843102,
	"loss": 0.8918,
	"step": 100
	},
	{
	"epoch": 0.06,
	"learning_rate": 0.00019983804784290833,
	"loss": 0.8874,
	"step": 150
	},
	{
	"epoch": 0.08,
	"learning_rate": 0.00019970177836355307,
	"loss": 0.8839,
	"step": 200
	},
	{
	"epoch": 0.1,
	"learning_rate": 0.00019952430806244534,
	"loss": 0.8777,
	"step": 250
	},
	{
	"epoch": 0.12,
	"learning_rate": 0.00019930571027751713,
	"loss": 0.8753,
	"step": 300
	},
	{
	"epoch": 0.14,
	"learning_rate": 0.00019904607534224612,
	"loss": 0.8749,
	"step": 350
	},
	{
	"epoch": 0.16,
	"learning_rate": 0.00019874551054832625,
	"loss": 0.8711,
	"step": 400
	}
	],
	"max_steps": 7737,
	"num_train_epochs": 3,
	"total_flos": 1.7210263980359025e+18,
	"trial_name": null,
	"trial_params": null
	}