ZeroUniqueness
/

qlora-llama-2-13b-code

Model card Files Files and versions Community

qlora-llama-2-13b-code / checkpoint-200 /trainer_state.json

ZeroUniqueness's picture

Training in progress, step 200

dca7161 over 1 year ago

849 Bytes

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 0.07754943776657619,
	"global_step": 200,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.02,
	"learning_rate": 0.0001999867761371633,
	"loss": 1.0435,
	"step": 50
	},
	{
	"epoch": 0.04,
	"learning_rate": 0.00019993306018843102,
	"loss": 0.8918,
	"step": 100
	},
	{
	"epoch": 0.06,
	"learning_rate": 0.00019983804784290833,
	"loss": 0.8874,
	"step": 150
	},
	{
	"epoch": 0.08,
	"learning_rate": 0.00019970177836355307,
	"loss": 0.8839,
	"step": 200
	}
	],
	"max_steps": 7737,
	"num_train_epochs": 3,
	"total_flos": 8.600712554731274e+17,
	"trial_name": null,
	"trial_params": null
	}