Training in progress, epoch 4

Browse files

Files changed (6) hide show

model.safetensors +1 -1
wandb/debug-internal.log +0 -0
wandb/run-20240924_172630-x9iddikd/files/output.log +2 -0
wandb/run-20240924_172630-x9iddikd/files/wandb-summary.json +1 -1
wandb/run-20240924_172630-x9iddikd/logs/debug-internal.log +0 -0
wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb +0 -0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52cc5a2e9ccba371808b16ca6dc3bdc707463a7ae53872d4af08cec1fda55cf6
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:74941ca16584c4e830337f4d61bba8e0255f9a3ba78617ab571e17ae88283191
 size 267832560

wandb/debug-internal.log CHANGED Viewed

The diff for this file is too large to render. See raw diff

wandb/run-20240924_172630-x9iddikd/files/output.log CHANGED Viewed

@@ -33,3 +33,5 @@ Some weights of DistilBertForSequenceClassification were not initialized from th
 You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
 {'eval_loss': 0.17208045721054077, 'eval_accuracy': 0.939, 'eval_runtime': 40.1609, 'eval_samples_per_second': 24.9, 'eval_steps_per_second': 0.797, 'epoch': 1.0}
 {'eval_loss': 0.24476991593837738, 'eval_accuracy': 0.926, 'eval_runtime': 38.171, 'eval_samples_per_second': 26.198, 'eval_steps_per_second': 0.838, 'epoch': 2.0}

 You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
 {'eval_loss': 0.17208045721054077, 'eval_accuracy': 0.939, 'eval_runtime': 40.1609, 'eval_samples_per_second': 24.9, 'eval_steps_per_second': 0.797, 'epoch': 1.0}
 {'eval_loss': 0.24476991593837738, 'eval_accuracy': 0.926, 'eval_runtime': 38.171, 'eval_samples_per_second': 26.198, 'eval_steps_per_second': 0.838, 'epoch': 2.0}
+{'eval_loss': 0.6838799715042114, 'eval_accuracy': 0.656, 'eval_runtime': 214.6826, 'eval_samples_per_second': 4.658, 'eval_steps_per_second': 0.149, 'epoch': 3.0}
+{'loss': 0.2956, 'grad_norm': 2.695140838623047, 'learning_rate': 9.200000000000002e-06, 'epoch': 4.0}

wandb/run-20240924_172630-x9iddikd/files/wandb-summary.json CHANGED Viewed

@@ -1 +1 @@

- {"eval/loss": 0.~~6838799715042114~~, "eval/accuracy": 0.~~656~~, "eval/runtime": ~~214~~.~~6826~~, "eval/samples_per_second": 4.~~658~~, "eval/steps_per_second": 0.~~149~~, "train/epoch": 3.0, "train/global_step": ~~375~~, "_timestamp": ~~1727224105~~.~~7936158~~, "_runtime": ~~14514~~.~~920706748962~~, "_step": 10, "train/loss": 0.~~0672~~, "train/grad_norm": 1.~~1029362678527832~~, "train/learning_rate": 4.~~000000000000001e~~-06, "train_runtime": 8026.8642, "train_samples_per_second": 2.492, "train_steps_per_second": 0.156, "total_flos": 2396475988298112.0, "train_loss": 0.11480112991333008}

+ {"eval/loss": 0.31772053241729736, "eval/accuracy": 0.87, "eval/runtime": 37.1806, "eval/samples_per_second": 26.896, "eval/steps_per_second": 0.861, "train/epoch": 4.0, "train/global_step": 500, "_timestamp": 1727227212.9603, "_runtime": 17622.08739089966, "_step": 12, "train/loss": 0.2956, "train/grad_norm": 2.695140838623047, "train/learning_rate": 9.200000000000002e-06, "train_runtime": 8026.8642, "train_samples_per_second": 2.492, "train_steps_per_second": 0.156, "total_flos": 2396475988298112.0, "train_loss": 0.11480112991333008}

wandb/run-20240924_172630-x9iddikd/logs/debug-internal.log CHANGED Viewed

The diff for this file is too large to render. See raw diff

wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb CHANGED Viewed

Binary files a/wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb and b/wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb differ