anamelchor commited on Mar 5

Commit

cafd6ac

•

1 Parent(s): 6b02635

Training in progress, epoch 1

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

model.safetensors +1 -1
run-0/checkpoint-28/config.json +27 -0
run-0/checkpoint-28/model.safetensors +3 -0
run-0/checkpoint-28/optimizer.pt +3 -0
run-0/checkpoint-28/rng_state.pth +3 -0
run-0/checkpoint-28/scheduler.pt +3 -0
run-0/checkpoint-28/special_tokens_map.json +7 -0
run-0/checkpoint-28/tokenizer.json +0 -0
run-0/checkpoint-28/tokenizer_config.json +55 -0
run-0/checkpoint-28/trainer_state.json +44 -0
run-0/checkpoint-28/training_args.bin +3 -0
run-0/checkpoint-28/vocab.txt +0 -0
run-0/checkpoint-42/config.json +27 -0
run-0/checkpoint-42/model.safetensors +3 -0
run-0/checkpoint-42/optimizer.pt +3 -0
run-0/checkpoint-42/rng_state.pth +3 -0
run-0/checkpoint-42/scheduler.pt +3 -0
run-0/checkpoint-42/special_tokens_map.json +7 -0
run-0/checkpoint-42/tokenizer.json +0 -0
run-0/checkpoint-42/tokenizer_config.json +55 -0
run-0/checkpoint-42/trainer_state.json +53 -0
run-0/checkpoint-42/training_args.bin +3 -0
run-0/checkpoint-42/vocab.txt +0 -0
run-0/checkpoint-56/config.json +27 -0
run-0/checkpoint-56/model.safetensors +3 -0
run-0/checkpoint-56/optimizer.pt +3 -0
run-0/checkpoint-56/rng_state.pth +3 -0
run-0/checkpoint-56/scheduler.pt +3 -0
run-0/checkpoint-56/special_tokens_map.json +7 -0
run-0/checkpoint-56/tokenizer.json +0 -0
run-0/checkpoint-56/tokenizer_config.json +55 -0
run-0/checkpoint-56/trainer_state.json +62 -0
run-0/checkpoint-56/training_args.bin +3 -0
run-0/checkpoint-56/vocab.txt +0 -0
run-0/checkpoint-70/config.json +27 -0
run-0/checkpoint-70/model.safetensors +3 -0
run-0/checkpoint-70/optimizer.pt +3 -0
run-0/checkpoint-70/rng_state.pth +3 -0
run-0/checkpoint-70/scheduler.pt +3 -0
run-0/checkpoint-70/special_tokens_map.json +7 -0
run-0/checkpoint-70/tokenizer.json +0 -0
run-0/checkpoint-70/tokenizer_config.json +55 -0
run-0/checkpoint-70/trainer_state.json +71 -0
run-0/checkpoint-70/training_args.bin +3 -0
run-0/checkpoint-70/vocab.txt +0 -0
run-1/checkpoint-27/config.json +27 -0
run-1/checkpoint-27/model.safetensors +3 -0
run-1/checkpoint-27/optimizer.pt +3 -0
run-1/checkpoint-27/rng_state.pth +3 -0
run-1/checkpoint-27/scheduler.pt +3 -0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed405bf1f6bf1d037d279c735c0ef1d8637e733488a907c55c9a9de6eed44ecb
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:5fcc181451301798b54be3d9e7a78f85d6907820dc4c74a9fd4726c1f118305a
 size 437958648

run-0/checkpoint-28/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-28/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6377819e15ed83dd817b895768691af0622c98ef48096cd08d358b9dcf762b92
+size 437958648

run-0/checkpoint-28/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:534d557d8ca1a78912bbc9816667253c71fb69168f99d2396f1de5e2a9f2bf07
+size 876038394

run-0/checkpoint-28/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a646e0a4e1ae5513e0c62f07f6c3ee267a92a2277a8293ddf235f8e2f74e0331
+size 14308

run-0/checkpoint-28/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e127a735df00ad010829fe70859cbcd291b7ae24214299de1a845742296b7744
+size 1064

run-0/checkpoint-28/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-28/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-28/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-28/trainer_state.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "best_metric": 0.6941514860977949,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-0/checkpoint-28",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 28,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6912751677852349,
+      "eval_loss": 0.6039506196975708,
+      "eval_runtime": 1.3411,
+      "eval_samples_per_second": 777.73,
+      "eval_steps_per_second": 49.214,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6941514860977949,
+      "eval_loss": 0.5453055500984192,
+      "eval_runtime": 1.4385,
+      "eval_samples_per_second": 725.079,
+      "eval_steps_per_second": 45.882,
+      "step": 28
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.85616163033555e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 33
+  }
+}

run-0/checkpoint-28/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0442d15116d6d6d98fb40bd2b1c446b3e1c87aa21e7274a8954d5b6a1ff24d7a
+size 4920

run-0/checkpoint-28/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-42/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4624a9412d64c04ab7a8e68b3a9c0dc097fb8b407373164293e6ce317bfa2315
+size 437958648

run-0/checkpoint-42/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b9919119147f91ab616ac345defc16c5971dcfe5206e6559b99d461db6cffb8
+size 876038394

run-0/checkpoint-42/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:abb841ebedde002effa8d5525ef18f685043dcd9ea764a557641f39f766f4358
+size 14308

run-0/checkpoint-42/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c8f947e99cd0dd30c894cc491636f3d99c045dd98cfdcc61423e330976361fac
+size 1064

run-0/checkpoint-42/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-42/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-42/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-42/trainer_state.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "best_metric": 0.7555129434324065,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-0/checkpoint-42",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 42,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6912751677852349,
+      "eval_loss": 0.6039506196975708,
+      "eval_runtime": 1.3411,
+      "eval_samples_per_second": 777.73,
+      "eval_steps_per_second": 49.214,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6941514860977949,
+      "eval_loss": 0.5453055500984192,
+      "eval_runtime": 1.4385,
+      "eval_samples_per_second": 725.079,
+      "eval_steps_per_second": 45.882,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7555129434324065,
+      "eval_loss": 0.573279619216919,
+      "eval_runtime": 2.3373,
+      "eval_samples_per_second": 446.245,
+      "eval_steps_per_second": 28.238,
+      "step": 42
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.85616163033555e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 33
+  }
+}

run-0/checkpoint-42/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0442d15116d6d6d98fb40bd2b1c446b3e1c87aa21e7274a8954d5b6a1ff24d7a
+size 4920

run-0/checkpoint-42/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-56/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-56/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bc3b4cdfbd4bbfd6a0083360516ef84d2c4244615a936e47c98e0f2a0270c1cf
+size 437958648

run-0/checkpoint-56/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:830ee9f78e7f02f4555ce8abe2d12a02d64d3828585b53c75208f9ab8a7acaf1
+size 876038394

run-0/checkpoint-56/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5c465bbe5e77275d1bee0bf2905b792f24b272174f5c364bd2503ed3dfc3012
+size 14308

run-0/checkpoint-56/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58d9c450e62fa6f212f1ca2c5f127177d481cc4ceb0ae583424f9dded33b591f
+size 1064

run-0/checkpoint-56/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-56/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-56/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-56/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_metric": 0.775647171620326,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-0/checkpoint-56",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 56,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6912751677852349,
+      "eval_loss": 0.6039506196975708,
+      "eval_runtime": 1.3411,
+      "eval_samples_per_second": 777.73,
+      "eval_steps_per_second": 49.214,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6941514860977949,
+      "eval_loss": 0.5453055500984192,
+      "eval_runtime": 1.4385,
+      "eval_samples_per_second": 725.079,
+      "eval_steps_per_second": 45.882,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7555129434324065,
+      "eval_loss": 0.573279619216919,
+      "eval_runtime": 2.3373,
+      "eval_samples_per_second": 446.245,
+      "eval_steps_per_second": 28.238,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.775647171620326,
+      "eval_loss": 0.5979775190353394,
+      "eval_runtime": 1.7938,
+      "eval_samples_per_second": 581.441,
+      "eval_steps_per_second": 36.793,
+      "step": 56
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.85616163033555e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 33
+  }
+}

run-0/checkpoint-56/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0442d15116d6d6d98fb40bd2b1c446b3e1c87aa21e7274a8954d5b6a1ff24d7a
+size 4920

run-0/checkpoint-56/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-70/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-70/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:04ed467294f494ae5cb904d0327aff0fe18f47d08ec093d6096f2c69f5926809
+size 437958648

run-0/checkpoint-70/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c1acc3e1ea7fce04cb0db6e6dbc41249aa594f33390f80eabd6d911ec9634d9
+size 876038394

run-0/checkpoint-70/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c630cee81f18143146235db6503c944621a4dfa0830d74e7e22cdde5d6d410ed
+size 14308

run-0/checkpoint-70/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ac2161aae87daaf1f2b020f78fcdc46bd9c6b516ccdb967bb6c3dfca1012a45
+size 1064

run-0/checkpoint-70/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-70/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-0/checkpoint-70/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-0/checkpoint-70/trainer_state.json ADDED Viewed

	@@ -0,0 +1,71 @@

+{
+  "best_metric": 0.775647171620326,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-0/checkpoint-56",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 70,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6912751677852349,
+      "eval_loss": 0.6039506196975708,
+      "eval_runtime": 1.3411,
+      "eval_samples_per_second": 777.73,
+      "eval_steps_per_second": 49.214,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6941514860977949,
+      "eval_loss": 0.5453055500984192,
+      "eval_runtime": 1.4385,
+      "eval_samples_per_second": 725.079,
+      "eval_steps_per_second": 45.882,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7555129434324065,
+      "eval_loss": 0.573279619216919,
+      "eval_runtime": 2.3373,
+      "eval_samples_per_second": 446.245,
+      "eval_steps_per_second": 28.238,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.775647171620326,
+      "eval_loss": 0.5979775190353394,
+      "eval_runtime": 1.7938,
+      "eval_samples_per_second": 581.441,
+      "eval_steps_per_second": 36.793,
+      "step": 56
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.7708533077660594,
+      "eval_loss": 0.6849012970924377,
+      "eval_runtime": 1.6211,
+      "eval_samples_per_second": 643.392,
+      "eval_steps_per_second": 40.713,
+      "step": 70
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.85616163033555e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 33
+  }
+}

run-0/checkpoint-70/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0442d15116d6d6d98fb40bd2b1c446b3e1c87aa21e7274a8954d5b6a1ff24d7a
+size 4920

run-0/checkpoint-70/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-1/checkpoint-27/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-1/checkpoint-27/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5fcc181451301798b54be3d9e7a78f85d6907820dc4c74a9fd4726c1f118305a
+size 437958648

run-1/checkpoint-27/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a24d9b9ba50bb0dbf0c72ab8a5a38aeb6415c7853fd0da8e69cc16607c8685b3
+size 876038394

run-1/checkpoint-27/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:30bc2234ab8c220ef2038bc7f82f6f788affb7b90d7b6db371d4187babceb94f
+size 14244

run-1/checkpoint-27/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:200f1219191b0ecfe5ae4e1a6659c774fa1382e7ae7895a6a10774de69c2abf5
+size 1064