anamelchor commited on Mar 5

Commit

0d7185f

•

1 Parent(s): c30c5db

Training in progress, epoch 1

Browse files

Files changed (47) hide show

model.safetensors +1 -1
run-2/checkpoint-214/config.json +27 -0
run-2/checkpoint-214/model.safetensors +3 -0
run-2/checkpoint-214/optimizer.pt +3 -0
run-2/checkpoint-214/rng_state.pth +3 -0
run-2/checkpoint-214/scheduler.pt +3 -0
run-2/checkpoint-214/special_tokens_map.json +7 -0
run-2/checkpoint-214/tokenizer.json +0 -0
run-2/checkpoint-214/tokenizer_config.json +55 -0
run-2/checkpoint-214/trainer_state.json +44 -0
run-2/checkpoint-214/training_args.bin +3 -0
run-2/checkpoint-214/vocab.txt +0 -0
run-2/checkpoint-321/config.json +27 -0
run-2/checkpoint-321/model.safetensors +3 -0
run-2/checkpoint-321/optimizer.pt +3 -0
run-2/checkpoint-321/rng_state.pth +3 -0
run-2/checkpoint-321/scheduler.pt +3 -0
run-2/checkpoint-321/special_tokens_map.json +7 -0
run-2/checkpoint-321/tokenizer.json +0 -0
run-2/checkpoint-321/tokenizer_config.json +55 -0
run-2/checkpoint-321/trainer_state.json +53 -0
run-2/checkpoint-321/training_args.bin +3 -0
run-2/checkpoint-321/vocab.txt +0 -0
run-2/checkpoint-428/config.json +27 -0
run-2/checkpoint-428/model.safetensors +3 -0
run-2/checkpoint-428/optimizer.pt +3 -0
run-2/checkpoint-428/rng_state.pth +3 -0
run-2/checkpoint-428/scheduler.pt +3 -0
run-2/checkpoint-428/special_tokens_map.json +7 -0
run-2/checkpoint-428/tokenizer.json +0 -0
run-2/checkpoint-428/tokenizer_config.json +55 -0
run-2/checkpoint-428/trainer_state.json +62 -0
run-2/checkpoint-428/training_args.bin +3 -0
run-2/checkpoint-428/vocab.txt +0 -0
run-3/checkpoint-214/config.json +27 -0
run-3/checkpoint-214/model.safetensors +3 -0
run-3/checkpoint-214/optimizer.pt +3 -0
run-3/checkpoint-214/rng_state.pth +3 -0
run-3/checkpoint-214/scheduler.pt +3 -0
run-3/checkpoint-214/special_tokens_map.json +7 -0
run-3/checkpoint-214/tokenizer.json +0 -0
run-3/checkpoint-214/tokenizer_config.json +55 -0
run-3/checkpoint-214/trainer_state.json +35 -0
run-3/checkpoint-214/training_args.bin +3 -0
run-3/checkpoint-214/vocab.txt +0 -0
runs/Mar05_10-24-08_9438d4a8c697/events.out.tfevents.1709634907.9438d4a8c697.136.5 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5a665e4ec62c4a1a85617391304e2b18c1218f3293cbb0be6b3625b6c66ea861
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:b328223d425c865b569bfa1d26b8ec60c1bc7ae16bac67524f24a139e0718d1c
 size 437958648

run-2/checkpoint-214/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-2/checkpoint-214/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1017fce726cfa8085fe3e60537af442f8db7529def954d978ceeba6615544f54
+size 437958648

run-2/checkpoint-214/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de26c875a5bcc9da1b7f14db32d7449482e101c4fda257fce3dd38eb3164c86b
+size 876038394

run-2/checkpoint-214/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77748b6f1b3eccfb435d63cdcd80181a0d27c94ffc0f260c5b7020a5afb45e23
+size 14244

run-2/checkpoint-214/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:561c657ffbc39fe06739d978530c9444eca9f8f4d1d833b27f9f12450eb9149c
+size 1064

run-2/checkpoint-214/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-214/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-214/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-214/trainer_state.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "best_metric": 0.7612655800575263,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-2/checkpoint-214",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 214,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.700862895493768,
+      "eval_loss": 0.5816558003425598,
+      "eval_runtime": 1.421,
+      "eval_samples_per_second": 734.006,
+      "eval_steps_per_second": 46.447,
+      "step": 107
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7612655800575263,
+      "eval_loss": 0.5154774188995361,
+      "eval_runtime": 1.5047,
+      "eval_samples_per_second": 693.155,
+      "eval_steps_per_second": 43.862,
+      "step": 214
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 428,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 5.0807318529347555e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 8,
+    "seed": 2
+  }
+}

run-2/checkpoint-214/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25e7ad3ec16050e4bad4100c8ed6a17a2b398a36a7cf0f46e86c9cbeacafba3e
+size 4920

run-2/checkpoint-214/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-321/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-2/checkpoint-321/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d940279fe4493d41899b82f80c60d82df4dfbba1905930d27ba8e20d5f86b8d4
+size 437958648

run-2/checkpoint-321/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:47354b19f1b78e6ce9795597636341199eab3bc7d29e23f46843d9988f853636
+size 876038394

run-2/checkpoint-321/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83cba8689ff40f4578ae69df4981a70c82e50d83ab71ae702e8129ed7d00b905
+size 14244

run-2/checkpoint-321/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb1deac37d6c27926b534678f46a055759999ed70bcd72f6e31f03246324dd09
+size 1064

run-2/checkpoint-321/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-321/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-321/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-321/trainer_state.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "best_metric": 0.7794822627037392,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-2/checkpoint-321",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 321,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.700862895493768,
+      "eval_loss": 0.5816558003425598,
+      "eval_runtime": 1.421,
+      "eval_samples_per_second": 734.006,
+      "eval_steps_per_second": 46.447,
+      "step": 107
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7612655800575263,
+      "eval_loss": 0.5154774188995361,
+      "eval_runtime": 1.5047,
+      "eval_samples_per_second": 693.155,
+      "eval_steps_per_second": 43.862,
+      "step": 214
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7794822627037392,
+      "eval_loss": 0.8429356813430786,
+      "eval_runtime": 1.4562,
+      "eval_samples_per_second": 716.227,
+      "eval_steps_per_second": 45.322,
+      "step": 321
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 428,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 5.0807318529347555e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 8,
+    "seed": 2
+  }
+}

run-2/checkpoint-321/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25e7ad3ec16050e4bad4100c8ed6a17a2b398a36a7cf0f46e86c9cbeacafba3e
+size 4920

run-2/checkpoint-321/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-428/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-2/checkpoint-428/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4c51cc64702b7c88b843307c53363d88e72b72df9b8c6555addaaf8e34254e6
+size 437958648

run-2/checkpoint-428/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb10e718bb459b09c04ab381faa15b100cf134fa86038414478a9aa0db0ea888
+size 876038394

run-2/checkpoint-428/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76157c635a654913bb8b2312877cff71e5cf0cd0aef75674ac77e2905c3ee13d
+size 14244

run-2/checkpoint-428/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77863e4e9aeff5a0c26ba1cc3559fb66503d3497edee0570bd9577878deaf409
+size 1064

run-2/checkpoint-428/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-428/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-428/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-2/checkpoint-428/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_metric": 0.7794822627037392,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-2/checkpoint-321",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 428,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.700862895493768,
+      "eval_loss": 0.5816558003425598,
+      "eval_runtime": 1.421,
+      "eval_samples_per_second": 734.006,
+      "eval_steps_per_second": 46.447,
+      "step": 107
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7612655800575263,
+      "eval_loss": 0.5154774188995361,
+      "eval_runtime": 1.5047,
+      "eval_samples_per_second": 693.155,
+      "eval_steps_per_second": 43.862,
+      "step": 214
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7794822627037392,
+      "eval_loss": 0.8429356813430786,
+      "eval_runtime": 1.4562,
+      "eval_samples_per_second": 716.227,
+      "eval_steps_per_second": 45.322,
+      "step": 321
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7612655800575263,
+      "eval_loss": 1.1694544553756714,
+      "eval_runtime": 2.1324,
+      "eval_samples_per_second": 489.123,
+      "eval_steps_per_second": 30.951,
+      "step": 428
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 428,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 5.0807318529347555e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 8,
+    "seed": 2
+  }
+}

run-2/checkpoint-428/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25e7ad3ec16050e4bad4100c8ed6a17a2b398a36a7cf0f46e86c9cbeacafba3e
+size 4920

run-2/checkpoint-428/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-3/checkpoint-214/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-3/checkpoint-214/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b328223d425c865b569bfa1d26b8ec60c1bc7ae16bac67524f24a139e0718d1c
+size 437958648

run-3/checkpoint-214/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4f5d805d54feb06a33bb1e909ae3d90277eb28697834e87de1d82b87ca2cb11
+size 876038394

run-3/checkpoint-214/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9a8f02154342cda1a052d976b5c2345f8a3f0d23c6a33130ccebb04c06a9f61
+size 14244

run-3/checkpoint-214/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d363b5a6ddb014a5e68a20e40117d7636630bcc000dda490ac089aafc494308
+size 1064

run-3/checkpoint-214/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-3/checkpoint-214/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-3/checkpoint-214/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-3/checkpoint-214/trainer_state.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "best_metric": 0.7555129434324065,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-qnli/run-3/checkpoint-214",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 214,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7555129434324065,
+      "eval_loss": 0.5231865048408508,
+      "eval_runtime": 1.3423,
+      "eval_samples_per_second": 777.045,
+      "eval_steps_per_second": 49.171,
+      "step": 214
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 642,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.566539883705796e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 4,
+    "seed": 6
+  }
+}

run-3/checkpoint-214/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:631285d14f4ae620047bafff08f2bb06c8f29a9ee83ee1ea8b05b4cd8c97468d
+size 4920

run-3/checkpoint-214/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Mar05_10-24-08_9438d4a8c697/events.out.tfevents.1709634907.9438d4a8c697.136.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c6debafa925e48dfd3d8998050b9e4f4838fe3082416479f26d8d9d727cf89e
+size 4945

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25e7ad3ec16050e4bad4100c8ed6a17a2b398a36a7cf0f46e86c9cbeacafba3e
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:631285d14f4ae620047bafff08f2bb06c8f29a9ee83ee1ea8b05b4cd8c97468d
 size 4920