End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -17,6 +17,9 @@ should probably proofread and complete it, then remove this comment. -->
 # mistral-7b-llm-science-exam
 This model is a fine-tuned version of [/kaggle/input/mistral-7b/Mistral-7B-v0.1](https://huggingface.co//kaggle/input/mistral-7b/Mistral-7B-v0.1) on the llm-science-exam dataset.
 ## Model description
@@ -39,14 +42,30 @@ The following hyperparameters were used during training:
 - train_batch_size: 2
 - eval_batch_size: 2
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- lr_scheduler_warmup_steps: 25
 - num_epochs: 1
 ### Framework versions
 - Transformers 4.34.0.dev0
 - Pytorch 2.0.0
-- Datasets 2.1.0
 - Tokenizers 0.14.0

 # mistral-7b-llm-science-exam
 This model is a fine-tuned version of [/kaggle/input/mistral-7b/Mistral-7B-v0.1](https://huggingface.co//kaggle/input/mistral-7b/Mistral-7B-v0.1) on the llm-science-exam dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.3951
+- Map@3: 0.8976
 ## Model description
 - train_batch_size: 2
 - eval_batch_size: 2
 - seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- lr_scheduler_warmup_steps: 50
 - num_epochs: 1
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Map@3  |
+|:-------------:|:-----:|:----:|:---------------:|:------:|
+| 3.3769        | 0.11  | 50   | 1.8621          | 0.9238 |
+| 1.5772        | 0.23  | 100  | 0.5619          | 0.9119 |
+| 0.9202        | 0.34  | 150  | 0.3942          | 0.9095 |
+| 0.9485        | 0.45  | 200  | 0.4117          | 0.8976 |
+| 0.9698        | 0.56  | 250  | 0.4145          | 0.9048 |
+| 0.8731        | 0.68  | 300  | 0.4054          | 0.9048 |
+| 0.8929        | 0.79  | 350  | 0.3967          | 0.8976 |
+| 0.9737        | 0.9   | 400  | 0.3951          | 0.8976 |
 ### Framework versions
 - Transformers 4.34.0.dev0
 - Pytorch 2.0.0
+- Datasets 2.14.4
 - Tokenizers 0.14.0

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c3d39294b67223d564271ed55404c99e10246224a561fabb38ec9b818b7ebf49
 size 109097933

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d86ce6f9f84cb26a1333f2846a479131f01f28104293d0fe5b57b944a02addb
 size 109097933

tokenizer.json CHANGED Viewed

@@ -1,14 +1,7 @@
 {
   "version": "1.0",
   "truncation": null,
-  "padding": {
-    "strategy": "BatchLongest",
-    "direction": "Left",
-    "pad_to_multiple_of": null,
-    "pad_id": 2,
-    "pad_type_id": 0,
-    "pad_token": "</s>"
-  },
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
   "truncation": null,
+  "padding": null,
   "added_tokens": [
     {
       "id": 0,

train_with_llm_answers.csv CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8957f73c3ccd9a89bc0397df00a27e0ec2e91861139fda13bd63095b59264be
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:8edb6de5035d85d5594bfc396384890041683eb5dd7618eacf9061692226bffb
 size 4091