nicholasKluge
/

TeenyTinyLlama-460m-Chat-awq

Text Generation

instruction tuned

text generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

nicholasKluge commited on Jan 21

Commit

5a158e8

•

1 Parent(s): 91f1762

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -46,6 +46,7 @@ co2_eq_emissions:
 # TeenyTinyLlama-460m-Chat-awq
 **Note: This model is a quantized version of [TeenyTinyLlama-460m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-460m). Quantization was performed using [AutoAWQ](https://github.com/casper-hansen/AutoAWQ), allowing this version to be 80% lighter, 20% faster, and with almost no performance loss. A GPU is required to run the AWQ-quantized models.**
 TeenyTinyLlama is a pair of small foundational models trained in Brazilian Portuguese.
 This repository contains a version of [TeenyTinyLlama-460m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-460m) (`TeenyTinyLlama-460m-Chat`) fine-tuned on the [Instruct-Aira Dataset version 2.0](https://huggingface.co/datasets/nicholasKluge/instruct-aira-dataset-v2).
@@ -56,6 +57,7 @@ This repository contains a version of [TeenyTinyLlama-460m](https://huggingface.
 - **Batch size:** 4
 - **Optimizer:** `torch.optim.AdamW` (warmup_steps = 1e3, learning_rate = 1e-5, epsilon = 1e-8)
 - **GPU:** 1 NVIDIA A100-SXM4-40GB
 - **Quantization Configuration:**
   - `bits`: 4
   - `group_size`: 128

 # TeenyTinyLlama-460m-Chat-awq
 **Note: This model is a quantized version of [TeenyTinyLlama-460m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-460m). Quantization was performed using [AutoAWQ](https://github.com/casper-hansen/AutoAWQ), allowing this version to be 80% lighter, 20% faster, and with almost no performance loss. A GPU is required to run the AWQ-quantized models.**
 TeenyTinyLlama is a pair of small foundational models trained in Brazilian Portuguese.
 This repository contains a version of [TeenyTinyLlama-460m](https://huggingface.co/nicholasKluge/TeenyTinyLlama-460m) (`TeenyTinyLlama-460m-Chat`) fine-tuned on the [Instruct-Aira Dataset version 2.0](https://huggingface.co/datasets/nicholasKluge/instruct-aira-dataset-v2).
 - **Batch size:** 4
 - **Optimizer:** `torch.optim.AdamW` (warmup_steps = 1e3, learning_rate = 1e-5, epsilon = 1e-8)
 - **GPU:** 1 NVIDIA A100-SXM4-40GB
+- **Carbon emissions** stats are logged in this [file](emissions.csv).
 - **Quantization Configuration:**
   - `bits`: 4
   - `group_size`: 128