mgoin
/

Minitron-8B-Base-FP8

Text Generation

Inference Endpoints

Model card Files Files and versions Community

mgoin commited on Jul 26

Commit

460b635

•

1 Parent(s): 4851278

Update README.md

Files changed (1) hide show

README.md +11 -0

README.md CHANGED Viewed

@@ -1,9 +1,20 @@
 ---
 tags:
 - fp8
 - vllm
 ---
 This quantized model:
 ```
 lm_eval --model vllm --model_args pretrained=Minitron-8B-Base-FP8 --tasks gsm8k --num_fewshot 5 --batch_size auto

 ---
+license: other
+license_name: nvidia-open-model-license
+license_link: >-
+  https://developer.download.nvidia.com/licenses/nvidia-open-model-license-agreement-june-2024.pdf
 tags:
 - fp8
 - vllm
+base_model: nvidia/Minitron-8B-Base
 ---
+# Minitron-8B-Base-FP8
+FP8 quantized checkpoint of [nvidia/Minitron-8B-Base](https://huggingface.co/nvidia/Minitron-4B-Base) for use with vLLM.
+## Evaluations
 This quantized model:
 ```
 lm_eval --model vllm --model_args pretrained=Minitron-8B-Base-FP8 --tasks gsm8k --num_fewshot 5 --batch_size auto