FastVLM - a apple Collection

apple 's Collections

Core ML Gallery Models

OpenELM Instruct Models

OpenELM Pretrained Models

MobileCLIP Models + DataCompDR Data

DepthPro Models

Core ML Stable Diffusion

Core ML FastViT

Core ML Depth Anything

DFN Models + Data

Core ML Segment Anything 2

FastVLM

updated Sep 2, 2025

Efficient Vision Encoding for Vision Language Models

FastVLM: Efficient Vision Encoding for Vision Language Models

Paper • 2412.13303 • Published Dec 17, 2024 • 75
Running

Featured

436

FastVLM WebGPU

🍎

436

Real-time video captioning powered by FastVLM
apple/FastVLM-0.5B

Text Generation • 0.8B • Updated Sep 3, 2025 • 14.4k • 382
apple/FastVLM-1.5B

Text Generation • 2B • Updated Sep 3, 2025 • 2.24k • 76
apple/FastVLM-7B

Text Generation • 8B • Updated Sep 3, 2025 • 1.45k • 266
apple/FastVLM-0.5B-fp16

0.6B • Updated Sep 3, 2025 • 224 • 23

Note MLX checkpoint
apple/FastVLM-1.5B-int8

0.5B • Updated Sep 3, 2025 • 232 • 17

Note MLX checkpoint
apple/FastVLM-7B-int4

1B • Updated Sep 3, 2025 • 73 • 27

Note MLX checkpoint