AnyModal

community

https://www.reddit.com/r/AnyModal/

AI & ML interests

Multimodal LLMs for all! AnyModal is a modular and extensible framework for integrating diverse input modalities (e.g., images, audio) into large language models (LLMs). It enables seamless tokenization, encoding, and language generation using pre-trained models for various modalities.

models 1

AnyModal/VLM_Cartoon_Caption

Updated 1 day ago

datasets

None public yet

AI & ML interests

Team members 1

models 1

datasets