CATIE
AI & ML interests
Create NLP models and datasets applied to French, to very long sequences and the combination of the two ;)
Recent Activity
 
🇫🇷
    Le CATIE est une association à but non lucratif dont l'objectif est d'accompagner les PME et ETI dans leur transformation numérique.
    Depuis l'été 2023, notre équipe Data Science développe des jeux de données et des modèles en français.
    Il ne s'agit pas de notre activité principale donc nous pouvons y consacrer que des moyens limités (~1,5 ETP/an ; nous n'avons pas d'équipe de R&D dédiée ; maintenance et résolution d'issues soumises à notre bande passante, etc.).
    Ci-dessous l'historique des mises en ligne des travaux que nous avons été autorisés à mettre en open source (vous pouvez cliquer sur chaque élément !)
    
🇬🇧
      CATIE is a non-profit association dedicated to supporting and assisting SMEs and ETIs in their digital transformation.
      Since summer 2023, our Data Science team has been developing datasets and models in French.
      This is not our core activity, so we can only devote limited resources to it (~1.5 FTE/year; we don't have a R&D team dedicated; maintenance and resolution of issues subject to our bandwidth, etc.).
      Below is a timeline of the releases of the work we've been authorized to open source (you can click on each item!).
    
    Notre contenu a été téléchargé plus de 450 000 fois depuis que nous mettons des choses en open-source. Merci à vous 🤗
    Si vous souhaitez en savoir plus, vous pouvez également consulter notre GitHub ⭐ ou notre  blog technique 📚.
    
    Our content has been downloaded more than 450,000 times since we started putting things open-source. Thank you 🤗
   If you'd like to find out more, you can also visit our GitHub ⭐ or technical blog 📚.
    
- 
	
	
	  CATIE-AQ/CSR_Sparse_Encoder_camembert-large_STSFeature Extraction • 0.3B • Updated • 5 • 2
- 
	
	
	  CATIE-AQ/SPLADE_camembert-base_STSFeature Extraction • 0.1B • Updated • 31 • 2
- 
	
	
	  CATIE-AQ/SPLADE_moderncamembert-cv2_STSFeature Extraction • 0.1B • Updated • 7 • 2
- 
	
	
	  CATIE-AQ/SPLADE_camemberta2.0_STSFeature Extraction • 0.1B • Updated • 8 • 2
- 
	
	
	  CATIE-AQ/CSR_Sparse_Encoder_camembert-large_STSFeature Extraction • 0.3B • Updated • 5 • 2
- 
	
	
	  CATIE-AQ/SPLADE_camembert-base_STSFeature Extraction • 0.1B • Updated • 31 • 2
- 
	
	
	  CATIE-AQ/SPLADE_moderncamembert-cv2_STSFeature Extraction • 0.1B • Updated • 7 • 2
- 
	
	
	  CATIE-AQ/SPLADE_camemberta2.0_STSFeature Extraction • 0.1B • Updated • 8 • 2
			spaces
			8
		
			
	
	
	
	
	Guide sur l'évaluation des LLM
Traduction du guide de Clémentine Fourrier
FAT5 (Flash Attention T5) report
English version of the blog post introducing FAT5 model
Quantized Retrieval Fr
Requêter des millions de textes efficacement
NERmembert
Find named entities in French texts using NERmemBERT models
QAmembert
Find answers in French texts using QAmemBERT models
			models
			33
		
			
	
	
	
	
	 
				CATIE-AQ/LMF2-700M_french_summary
 
				CATIE-AQ/LMF2_350M_french_summary
 
				CATIE-AQ/LMF2-1.2B_french_summary
 
				CATIE-AQ/mistral7B-FR-InstructNLP-LoRA
 
				CATIE-AQ/Idefics3_FT_fr
 
				CATIE-AQ/LFM2-1.2B_french_dpo
 
				CATIE-AQ/SPLADE_EuroBERT-210m_STS
 
				CATIE-AQ/CSR_Sparse_Encoder_camembert-large_STS
 
				CATIE-AQ/SPLADE_moderncamembert-cv2_STS
