Recherche Publié le 26/02/2024

Un modèle de langage (LLM : Large Language Model) a été développé par le laboratoire MICS et Illuin Technology. Nommé "Croissant LLM", ce modèle a pour principales caractéristiques :

  • Souverain : entraîné sur le calculateur Jean Zay avec des données ouvertes
  • Responsable : données entièrement sourcées pour une transparence totale
  • Ethique : conformité avancée avec les régulations de l’AI Act
  • Frugalité et vitesse : il fonctionne sur CPU et téléphone car très compact
  • Benchmark : ressort comme le modèle francophone le plus performant pour sa taille
  • Utilisation commerciale : possible à la fois pour les données et le modèle
  • Intègre les spécificités culturelles françaises pour un modèle enrichi

 
Cette innovation est portée par les professeurs Pierre Colombo et Céline Hudelot dans le cadre des travaux de thèse de Manuel Faysse, en collaboration avec Nuno Miguel Guerreiro et Patrick Fernandes.
 
Ce travail est le fruit d'une collaboration étroite entre académie et industrie, illustrant l'importance de la synergie dans l'avancée de la recherche en IA.

CroissantLLM résulte en effet d’une association de CentraleSupélec avec plusieurs partenaires académiques de renom tels que Sorbonne Université, INESC-ID, Instituto Superior Técnico, Carnegie Mellon University et Institut DATAIA et du soutien précieux de partenaires industriels tels que ILLUIN Technology, Unbabel, Diabolocom, et EqualAI.