L

Llama

La famille de modèles open-source de Meta AI : Llama 4 multimodal, gratuit, déployable en self-hosted.

Facilité d'utilisation

Llama est la famille de modèles de langue open-source de Meta AI, devenue en 2026 la fondation de la majorité des écosystèmes IA open-source (Hugging Face, Together, Groq, Cerebras). Les modèles sont téléchargeables gratuitement sous une licence permettant un usage commercial jusqu'à 700M MAU.

La gamme Llama 4 (sortie début 2026) couvre Scout (rapide, 17B actifs), Maverick (400B paramètres, multimodal) et Behemoth (2T paramètres en preview). Tous les modèles supportent nativement le multimodal (texte + image) et un contexte de 10M tokens.

Llama est utilisé en mode self-hosted (Ollama, vLLM) pour la souveraineté des données, ou via des hébergeurs Groq/Together pour une inférence ultra-rapide (1000+ tokens/s).

Fonctionnalités

Fonctionnalités clés

  • Open weights sous licence Meta : usage commercial OK.
  • Multi-tailles : 8B (laptop), 70B (workstation), 405B (cluster).
  • Multimodal natif (Llama 4) : texte + image.
  • 10M tokens de contexte sur les modèles 4.x.
  • Self-hosting facile via Ollama, vLLM, llama.cpp.
  • Hébergeurs ultra-rapides : Groq, Cerebras, Together.
Visiter le site

Tarification

Plan basique0/mois

Plateformes

apiopen-source

Réseaux sociaux