Meta Llama 4: Open-Source-KI schlägt proprietäre Modelle
Wie Metas kostenfreies Modell die KI-Demokratisierung beschleunigt
Meta hat mit Llama 4 eine neue Generation von Sprachmodellen veröffentlicht – und die Benchmarks sorgen in der KI-Community für Aufsehen. In mehreren standardisierten Tests schneidet das Modell besser ab als ältere Versionen proprietärer Konkurrenten. Doch die eigentliche Bedeutung dieser Veröffentlichung liegt nicht allein in den Leistungsdaten: Es geht um Kontrolle, Kosten und die Frage, wer die KI-Infrastruktur der Zukunft bestimmt.
- Meta Llama 4 ist in mehreren Varianten verfügbar, darunter Llama 4 Scout (17B aktive Parameter, Mixture-of-Experts-Architektur) und Llama 4 Maverick (17B aktive Parameter, größeres MoE-Ensemble)
- MMLU-Benchmark: Llama 4 Maverick erreicht laut Meta-Angaben rund 85–87 Prozent – vergleichbar mit GPT-4o und Claude 3.5 Sonnet, nicht signifikant darüber
- Llama 4 ist unter einer kommerziellen Lizenz verfügbar, die Einschränkungen für Dienste mit mehr als 700 Millionen Nutzern enthält
- Trainingsgrundlage: mehr als 30 Billionen Token, multimodale Eingaben (Text und Bild)
Was ist Meta Llama 4 – und warum ist die Veröffentlichung strategisch bedeutsam?
Meta Llama 4 ist ein großes Sprachmodell (Large Language Model, kurz LLM), das auf einer sogenannten Mixture-of-Experts-Architektur (MoE) basiert. Anders als dichte Modelle, bei denen bei jeder Anfrage alle Parameter aktiv sind, aktiviert MoE jeweils nur einen Teil der Modellkapazität – abhängig vom Eingabeinhalt. Das senkt den Rechenaufwand pro Anfrage erheblich, ohne die Gesamtkapazität des Modells zu reduzieren.
Im Gegensatz zu geschlossenen Systemen stellt Meta Llama 4 unter einer offenen Lizenz bereit. Entwickler, Forschungsinstitute und Unternehmen können das Modell herunterladen, lokal betreiben und für eigene Zwecke anpassen. Das klingt nach einer technischen Spezialität – ist aber eine strukturelle Verschiebung in der KI-Industrie. Besonders relevant ist dabei die Open-Source-KI 2026: Llama, Mistral und die Freiheit des Codes, die zeigt, wie sich das Ökosystem entwickelt.
Bislang kontrollierten wenige Konzerne den Zugang zu leistungsfähigen KI-Systemen. OpenAI mit GPT-4o, Google mit Gemini 1.5, Anthropic mit Claude 3.5 – diese Modelle sind ausschließlich über proprietäre APIs zugänglich. Die Anbieter entscheiden über Nutzungsbedingungen, Preismodelle und Datenzugriff. Metas Gegenmodell ist offensichtlich strategisch kalkuliert: Wer die KI-Infrastruktur für andere öffnet, baut ein Ökosystem auf, das langfristig die eigene Plattformrelevanz sichert – auch wenn Meta selbst kein direktes API-Geschäft mit Llama betreibt. Dies wird auch durch die US-Verlage verklagen Meta wegen Sprachmodell Llama deutlich, die zeigen, wie umstritten die Trainingsmethoden sind.
Llama 4 im Benchmark-Vergleich: Was die Zahlen wirklich aussagen
Der Originalartikel behauptete, Llama 4 erreiche auf dem MMLU-Benchmark über 92 Prozent und übertreffe GPT-4 (88 Prozent) sowie Claude (89 Prozent) deutlich. Diese Darstellung ist so nicht korrekt und bedarf einer Korrektur.
Erstens existiert „GPT-4" nicht mehr als einzelner, klar definierter Benchmark-Punkt – OpenAI hat das ursprüngliche GPT-4 durch GPT-4o und GPT-4 Turbo ersetzt, die höhere MMLU-Werte erzielen. Zweitens lagen Llama 4 Mavericks MMLU-Ergebnisse laut Metas eigenem technischen Bericht (April 2025) bei rund 85 bis 87 Prozent – vergleichbar mit aktuellen Konkurrenzmodellen, nicht signifikant darüber. Drittens sind MMLU-Vergleiche methodisch heikel: Unterschiede im Prompting-Format, der Anzahl der Few-Shot-Beispiele und der Evaluierungsinfrastruktur können Ergebnisse um mehrere Prozentpunkte verschieben, ohne dass das Modell selbst besser ist.
Hintergründe und Einordnung
| Modell | Architektur | MMLU (ca.) | Multimodal | Lizenz |
|---|---|---|---|---|
| Llama 4 Maverick | MoE, 17B aktiv | ~86 % | Ja | Offen (kommerziell, eingeschränkt) |
| Llama 4 Scout | MoE, 17B aktiv | ~83 % | Ja | Offen (kommerziell, eingeschränkt) |
| GPT-4o (OpenAI) | Transformer, dicht | ~88 % | Ja | Proprietär |
| Claude 3.5 Sonnet (Anthropic) | Transformer, dicht | ~88 % | Ja | Proprietär |
| Gemini 1.5 Pro (Google) | MoE | ~85 % | Ja | Proprietär |
Was sich festhalten lässt: Llama 4 Maverick bewegt sich auf Augenhöhe mit führenden proprietären Modellen – das ist für ein frei verfügbares Modell bemerkenswert. Die Integration in verschiedene Ökosysteme zeigt sich auch darin, wie Apple öffnet iOS 27 für mehrere KI-Modelle von Drittanbietern, was bedeutet, dass solche Open-Source-Modelle zukünftig breiter genutzt werden könnten. Die Behauptung e
- Heise Online — heise.de
- c't Magazin — ct.de
- golem.de

















