Digital

Meta Llama 4: Open-Source-KI schlägt proprietäre Modelle

Wie Metas kostenfreies Modell die KI-Demokratisierung beschleunigt

Von Markus Bauer 8 Min. Lesezeit Aktualisiert: 08.05.2026
Meta Llama 4: Open-Source-KI schlägt proprietäre Modelle
Das Wichtigste in Kürze
  • Meta hat mit Llama 4 eine neue Generation von Sprachmodellen veröffentlicht – und die Benchmarks sorgen in der KI-Community für Aufsehen
  • In mehreren…

Rund 1,2 Milliarden Menschen nutzen weltweit Anwendungen, die auf großen Sprachmodellen basieren — doch der Zugang zu den leistungsstärksten Systemen blieb lange einer zahlungskräftigen Minderheit vorbehalten. Meta verändert diese Gleichung: Mit der vierten Generation seiner Llama-Modellreihe präsentiert der Konzern ein Open-Source-System, das in zentralen Benchmarks mit den proprietären Flaggschiffen von OpenAI und Google gleichzieht oder diese übertrifft.

Was Llama 4 wirklich kann

Meta Llama 4 ist keine inkrementelle Verbesserung, sondern ein architektonischer Neuanfang. Das Modell setzt erstmals konsequent auf eine sogenannte Mixture-of-Experts-Architektur (MoE) — ein Ansatz, bei dem nicht das gesamte neuronale Netz für jede Anfrage aktiviert wird, sondern nur spezialisierte Teilbereiche, sogenannte „Experten". Das Ergebnis: höhere Effizienz bei gleichzeitig gesteigerter Rechenleistung. Vereinfacht gesagt verhält sich das System wie ein Beratungsteam, das je nach Aufgabe den passenden Spezialisten einbezieht, statt immer alle gleichzeitig sprechen zu lassen.

Die Modellreihe umfasst mehrere Varianten. Das kompakte Llama 4 Scout ist darauf ausgelegt, auf einzelnen Grafikprozessoren — also auch auf Consumer-Hardware — zu laufen. Llama 4 Maverick richtet sich an Entwickler mit mittlerem Ressourcenbudget. Die leistungsstärkste Variante, Llama 4 Behemoth, befindet sich noch in der Trainingsphase und soll laut Meta in frühen internen Evaluierungen sowohl GPT-4o als auch Gemini Ultra in mehreren Disziplinen übertreffen. Unabhängige Nachprüfungen dieser Angabe stehen noch aus.

Kerndaten: Meta Llama 4 basiert auf einer Mixture-of-Experts-Architektur mit bis zu 17 Milliarden aktiven Parametern pro Vorwärtsdurchlauf bei Scout; Maverick nutzt 128 Experten-Gruppen. Das Kontextfenster — also die Menge an Text, die das Modell gleichzeitig verarbeiten kann — beträgt bis zu 10 Millionen Token bei Scout, was etwa 7,5 Millionen Wörtern entspricht. Zum Vergleich: GPT-4o verarbeitet maximal 128.000 Token. Die Modelle sind unter der Llama-4-Community-Lizenz verfügbar, die kommerzielle Nutzung erlaubt, jedoch bestimmte Einschränkungen bei sehr großen Plattformen vorsieht. Training erfolgte multimodal: Text, Bild und Video wurden gemeinsam verarbeitet.

Der Benchmark-Vergleich: Was die Zahlen bedeuten

Benchmarks sind das Standardwerkzeug zur Einordnung von KI-Modellen — und gleichzeitig ihr umstrittenster Aspekt. Sie messen spezifische Fähigkeiten unter kontrollierten Bedingungen, bilden aber nicht zwingend die Alltagsperformance ab. Mit diesem Vorbehalt sind die vorliegenden Ergebnisse dennoch bemerkenswert.

📩
Immer informiert bleibenDie wichtigsten Nachrichten, wenn sie erscheinen.
Newsletter holen
Modell Anbieter Typ Kontextfenster MMLU (Wissen) HumanEval (Code) Mehrsprachigkeit Kosten (API)
Llama 4 Maverick Meta Open Source 1 Mio. Token ~85 % ~73 % Gut (12+ Sprachen) Kostenlos (Self-Hosting)
GPT-4o OpenAI Proprietär 128.000 Token ~88 % ~90 % Sehr gut ca. 5 USD / 1M Token
Gemini 1.5 Pro Google Proprietär 1 Mio. Token ~83 % ~71 % Sehr gut ca. 3,50 USD / 1M Token
Claude 3.5 Sonnet Anthropic Proprietär 200.000 Token ~88 % ~93 % Gut ca. 3 USD / 1M Token
Mistral Large 2 Mistral AI Teilweise offen 128.000 Token ~84 % ~92 % Sehr gut (EU-fokussiert) ca. 2 USD / 1M Token
Llama 4 Scout Meta Open Source 10 Mio. Token ~80 % ~68 % Gut Kostenlos (Self-Hosting)

Die Tabelle verdeutlicht: Llama 4 Maverick positioniert sich im Mittelfeld der leistungsstärksten Systeme — zu null Lizenzkosten für Entwickler, die das Modell selbst betreiben. Beim Codeverständnis, wo Claude und Mistral Large vorne liegen, besteht noch Abstand. Beim Kontextfenster — also der Fähigkeit, sehr lange Texte, Dokumente oder Gesprächsverläufe zu verarbeiten — setzt Scout einen neuen Maßstab, der alle proprietären Alternativen in den Schatten stellt.

Wer sich für den Vergleich mit Googles Angebot interessiert, findet eine ausführliche Einordnung im Artikel zu Gemini Advanced und Googles KI-Strategie. Zur Leistungsfähigkeit schlussfolgernder Modelle liefert der Bericht über OpenAI o3 als Reasoning-Modell für komplexe Mathematikprobleme wichtige Vergleichspunkte.

Open Source in der KI: Mehr als ein Lizenzmodell

Was „offen" wirklich bedeutet

Der Begriff „Open Source" ist im KI-Kontext nicht so klar definiert wie in der klassischen Softwareentwicklung. Bei Llama 4 stellt Meta die Modellgewichte — also die trainierten Parameter, die das Verhalten des Systems bestimmen — sowie den Quellcode zur Verfügung. Die Trainingsdaten selbst bleiben jedoch nicht vollständig offengelegt. Kritiker sprechen daher von „Open Weights" statt echtem Open Source. Der praktische Unterschied für Unternehmen ist jedoch begrenzt: Wer das Modell auf eigener Infrastruktur betreiben, anpassen und ohne Drittanbieter-Abhängigkeit einsetzen möchte, kann das mit Llama 4 tun — mit GPT-4o oder Claude nicht.

Die Bedeutung dieser Unterscheidung wird klarer, wenn man Datenschutz und Unternehmenskontrolle berücksichtigt. Ein Krankenhaus, das Patientendaten verarbeitet, oder eine Anwaltskanzlei mit Mandatsgeheimnissen kann ein lokal betriebenes Llama-4-Modell einsetzen, ohne Anfragen an externe Server zu senden. Das ist mit proprietären Cloud-Diensten strukturell nicht möglich — unabhängig von vertraglichen Zusicherungen.

Laut einer Erhebung von Bitkom gaben in einer aktuellen Befragung deutscher Unternehmen rund 68 Prozent der Befragten an, Datenschutz und digitale Souveränität seien die wichtigsten Kriterien bei der Wahl von KI-Systemen. (Quelle: Bitkom) Das positioniert Open-Weights-Modelle wie Llama 4 als strukturellen Vorteil, nicht nur als Kostenfaktor.

Einen umfassenderen Überblick über die rechtlichen und gesellschaftlichen Dimensionen quelloffener KI-Modelle bietet der Hintergrundartikel zu Open-Source-KI, Llama, Mistral und dem Spannungsfeld zwischen Offenheit und Regulierung.

Die Mehrsprachigkeit als unterschätzter Faktor

Ein Bereich, in dem Llama 4 gegenüber seinen Vorgängern erheblich aufgeholt hat, ist die Verarbeitung nicht-englischer Sprachen. Meta gibt an, Deutsch, Französisch, Spanisch, Hindi, Arabisch und mehrere weitere Sprachen mit deutlich mehr Trainingsdaten versorgt zu haben als bei Llama 3. Die Qualität deutschsprachiger Ausgaben hat sich messbar verbessert — bleibt aber, wie bei den meisten Modellen, hinter der englischen Leistung zurück.

Das ist kein trivialer Kritikpunkt. Wer KI in deutschsprachigen Arbeitsumgebungen einsetzen möchte, steht vor einer Herausforderung, die die gesamte Branche betrifft. Warum das Training mehrsprachiger Systeme technisch so aufwendig ist und welche Fortschritte es gibt, erklärt der Artikel zur Mehrsprachigkeit in KI-Systemen und den besonderen Hürden bei der deutschen Sprache.

meta, llama, open
Bildmaterial: ZenNews24 Mediathek

Marktdynamik: Was Llama 4 für das KI-Ökosystem bedeutet

Analysehäuser beobachten die Verschiebung im Markt mit wachsender Aufmerksamkeit. Laut Gartner wird der Anteil von Open-Source- beziehungsweise Open-Weights-Modellen am gesamten KI-Deployment-Markt in Unternehmen bis Ende dieses Jahres auf über 30 Prozent anwachsen — gegenüber weniger als 10 Prozent vor zwei Jahren. (Quelle: Gartner) IDC schätzt, dass Unternehmen weltweit allein durch den Einsatz kostenfreier Basismodelle jährlich Lizenzkosten im zweistelligen Milliardenbereich einsparen könnten — sofern sie bereit sind, Infrastruktur und Expertise selbst aufzubauen. (Quelle: IDC)

Statista-Daten zeigen, dass das Marktvolumen für KI-Infrastruktur derzeit mit einer jährlichen Rate von über 25 Prozent wächst — ein Wachstum, das durch die sinkenden Einstiegshürden bei Basismodellen mitbefeuert wird. (Quelle: Statista) Mit anderen Worten: Weil das Modell selbst kostenlos ist, verschiebt sich das Investitionsvolumen in Richtung Hardware, Feinabstimmung und Integration — Bereiche, in denen auch kleine Unternehmen mitkonkurrieren können.

Für die großen proprietären Anbieter bedeutet das einen Preisdruck, dem sie bereits mit Preissenkungen reagiert haben. OpenAI halbierte die API-Kosten für GPT-4o im vergangenen Jahr mehrfach. Google bietet Gemini-Modelle in abgespeckten Versionen kostenlos an. Die Logik ist eindeutig: Wenn das kostenfreie Open-Source-Modell gut genug ist, müssen die kostenpflichtigen Alternativen deutlich besser sein — oder deutlich günstiger werden.

Integration und Ökosystem: Wo Llama 4 bereits läuft

Meta hat bei der Markteinführung von Llama 4 gezielt auf Plattformintegration gesetzt. Das Modell ist über Meta AI direkt verfügbar — in WhatsApp, Instagram, Facebook und dem Meta AI Web-Interface. Parallel dazu stellen Cloud-Anbieter wie Amazon Web Services, Microsoft Azure und Google Cloud das Modell über ihre Marktplätze bereit, sodass Entwickler es ohne eigene Serverinfrastruktur nutzen können.

Besonders relevant ist die zunehmende Integration von KI-Modellen in mobile Betriebssysteme. Dass Plattformhersteller ihre Systeme für externe Modellanbieter öffnen, ist ein Trend, der weit über Meta hinausgeht. Wie Apple mit iOS 27 mehrere KI-Modelle von Drittanbietern in sein Betriebssystem integriert, zeigt die Richtung: Nutzer sollen künftig wählen können, welches Modell ihre Geräte im Hintergrund antreibt. Die Details zu dieser Öffnung für externe Anbieter beleuchtet auch der Artikel darüber, wie Apple iOS 27 für externe KI-Modelle öffnet und welche Konsequenzen das für Entwickler hat.

In der Praxis bedeutet das: Llama 4 könnte bald nicht nur auf Entwickler-Servern laufen, sondern direkt auf Smartphones und in Consumer-Apps — ohne dass Nutzer davon wissen oder es aktiv auswählen müssen.

Kritische Einordnung: Was Llama 4 nicht ist

Bei aller Leistungsfähigkeit sind einige Einschränkungen wichtig. Erstens: Der Betrieb leistungsfähiger Modelle wie Maverick oder Behemoth erfordert erhebliche Rechenressourcen. Während Scout auf einer einzelnen Grafikkarte der gehobenen Consumer-Klasse läuft, benötigt Maverick mindestens mehrere hochwertige Server-GPUs — was für Kleinstunternehmen oder Einzelentwickler eine reale Hürde darstellt.

Zweitens unterliegt die Llama-4-Lizenz Einschränkungen für Dienste mit mehr als 700 Millionen monatlichen Nutzern. Große Plattformkonzerne können das Modell also nicht uneingeschränkt einsetzen, ohne mit Meta zu verhandeln. Das begrenzt den Grad tatsächlicher Offenheit auf einen bestimmten Nutzerkreis.

Drittens sind Sicherheit und Bias — also die systematische Bevorzugung oder Benachteiligung bestimmter Gruppen oder Perspektiven — bei allen Sprachmodellen offene Fragen. Meta veröffentlicht Responsible-Use-Guides, doch unabhängige Sicherheitsevaluierungen durch externe Forschende dauern nach Modellveröffentlichungen stets Wochen bis Monate. Die aktuell vorliegenden Sicherheitsdaten stammen überwiegend von Meta selbst.

Schließlich gilt: Open Source bedeutet nicht automatisch Qualitätssicherung. Wer Llama 4 in sensiblen Anwendungen einsetzen möchte, trägt die Verantwortung für Feinabstimmung, Sicherheitstests und regulatorische Compliance selbst — ohne den vertraglichen Rückhalt, den kommerzielle Anbieter bieten.

Fazit: Eine Verschiebung, keine Revolution

Meta Llama 4 verändert die Machtverhältnisse im KI-Markt spürbar, ohne sie zu kippen. Die Demokratisierungsthese — leistungsfähige KI für alle — stimmt in ihrer Grundrichtung, aber nicht in ihrer Absolutheit. Wer die nötige Infrastruktur und das technische Know-how mitbringt, hat nun Zugang zu einem Modell auf Augenhöhe mit den teuren proprietären Alternativen. Wer das nicht hat, ist weiterhin auf Managed Services angewiesen — nur dass diese jetzt preislich unter Druck stehen.

Für den Markt insgesamt ist das eine gesunde Entwicklung. Preisdruck belebt den Wettbewerb, sinkende Kosten erweitern den Zugang, und die Verfügbarkeit quelloffener Systeme stärkt die Möglichkeit zu unabhängiger Forschung und regulatorischer Kontrolle. Ob diese Offenheit langfristig anhält oder ob Lizenzmodelle zunehmend restriktiver werden, bleibt eine entscheidende Frage — für Entwickler, Unternehmen und Regulierer gleichermaßen.

Mehr zum Thema
Wie findest du das?
M
Markus Bauer
Technologie & Digitales

Markus Bauer verfolgt die Entwicklungen in Tech, KI und Digitalpolitik. Er analysiert, wie neue Technologien Gesellschaft und Wirtschaft verändern — von Datenschutz bis Plattformregulierung.

Themen: Künstliche Intelligenz Künstliche Intelligenz Parteien Fußball ChatGPT Innenpolitik Bundesliga USA CDU Bilanz Bayern Unternehmen Kosten Bundesregierung Ukraine Koalition SPD Druck Milliarden Rekord Boom Russland & Ukraine Prozent Russland